一份完整的建模文档需涵盖的模块与指标
作者:互联网
一份完整的模型开发文档应该包括的内容应该包括标准的模型开发框架、开发流程等,除此之外,还需考虑的内容还有哪些?
今天文章会跟大家介绍建模前的一些分析前奏,包括数据分析阶段以及风险点等,也是做模型的同学经常忽略的内容。
模型划分框架的设计不仅需要依据监管指引以满足合规要求,还必须结合银行自身情况,并参考同业实践。需要说明的是,模型划分还需要考虑数据支持情况、违约记录数和行内业务实际等因素。
其中建模中比较容易忽略的风险点:基于数据可获得性,并考虑相关监管要求(数据观察期不低于5年),确定历史数据时间区间。
• 确定违约定义(初步分析时可暂定违约定义为逾期90天以上)
• 构建统计模型的前提是一般要求资产组合至少有100个违约样本
模型的开发步骤主要有两个阶段:准备阶段与核心阶段
一.准备阶段—— 基础分析和数据收集
- 范围和目标定义
a.决定评级模型的预期结果
b.确定覆盖的客户和产品
c.确定“违约”的定义
2.因素长清单的设计
a.确定可能对违约有预测作用的潜在因素集合,组成一个待测试的因素 长清单
b.提出模型开发所需要的数据需求,并提供数据收集模板
3.数据提取和准备
a.选择具有代表性的样本
b.收集历史违约和未违约的信息
c.对提取到的数据进行清洗和加工转换,符合模型开发的需要
d.在这一步能够充分分析和评价银行数据的质量,从而决定下一步能够 开发出什么样的模型
基础分析和数据准备是模型开发过程中非常重要的一环,保证了后期模型开发的准确性和有效性,通常在整个模型开发工作中占了大部分时间。
二.核心阶段 —— 模型的构建
4.单一因素分析
a.对潜在的因素长清单进行逐个筛选 ,确定哪个因素可以较好地对违约 进行预测
b.筛选出一份比较精炼的因素短清单 ,供最终模型备选
5.因素转换对备选因素标准化分值,从而每个因素都具有相同意义和标准偏差
6.模型构建、选择和测试a.通过统计分析确定各因素的最佳权重b.根据信用直觉和专家经验调 整模型的权重 ,并测试模型
7.对标/ 分池a.将模型的结果对准至一个标准上的级别和PD值b.设计全行统一的评级主标度 c.对零售风险暴露设计分池d.这一步能否实现取决于银行历史数据的质量和长度
三.模型指标维度筛选说完模型的开发步骤,那模型的开发的指标与细则又有哪些,指标的数据大概有以下内容:
1.申请信息:客户基本信息、客户职业信息、客户资产及收入信息、客户负责信息、贷款申请信息
2.征信指标、贷记卡信息、准贷记卡信息、贷款信息表、其他信息、执行记录、综合信息、查询记录
3.逾期滚动率分析
4.账龄分析
5.表现期决策分析
6.变量筛选过程:
a.缺失值及分箱筛选——缺失率剔除
b.IV值筛选——iv值剔除c.变量聚类筛选——共线性指标筛选d.logistic回归筛选——逐步选择筛选
7.模型参数及验证最大似然估计值分析模型拟合统计量KS值(开发样本)
8.模型变量分布
9.模型变量共线性检验Pearson 相关系数参数估计值/VIF共线性诊断(截距已调整)OTT样本验证。
以上跟模型相关的内容中,更详细的学习内容可以回顾第二期训练营中的模型系列内容,在课程上会手把手教大家实操具体的模型细则,不会代码也没关系,0基础上手。
~原创文章
…
end
标签:因素,模型,建模,信息,开发,违约,文档,模块,筛选 来源: https://blog.csdn.net/weixin_45545159/article/details/120122811