信贷评分卡的顶层设计思路
作者:互联网
顶层设计是运用系统论的方法,从全局的角度,对某项任务或者某个项目的各方面、各层次、各要素统筹规划,以集中有效资源,高效快捷地实现目标。
“顶层设计”,正成为中国新的政治名词,在政府报告中经常出现,这也预示着中国改革事业进入了新的征程。一个国家中涉及到民生、经济、政治等方方面面,自然需要站在战略高度对待这个宏观命题。而具体到一个行业,大家所在的风控模块,其中的模型板块真的需要用到顶层设计这样一个大词么?
就像政府报告说的顶层设计需要抓住重大问题,主要问题。在金融业务中,政策、策略、模型、产品等模块互相交融,模型似乎只是整条链条上一个小模块。但熟知模型的同学一定知道,自动化审批中数据与模型是这个模块中最重要的模块。目前一些大型金融机构中单单模型团队就有几十个人,开发的模型也将近两三百张卡之多。数量一多,大家也就知道这些模型的管理难度所在。在这里模型的顶层设计的价值就体现出来了。
评分卡的开发过程大同小异。整体上分,在整个信贷领域,按照客户的生命周期,可以将评分卡分为营销响应评分卡、申请评分卡、行为评分卡、贷后评分卡及反欺诈评分卡。其中申请评分卡可谓是最常用的一张卡,另外比较重要的是贷中评分卡。贷中评分卡也是银行卡中心特别重视的一张卡。
评分卡的相关开发流程在之前我们的文章也涉及过不少。评分卡的整体开发过程主要包括数据收集、业务定义、数据整理清晰、模型分组、变量构造、变量分析、比哪里选择与模型确定、模型校准、模型跟踪这些步骤,基本都是通用的。
本文关于评分卡的顶层涉及的内容,会以介绍贷中评分卡开发过程中目标变量的定义、筛选建模的样本、确定坏样本的的定义以及挑选显著变量这几个方面进行阐述。
一.模型样本的选择
滚动率报表:
在具体设计评分卡的,我们某月截面数据为例,上月M3的客户在下月滚动至更差状态M4的比例为90%以上,意味着一旦客户到达M3之后,90%以上客户不会变更好,因此选取M3+作为坏定义是较为合理的。
账龄表:
账龄表vintage报表,指的是对不同放款月份的进行设计的报表,具体的vintage的做法可以参考:
在此案例中以201901-201908作为参考月,观察M3+%趋势,可以看出客户的M3+%趋势并未收敛。考虑到巴塞尔要求及参考同业经验,建议12个月作为表现期。
二.如何筛选建模样本客群
选择好观察期跟表现期后,如何确定建模样本客群。基于历史有无逾期细分逻辑,观察点过去3/6/9个月风险差异,可以看到过去3个月或者过去6个月逾期的lift较高(思考:lift提升度的计算公式是什么?为什么越高越好?)。观察过去3个月或者6个月的逾期交叉情况,结果如下:
如果以过去6个月有无逾期作为顶层细分,有逾期样本为96127个,其中坏样本为16710个,如果以3个月有无逾期作为顶层细分的话,样本总数及坏样本数要少很多。由于过去6个月逾期细分的坏样本更多,而且lift也符合要求。综上,选择过去6个月是否逾期作为顶层细分,MOB12-M3+作为目标变量。
从业务分析的角度而言,坏客户定义应该和银行的政策相一致。一是风险偏好,如果金融机构的偏好比较激进,业务目标是尽可能地扩大规模,愿意承担比骄傲多的风险来获得高收益,那么可以选择逾期期数较长以上的,比如M3+,M4+甚至对于长账龄的产品到M6+水平。而如果金融机构的比较保守,可以选择逾期期数较少的,如M2+以上的客群。
第二个考虑目标客群的就是催收管理水平,如果管理水平较高,短期逾期都能大部分催收成功的话,可以选择较长逾期期数。
第三个考虑的就是结合政策相关规则,如贷款分类,准备金计提等。
三.确定坏样本的的定义
综上,一般而言,金融金融都是选择M3的逾期作为坏账客群较多。本次我们也是类似选择:
四.确定较为显著的变量
显著变量的挑选,跟机构可获取的数据和数据产品都有关系,详情因为较偏公司业务会在具体的课程中阐述:
另外本文只将贷中评分卡的这四个方面提及,其他几个重要相关内容如:
1.贷中评分卡在面对多条样本的时候如何选择
2.贷中评分卡跟贷前评分卡的差别在哪里
3.贷中评分卡怎么跟策略结合调整的
…这几个问题,大家可以在后续思考下,我们也将在本周日的课程上帮大家解答这些内容。
本文就其中的贷中评分卡的相关内容进行了阐述,另外文章最开头所提到的响应率模型是怎么样的?具体怎么样?用到了什么模型,相关的算法跟客群分层的逻辑又是怎么样的?关于这部分,我们也将在后续课程中帮大家解答。
(响应率即可:比如拨打100个电话,有5个成功办理,响应率为5%)
原创文章
…
end
标签:顶层,逾期,评分,模型,M3,思路,贷中 来源: https://blog.csdn.net/weixin_45545159/article/details/117828166