个人信用报告数字解读在平安银行的验证与应用

2023-05-10 14:56:27


来源:《中国征信》2017年第3期。


作者:杨群、王越月、王斌、彭昊、李怡昂均供职于平安银行零售风险管理部。


。同商业银行内部风险评分模型相比,数字解读具有覆盖面广、表现充分、样本量大等优点。平安银行自2014年开始开展对数字解读的分析验证,结果显示数字解读具有优异的风险识别能力,适合作为全行层面的通用模型工具,为全行个贷提供一致的风险评估标准。自2016年起,数字解读开始在全行逐步推广应用,范围覆盖房贷、车贷、消费贷等主要产品。本文简要介绍平安银行数字解读验证工作以及目前的应用情况,并对使用过程中积累的经验认识进行归纳总结。


数字解读产品简介


数字解读基于信贷数据精确预测违约概率,是最符合银行风控要求的大数据产品。同征信业其他评分产品相比,数字解读源于最重要的信贷数据,具有核心竞争力;同银行内部的评分模型相比,数字解读解决了银行内部样本量少、否决客户无表现、变量来源不统一的痛点。我们在下表中对数字解读同银行内部评分模型进行了简单对比,不难看出数字解读具有覆盖面广、表现充分、样本量充足的优点。


除了模型本身优点,数字解读查询方式便利,可以快速落地应用。实时查询仅需对已有的征信报告查询接口做很小的改动,批量查询也仅需要客户三项信息即可快速返回。银行可以借助数字解读快速建立内部的风险模型体系及组织架构。




数字解读验证


目前征信中心每半年都会提供数字解读验证报告,监控数字解读在个人征信系统整体及各类人群上的表现,并为银行提供验证几率表。根据验证结果,数字解读一直保有很高的风险区分度和排序能力。但是,因为各家银行的客群定位和风险政策千差万别,为了评估数字解读在特定银行产品的表现,就需要银行组织开展专项验证。验证目标首先是精确测算数字解读同违约概率的对应关系,其次通过验证可以明确应用策略,为进一步的落地实施打下基础。


自2014年开始,我行在征信中心大力支持下,每年开展数字解读验证工作,已经持续三年。验证由银行提供测试样本(包括客户三项标识、请求查询的评分时点),征信中心返回相应的数字解读分数。为保证验证的全面性和有效性,测试样本覆盖了我行主要个贷产品(包括房贷、车贷、消费贷款),评分时点覆盖贷款的各个生命周期。在获取评分数据之后,再对评分及评分后1年的违约情况进行回顾分析。结果显示,无论整体还是细分产品、账龄、逾期级别的子样本,数字解读都保持很高的区分度。分应用场景看,在贷款审批阶段,数字解读的KS达到0.3以上;在贷后应用阶段,对于评分时未逾期样本,数字解读的KS达到0.4以上;根据作者经验,国内新资本协议达标的商业银行,内部模型的区分指标即KS达到0.3以上。由此看来,引进数字解读不但可以大幅提高行内模型的区分度,甚至可以直接用做内部违约概率模型的分池变量。比区分度指标更重要的是,银行根据验证结果可以掌握数字解读评分与违约概率的对应关系,用于风险策略。根据验证结果,我行建立了各个产品的风险损失标尺,参见图1。图1可证明数字解读的风险排序性,以及评分对应的违约概率。由此,即可根据产品定价等参数反推盈亏平衡点。假设产品1年利率为5%,资金成本3%,运营成本1%,则违约概率不得超过1%。再根据验证结果,数字解读600分对应的损失率为1%,则可以确定600分为最低准入线。



数字解读应用


通过3年的全面验证,我行对数字解读的性能、分布、同违约概率的对应标尺都有了充分的积累,并同时完成了IT系统改造,开通查询接口。目前,对所有个贷客户在贷前贷后都会查询人行数字解读,查询结果接入决策引擎,通过引擎运算形成全自动或半自动的业务决策,用于贷前审批及贷后的各个环节。主要的应用场景概述如下:


贷前应用


一是准入控制。首先,建立了全行客户级的准入线,数字解读低于一定水平的客户,在全产品线禁止准入。准入控制是申请评分最主要的应用场景。根据验证结果,数字解读如果低于一定分数,损失率会超过全行所有产品的定价承受能力,这个节点就是全行的准入线。其次,在不同产品上细分准入线,进行差异化准入控制。对高风险产品,准入线也定的较高,反之亦然。最后,对于已有内部评分模型的产品,实行数字解读同内部评分的两维准入策略;对于没有内部评分模型的产品,则以数字解读为准入线。


二是流程优化。首先,数字解读具有较高的区分度,因此在准入线以上的客户,符合分数越高风险越低的趋势。由此,我们根据数字解读对准入线以上的客户进一步细分,匹配不同的审批流程。对于高分客户,简化审批规则,在不影响资产组合质量的前提下,可以降低20%的工作量。特别对线上贷款可以实现秒批。其次,,而征信查询通常都处在流程最前端,所以银行可以在第一时间获知客户大致的审批结果,在最前端拦阻不符合要求的客户,从源头降低后端的工作量。最后,新产品开发。随着互联网金融的兴起,传统个贷业务也在快速走向线上。线上贷款在降低运营成本的同时,进一步凸显了风险管理的重要性。精确计量风险成本和违约概率是准入、限额和定价的依据。模型开发需要数据积累,所以在新产品开发阶段通常是没有内部模型支持的。这时,数字解读就体现出了通用模型的巨大价值。


我们的经验是,根据新产品特征从已有客户中选择特定的客群进行风险计量,力求精确测算分数对应的风险成本,以及客群的分布特征和数量。尽管这种测算的准确性可能有误差,但通用模型可贵之处在于排序性,而排序性是客群差异化经营的基础。使用数字解读区分不同等级的客户,为他们提供差异化的限额和定价,这样既能为优质客户带来更好的体验,又能降低高风险客户的损失。在新产品上线初期,数字解读的准入线可以控制得略紧一些,后续再根据持续验证结果进行调整。通过不断尝试修正,最终实现精确的风险计量。


贷后管理


一是风险预警。目前,房贷、车贷和消费贷大多是一次发放的非循环贷款,这类贷款的特点是——客户在贷后同银行只有还款关系。表现在数据上,就是客户只留下还款行为的记录。与之相反,循环类贷款例如信用卡,客户在贷后还会提供消费、购车、出境等行为记录。信息缺失为房贷、车贷和消费贷的贷后管理带来很大问题,得不到有用的前瞻性信息就不能防患于未然。尽管贷后查询人行征信报告能够得到有用信息,但因征信报告信息量大,查询频率会受限制。


数字解读完美解决了银行缺少客户贷后信息的痛点。一方面综合了客户最新的征信信息,反映了客户在行外的最新动态,能有效识别高风险客户。另一方面把征信报告几百个字段综合为一个“数字”,大大降低了查询量,提高了查询效率,即使是千万的客户量也可以实现每月更新。根据查询结果,可以从大量的正常客户中识别出在他行已经严重逾期的客户,并进行提前干预,实现早期风险预警。


二是组合监控。长期以来,个人贷款组合的监控报表中的主要前瞻性指标是滚动率和Vintage分析。我行在验证的基础上,将数字解读与违约概率建立了映射关系,所以监控数字解读即可预知未来的风险,这使得监控具备了充分的前瞻性;同迁徙率相比,数字解读可以对未逾期客户进行进一步细分,这提高了风险预测的准确性;此外,因为数字解读依托于统计模型,背后有征信中心整个模型团队的支持,模型自身就有准确性稳定性的监控,可以保证主标尺的前后一致。所以,基于模型得出的监控结论,也是稳健可靠的。


综上,数字解读与违约概率有直接的对应关系,由此从违约概率的角度检视资产质量,具有更高前瞻性、更强准确性、更可靠的稳健性。


三是再授信。再授信是贷后管理的重要环节,及时准确的再授信能降低营销成本、提高客户满意度、优化资产组合,当然前提是精确的风险计量。利用数字解读,不但能在再授信时准确排除高风险客户,还可以对合格客户根据风险水平分群,制定差异化的经营策略,改善用户体验。


个人信用报告一直是国内商业银行个贷风控的主要工具。信用报告完整记录了借款人的信贷行为,最能体现借款人未来的信用风险。征信报告的原始数据需要合理的“解读”,才能从几百个字段中筛选得出最具备预测力的信息,并借助评分模型技术,转化为评分的形式来计量客户未来的违约概率。同商业银行内部风险评分模型相比,数字解读具有覆盖面广、表现充分、样本量大等优点。


综上所述,数字解读是利用大数据实现风险计量的一个标志性的成功案例。它集成了最优质的数据,从中挖掘出了最有用的信息,建立了数据同风险的对应关系,提供了风险管理科学决策的量化基础。他既是客户级通用模型,又能用于产品级的应用;既能单独使用为银行提供现成的模型填补空白,又能与已有模型结合运用提升精度;既能用于贷前审批,又适用于贷后管理;既为新产品保驾护航,又能有效支持线上化业务的开展。总之,数字解读打通了大数据风控的核心路径,体现了数据分析创造价值的理念,为银行在风控、运营、营销领域带来巨大的收获。


版权声明:中国征信杂志(微信号:zgzxzz)所有注明来源于《中国征信》杂志的文章,请媒体和微信公众号转载时注明出处,否则将追究法律责任。欢迎转发至朋友圈。



Copyright © 2023 All Rights Reserved 版权所有 上海小额交流群