Description
项目背景
根据中国信息通信研究院发布的《中小企业“上云上平台” 应用场景及实施路径白皮书(2019)》统计,中小企业是国民经济和社会发展的生力军,贡献了50%以上的税收,60%以上的国内生产总值,70%以上的技术创新,80%以上的城镇劳动就业,90%以上的企业数量。中央多次强调“六稳”,其中稳就业是“六稳”的基石,稳住了中小企业就稳住了经济的基本面。
然而相对于大中型企业而言,小微企业在市场竞争中仍处于弱势地位,特别是在非常时期,融资问题导致其很难保证经营的稳定性与持续性。小微企业的融资问题,反应的是金融行业的根本问题,解决金融流通效率间的信任问题。而金融科技旨在利用数字科技优势,利用科技去解决金融实体间的信任问题。本文介绍的小微贷款评分卡即是一种重要的科技手段。
1 项目方案
小微贷款评分卡模型是利用小微快贷业务申请信息、产品信息、账户信息、实控人信息,结合央行征信数据、行外数据(工商、税务、司法等),运用机器学习方法构建人工智能风险评价模型,完善现有的小微快贷业务风险评价体系。
2 模型设计
2.1 好坏用户定义
通过滚动比率Roll Rate分析某个逾期状态向其它逾期状态转移的概率(M1即逾期1~30天,以此类推),从而确定坏客户(大概率保持逾期状态的用户);没有逾期的客户为好客户;介于好坏客户之间定义为灰客户。如下图可以明显看到逾期M2客户就已经有90%概率会继续逾期。
即可以滚动率的拐点(如逾期M2及以上)作为坏客户的定义。
2.2 表现期、观察期、观察点定义
表现期:采用Vintage分析账户彻底成熟度坏需要的时间作为表现期。即是账户从应还款日开始,多久可充分暴露出是“坏”情况,按照上面坏的定义(如M2+),观察坏客户的暴露周期,如下图(本图无区分不同期数客户)发现14个月可以暴露大部分的坏客户。
观察点:客户样本选取范围,需要兼顾表现期及观察期的窗口。如选取申请贷款时间点为2019年01月~2019年05月的客户样本。
观察期:建模特征的选取日期窗口,需要考虑样本数据情况,如观察点前1年作为观察期。
2.3 数据分析与特征工程
2.4 经典特征
2.5 算法选择
##3 模型表现及应用
3.1 模型指标
3.2 特征重要性
3.3 模型应用
欢迎微信关注公众号“算法进阶”,这里定期推送机器学习、深度学习、金融科技等技术好文。欢迎一起学习交流进步!