《表3 部分变量说明:基于稀疏结构连续比率模型的消费金融风控研究》

《表3 部分变量说明:基于稀疏结构连续比率模型的消费金融风控研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于稀疏结构连续比率模型的消费金融风控研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文的数据来自我国某大型消费金融信息平台,剔除缺失样本和数据清洗后,最后还剩3334条有效样本,其中468条“违约客户”样本,222条“灰客户”样本,2644条“非违约客户”样本。本文“非违约客户”定义是指客户在近8个月内贷款未出现过逾期,即没有信用污点的客户;“违约客户”定义是指客户在近8个月内有出现过贷款逾期情况并且逾期的天数大于等于30天;“灰客户”是指客户在近8个月内贷款出现过逾期情况,但逾期天数小于30天。经过数据清洗和特征工程后,最后获得285个自变量,从时间角度看,主要包含“近12个月”和“近3个月”两个时间维度的相关信息,每个时间维度又包含客户5方面的信息:即个人关联信息、家庭及资产状况预测、历史不良信息、电商消费信息以及历史借贷申请记录。由于变量数很多,受篇幅限制,没法一一详细列举所有变量,表3中仅举例部分变量信息。传统征信主要依赖于信用历史,尤其是借贷历史和还款表现,这类信息对个人信用风险的预测能力较强,但是大量的居民是没有借贷历史记录的,比如在央行征信系统覆盖的9亿多个人中,只有不到4亿是有借贷记录的。对于没有借贷记录的个人,传统征信就没法判断其风险。消费金融平台为了解决信息不对称和信息不足的问题,往往更多地使用电商平台消费记录、非银行机构的借贷记录等数据。与传统征信信息相比,这类数据更加高频、更容易获得,可作为传统征信信息不足的重要补充,利用大数据技术引入高频的消费行为数据能够有效补充信息含量,提高信用风险识别效率(王正位等,2020)。