《表2 收入变量数据处理:基于机器学习的个人信用模型实证分析》

《表2 收入变量数据处理:基于机器学习的个人信用模型实证分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的个人信用模型实证分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

收入数据按照2017年个人所得税征税级距为梯度划分。收入数据虽然不存在“U型”数据难点,但是工资的额度增加不一定与信用评分呈线性关系,因此需要对工资进行再编码,使工资变换能够被分类器学习,并将收入映射到梯度区间。但是,由于其数值较大,可能会带来因数据单位不一致带来的参数变化,使得模型泛化能力较低,因此对其取以2为底的对数。一方面可以反映数据的变化趋势,另一方面可压缩数值,避免因为数据变化造成模型的效果差。与年龄不同的是,工资的每个阶段都有实质作用,因此需要记录每个阶段的数值,处理后部分结果如表2所示。