《表1 年龄变量数据处理:基于机器学习的个人信用模型实证分析》

《表1 年龄变量数据处理:基于机器学习的个人信用模型实证分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的个人信用模型实证分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

年龄变量是一个连续型变量,其数值对客户信用可能呈“U型”分布,即在年龄数值较小时或较大时对客户可信度具有负作用,中间数值呈正作用[9]。因此直接使用数据作为判断依据,可能对线性模型的评估带来障碍,需要对数据进行重新编码。针对年龄变量,以5岁为一个阶段划分区间,将年龄数据分为:(0,15]、(15,20]、(20,25]、(25,30]、(30,35]、(35,40]、(40,45]、(45,50]、(50,55]、(55,60]、(60,65]、(65,70],共12个区间。通过重新编码,将年龄1维数据转换成12维数据,让模型避免“U型”难点。经过重新编码后部分结果如表1所示。