《表2 输入变量的重要性:基于随机生存森林的房屋贷款逾期研究》

《表2 输入变量的重要性:基于随机生存森林的房屋贷款逾期研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于随机生存森林的房屋贷款逾期研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在原始数据中除去逾期天数,共有16个解释变量。另考虑到把离散变量转换为虚拟变量后,解释变量过多,但这些变量并不都有助于逾期的评估,相反可能由于各个解释变量之间的相关性,降低模型的有效性,不利于建立正确的逾期评估模型。因此,从原始变量中筛选出合适的变量来建立评估模型就显得很有必要。本文采用随机生存森林方法,根据变量的重要性来筛选变量。结果见表2。表2是基于3种不同划分比例的训练集得到的建模结果中重要性位居前14位的变量。