《表2 输入变量的重要性:基于随机生存森林的房屋贷款逾期研究》
在原始数据中除去逾期天数,共有16个解释变量。另考虑到把离散变量转换为虚拟变量后,解释变量过多,但这些变量并不都有助于逾期的评估,相反可能由于各个解释变量之间的相关性,降低模型的有效性,不利于建立正确的逾期评估模型。因此,从原始变量中筛选出合适的变量来建立评估模型就显得很有必要。本文采用随机生存森林方法,根据变量的重要性来筛选变量。结果见表2。表2是基于3种不同划分比例的训练集得到的建模结果中重要性位居前14位的变量。
图表编号 | XD00169986100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.25 |
作者 | 王呈斌、方匡南、郑陈璐 |
绘制单位 | 台州学院浙江(台州)小微金融研究院、台州学院浙江(台州)小微金融研究院、厦门大学经济学院统计系、厦门大学管理学院 |
更多格式 | 高清、无水印(增值服务) |