《表2 多变量的相关性:基于证据权重及信息价值筛选的信用卡透支风险检测模型的建构》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于证据权重及信息价值筛选的信用卡透支风险检测模型的建构》
x5、x10分别表示月收入和家庭人数指标的有效数据量,经过缺失值处理发现,月收入共缺失29 731个值,家庭人数缺失3 924个值。这种情况在现实中很普遍,为使后续的分析方法得以正常应用,需要进行缺失值处理。其中,月收入指标缺失率较大,采用随机森林法(Random Forest),根据指标之间的相关关系填补缺失值。采用python的pearson相关系数计算各变量间的相关性,各变量间相关性较小,共线性可能性小(表2)。
图表编号 | XD00196260700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.15 |
作者 | 谢军、徐公伟 |
绘制单位 | 宿州学院商学院、宿州学院商学院 |
更多格式 | 高清、无水印(增值服务) |