《表2 多变量的相关性:基于证据权重及信息价值筛选的信用卡透支风险检测模型的建构》

《表2 多变量的相关性:基于证据权重及信息价值筛选的信用卡透支风险检测模型的建构》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于证据权重及信息价值筛选的信用卡透支风险检测模型的建构》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

x5、x10分别表示月收入和家庭人数指标的有效数据量,经过缺失值处理发现,月收入共缺失29 731个值,家庭人数缺失3 924个值。这种情况在现实中很普遍,为使后续的分析方法得以正常应用,需要进行缺失值处理。其中,月收入指标缺失率较大,采用随机森林法(Random Forest),根据指标之间的相关关系填补缺失值。采用python的pearson相关系数计算各变量间的相关性,各变量间相关性较小,共线性可能性小(表2)。