《表4 样本中缺失变量个数统计表》

《表4 样本中缺失变量个数统计表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《网贷平台数据的随机森林预测模型实证分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在建模之前,对样本进行检测可知,缺失值为29 261个.去掉这些缺失值后剩下的有效样本是27 353.其中9 522人借款成功,17 831人借款失败由表4可以看出,借款成功率与缺失变量个数成反比.当缺失变量为0的时候,总样本为27 353个,其中成功的样本为9 252个,失败样本为17 831个;当缺失变量个数为1时,总样本为9 263个,其中成功样本为797个,失败样本为8 466个;当缺失变量个数为2时,总样本为4 229个,其中成功样本为158个,失败样本为4 071个;当缺失变量个数为3时,总样本为969个,其中成功样本为73个,失败样本为14 799个;而在3以后,就会变的越来越低.这时在总样本为14 801个中成功样本只有2个,失败样本却达到了14 799个.