《表4 实验样本采样效果对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Spark框架的用于金融信贷风险控制的加权随机森林算法》
为了有效较少非平衡数据集导致模型训练结果有效性下降的现象,该实验采用对多数类进行欠采样和对少数类进行过采样的方式生成一个相对平衡的数据集.训练数据集样本采集2017年6月-8月的总计30万条数据,经过分析发现经采样后多数类与少数类的比例由原始数据的9∶1减少为11∶3,有效降低了数据集的非平衡性.表4是采样后的数据集与未经过采样的数据集性能对比.
图表编号 | XD00141231200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 胡婵娟、于莲芝、薛震 |
绘制单位 | 上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院、上海理工大学光电信息与计算机工程学院 |
更多格式 | 高清、无水印(增值服务) |