《表3 数据集1筛选后特征属性》
本文实验采用的开发语言为Python,其中多数算法采用Sklearn库实现.数据集1存在指标冗余的现象,为减少特征数量,提高特征集与目标变量的相关性,加强模型预测效果,采用相关系数法、卡方、递归特征消除法、套索回归和随机森林五种方式分别进行特征筛选,分别进行重要性排序,再进行投票排序,按照各指标属性频次进行选择,选取了频次大于等于2的指标,筛选属性见表3.
图表编号 | XD00204634000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.30 |
作者 | 林卫明、曹杰 |
绘制单位 | 南京信息工程大学数学与统计学院、南京信息工程大学数学与统计学院、徐州工程学院 |
更多格式 | 高清、无水印(增值服务) |