《表1 特征字段缺失状况:数据挖掘在零售电商交易风险预测中的应用》
对于表1中所列的类别型字段,比方说区域分类、费控标志等字段均采取默认值-1进行补充;对于大量缺失的字段,比方说负荷特性、市场化属性、退款消费分类,就需要直接删除该特征,以免耗费过多时间成本;重要性等级字段虽然缺失较大,可考虑到其特征的重要性,需要单独保留该特征,采用-1补充;对于异常值极少的(<0.01%)字段数,直接删除即可;至于有些毫无关联(基本为0)的信息,直接删除即可[4]。
图表编号 | XD00116290200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 常春燕、刘广成 |
绘制单位 | 郑州工业应用技术学院信息工程学院、郑州工业应用技术学院信息工程学院 |
更多格式 | 高清、无水印(增值服务) |