《表8 manager类样本划分结果》
分析表7中的数据,发现良性应用样本数量比恶意应用样本数量多,manager类中良性应用样本数量是恶意应用样本数量的3.6倍,player类中良性应用样本数量是恶意应用样本数量的7.12倍,news and sharing类中良性应用样本数量是恶意应用样本数量的2.85倍,advertisement类中良性应用样本数量是恶意应用样本数量的3.6倍,样本数量极为不均衡。为了避免因为样本数量差距太大造成分类结果错误率提升的问题,可以采用3.5.1节所述方案重新创建多个训练样本数据集。则manager、player、news and sharing和advertisement类的训练样本集数量分别为4、8、3、4个,测试样本保持不变。重新划分训练集的结果如表8~11所示。
图表编号 | XD0090324900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 李江华、邱晨 |
绘制单位 | 江西理工大学信息工程学院、江西理工大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |