《表3 基分类模型在均衡数据集上的分类精度》
同时,还测试了所提方法在均衡数据集上的性能表现,以验证其不仅适用于不均衡数据集,同样适用于均衡数据集。选取G40、G47、G42、G51、G75、G41、G52、G45、G44、G61共计10个类的数据,如表3所示,这10类的样本数均约等于G64样本数的1/4,在类间分布比较均匀。同样以NB、LR、KNN、SVM作为基分类模型,卷积核长度为2的TextCNN进行分类模型的训练结果。不同基分类模型及融合后模型在各个类上的分类精度如表3所示。可以看出,相比于基分类模型的最佳性能,融合模型总体精度有了2%的绝对提升。除G47、G41、G52这三类的分类精度介于基分类模型的最佳性能与最坏性能之间,其他类的分类精度均不低于基分类模型的最佳性能。说明本文方法同样适用于均衡数据集。从分类精度的提升程度来看,本文方法更适用于不均衡数据集。
图表编号 | XD00157144900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.25 |
作者 | 冉亚鑫 |
绘制单位 | 中国科学技术信息研究所、富媒体数字出版内容组织与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |