《表2 基于混合特征的SVM分类器语料测试实验结果》
分类器设计为2级分类,先按14个大类进行智能分类,分配完大类后再进行大类的子类智能分类,这样可以逐步缩小语料范围,提高分类精度和速度。以题名、摘要和各个主题字段为输入,分类号为类目标签,进行TFIDF特征提取,利用SVM算法进行监督学习,构建各级分类器。由于测试语料包括分类号,智能分类号与此分类号相同或互为上位类就算分类正确。如《软件工程》测试语料的原分类号为TP311.5,智能分类为TP311.5或TP311都算正确。实验表明一级大类分类器的测试正确率大概在94%~97%之间,二级分类器的测试正确率大概在88%~92%之间,综合正确率达到85%以上,符合日常工作的需求(表2)。
图表编号 | XD00215125000 严禁用于非法目的 |
---|---|
绘制时间 | 2018.12.01 |
作者 | 周聪、张德林 |
绘制单位 | 徐州医科大学图书馆、徐州医科大学附属医院信息中心 |
更多格式 | 高清、无水印(增值服务) |