《表2 基于混合特征的SVM分类器语料测试实验结果》

《表2 基于混合特征的SVM分类器语料测试实验结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的图书智能采编模式的构建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

分类器设计为2级分类,先按14个大类进行智能分类,分配完大类后再进行大类的子类智能分类,这样可以逐步缩小语料范围,提高分类精度和速度。以题名、摘要和各个主题字段为输入,分类号为类目标签,进行TFIDF特征提取,利用SVM算法进行监督学习,构建各级分类器。由于测试语料包括分类号,智能分类号与此分类号相同或互为上位类就算分类正确。如《软件工程》测试语料的原分类号为TP311.5,智能分类为TP311.5或TP311都算正确。实验表明一级大类分类器的测试正确率大概在94%~97%之间,二级分类器的测试正确率大概在88%~92%之间,综合正确率达到85%以上,符合日常工作的需求(表2)。