《表6 NG选取边界样本后的KNN分类结果》

《表6 NG选取边界样本后的KNN分类结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种新的样本选择算法及其在文本分类中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:采用所有样本进行KNN实验的MacF1为0.628 80,MicF1为0.610 99.

本文还进行了KNN实验.因为路透社文档集是一个不均衡的多标签的文档集,因此有些类别中的文档数相差较大,如所选最大类earn类的训练文档数为2 877,而最小类gnp类的训练文档数为101;且有较多文档同时属于多个类别,如corn类别中的文档几乎同时属于grain类.这些都将影响分类效果,在KNN分类算法中选取分类结果最好的K值.路透社文档集选取K=30进行分类,而20NewsGroup新闻组和复旦文档集选取K=5进行分类.其分类结果如表4~表6所示.