《表6 NG选取边界样本后的KNN分类结果》
注:采用所有样本进行KNN实验的MacF1为0.628 80,MicF1为0.610 99.
本文还进行了KNN实验.因为路透社文档集是一个不均衡的多标签的文档集,因此有些类别中的文档数相差较大,如所选最大类earn类的训练文档数为2 877,而最小类gnp类的训练文档数为101;且有较多文档同时属于多个类别,如corn类别中的文档几乎同时属于grain类.这些都将影响分类效果,在KNN分类算法中选取分类结果最好的K值.路透社文档集选取K=30进行分类,而20NewsGroup新闻组和复旦文档集选取K=5进行分类.其分类结果如表4~表6所示.
图表编号 | XD0028661500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 万中英、王明文、左家莉、刘长红 |
绘制单位 | 江西师范大学计算机信息工程学院、江西师范大学计算机信息工程学院、江西师范大学计算机信息工程学院、江西师范大学计算机信息工程学院 |
更多格式 | 高清、无水印(增值服务) |