《表2 分类器的准确率比较》
具体结果如表2所示,总体来说,使用TF-IDF提取文本特征的支持向量机算法具有相对最高的准确率,为75.1%。当向量化方式为词频矩阵时,集成分类器准确率最高,为74.5%。其他分类器中,逻辑回归分类器的准确率分别为74.2%和74.0%,效果较好,而k近邻分类器准确率最低,仅为48.4%和54.9%。综上,选择文本向量化方法为TF-IDF、分类算法为支持向量机的分类器作为最优分类器,并对其在测试集上的结果作进一步分析。
图表编号 | XD00107791000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 王若佳、张璐、王继民 |
绘制单位 | 北京大学信息管理系、北京大学海洋研究院、北京大学信息管理系、北京大学信息管理系 |
更多格式 | 高清、无水印(增值服务) |