《表1 各类别文本排名前6的特征词》
如图3所示,经过分词处理后得到的词条数较多,规模较大,而删除了重复词条后的词条数大幅下降,对随后采取的分类训练的分类准确率会有较大的影响。因此,需要结合ICHI方法和TF-IDF加权算法对其进行特征词向量的选择和表示。根据上述方法处理后,取各类别文本排名前6的特征词,见表1。
图表编号 | XD0083533100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.25 |
作者 | 葛继科、陈栋、王文和、陈祖琴、陈国荣、刘灿 |
绘制单位 | 重庆科技学院智能技术与工程学院、重庆科技学院智能技术与工程学院、重庆科技学院智能技术与工程学院、重庆科技学院智能技术与工程学院、重庆科技学院智能技术与工程学院、重庆科技学院智能技术与工程学院 |
更多格式 | 高清、无水印(增值服务) |