《表6 添加命名实体特征的分类实验效果》
将命名实体作为特征词加入到特征向量中,依然用信息增益、TF-IDF、互信息和卡方检验来统计特征词的权重,结果如表6所示。可以发现,在特征维度为100时,应用信息增益这个计算量的准确率为93.4%,得到显著提升。在维度为500时,分类实验准确率达到97.8%;在特征维度为1 000时,分类的实验准确率为98.7%;此时,实验效果已接近饱和;在特征维度为1 500时,分类的实验准确率依然为98.7%;在特征维度为2 000时,分类的实验准确率为97.8%。再观察加入命名实体特征词后用TF-IDF统计量的实验效果。在特征维度分别为100、500、1 000、1 500、2 000时,文本分类的准确率分别是90.8%、98.3%、96.5%、98.3%、96.9%。
图表编号 | XD00107789600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 秦贺然、刘浏、李斌、王东波 |
绘制单位 | 南京农业大学信息科学技术学院、南京农业大学信息科学技术学院、南京农业大学领域知识关联研究中心、南京师范大学文学院、南京农业大学信息科学技术学院、南京农业大学领域知识关联研究中心 |
更多格式 | 高清、无水印(增值服务) |