《表4 关键词抽取与扩展实例》
上表可以看出,在三组实验中,本文方法取得了最优的准确率,并且F值也要高出其他方法5个百分点,通过该实验说明短文本中如果只采用简单的同义词来扩展关键词,虽然会对很多短文本都打上扩展标签,但是由于同义词扩展出的关键词并一定能具有文本所要表达的含义,所以准确率并不高;而第二种基于全文本的相似度计算扩展方法,由于文本存在着大量噪声词,这些词在做关键词扩展任务中具有很强的干扰作用,使得扩展结果与原文语义发生很大偏差,所以所取得扩展结果也并不理想;而本文方法之所以取得了相对较好的结果,是因为只基于文本关键词计算相似度,文本中的关键词基本上都与文本语义保持一致,所以扩展出来的关键词不会有太大偏差,效果相对理想。表4给出了本文方法的相关实例。
图表编号 | XD0057578600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 曾曦、阳红、常明芳、冯骁骋、赵妍妍、秦兵 |
绘制单位 | 中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所 |
更多格式 | 高清、无水印(增值服务) |