《表3 关键词扩展对比实验》
本文还与Wang的方法进行了对比,他的方法主要是文本中找到同义词进行替换,在英文领域采用的是Word-Net上的同义词替换资源,将同样的方法移植到中文上,由于Word-Net上没有中文资源,这里采用哈尔滨工业大学构建的《同义词词林》进行替换;为了说明关键词抽取的重要性,将本文的关键词扩展策略进行修改,提出了一种基于全文本的关键词扩展方法AWEK(ALL-WORD-EXPEND-KEYWORD),该方法与前述的扩展方法略有不同,不再只与文本中的关键词计算相似度,而是将所有候选词作为扩展依据计算相似度,将本文方法与上述两种方法相对比,将100万条短文本作为训练语料进行对比实验,实验结果如表3所示。
图表编号 | XD0057578300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.15 |
作者 | 曾曦、阳红、常明芳、冯骁骋、赵妍妍、秦兵 |
绘制单位 | 中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所、中国电子科技集团公司第三十研究所 |
更多格式 | 高清、无水印(增值服务) |