《表9 各个方法的评价指标》
按照本文方法以及提到的术语相似度计算方法进行对比实验,实验结果如表9所示。可以看出,文献[17-19]方法相较于文献[16]方法较好,证明基于概念层的相似度计算比基于距离的相似度计算效果较好,而文献[17-19]方法、文献[16]都比单独使用Word2Vec方法的效果好,证明概念结构和基于距离的方法比单独使用语义的方法有效性高。本文提出的综合术语的概念、距离、语义以及属性的Sim-KG方法得到的评价指标较高,证明了Sim-KG方法的有效性。综上,将概念层次结构、距离、语义和属性相结合,可以提高基于术语相似度面向分类任务中的性能,其中层次结构被认为是重要的,其次是距离,最后是语义和属性。公式(7)中各个相似度权重的取值也体现了这一点。
图表编号 | XD00227031100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.25 |
作者 | 李家全、李宝安、游新冬、吕学强 |
绘制单位 | 北京信息科技大学网络文化与数字传播重点实验室、北京信息科技大学计算机学院、北京信息科技大学网络文化与数字传播重点实验室、北京信息科技大学网络文化与数字传播重点实验室 |
更多格式 | 高清、无水印(增值服务) |