《表1 词相似度评测数据集》

《表1 词相似度评测数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多源信息融合的分布式词表示学习》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在文献[12]中使用了6个词相似度数据集评测提出算法的性能,本文同样使用文献[12]中所采用的6个数据集,并和文献[12]提出的算法做对比,其中,WordSim353在多篇文献中被作为评测数据集[38-41]。WordSim353通常被拆分为WordSim Similarity和WordSim Relatedness两个评测数据集。另外,本文删除了相似度词典中的名词所有格词语和不能在网络资源中查询到解释或描述文本的词语,总共删除词语118个,最终在相似度词典中有剩余词语5 987个。评测数据集的具体信息如表1所示。