《表1 词相似度评测数据集》
在文献[12]中使用了6个词相似度数据集评测提出算法的性能,本文同样使用文献[12]中所采用的6个数据集,并和文献[12]提出的算法做对比,其中,WordSim353在多篇文献中被作为评测数据集[38-41]。WordSim353通常被拆分为WordSim Similarity和WordSim Relatedness两个评测数据集。另外,本文删除了相似度词典中的名词所有格词语和不能在网络资源中查询到解释或描述文本的词语,总共删除词语118个,最终在相似度词典中有剩余词语5 987个。评测数据集的具体信息如表1所示。
图表编号 | XD0091822400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 冶忠林、赵海兴、张科、朱宇 |
绘制单位 | 青海师范大学计算机学院、陕西师范大学计算机科学学院、青海省藏文信息处理与机器翻译重点实验室、藏文信息处理教育部重点实验室、青海师范大学计算机学院、陕西师范大学计算机科学学院、青海省藏文信息处理与机器翻译重点实验室、藏文信息处理教育部重点实验室、青海师范大学计算机学院、青海省藏文信息处理与机器翻译重点实验室、藏文信息处理教育部重点实验室、青海师范大学计算机学院、青海省藏文信息处理与机器翻译重点实验室、藏文信息处理教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |