《表2 维吾尔语同义词集》
注:a表示总和,b表示均值.
根据过滤结果以及策略1)和2),对维汉对齐词典进行同义词抽取,得到4类维吾尔语同义词集分别对应汉语孤立词集、汉语歧义词集、汉语消歧同义词集以及未在汉语同义词词林中出现的汉语词集,具体抽取结果如表2所示.其中,维汉对齐词典和结构化词典的词数分别为385 505和63 477,对应抽取出的以上4类维吾尔语同义词集数分别为332,2 740,4 363和8 088条.对每类抽取结果按照词条中维吾尔语词频区间分布,各自随机抽样100组词条进行人工评价,准确率分别为88.43%,76.09%,85.00%和83.13%.合计抽取维吾尔语同义词集共15 523条,平均准确率为83.16%.
图表编号 | XD00140613800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 袁扬、李晓、杨雅婷 |
绘制单位 | 中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室 |
更多格式 | 高清、无水印(增值服务) |