《表2 维吾尔语同义词集》

《表2 维吾尔语同义词集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA主题模型的维吾尔语无监督词义消歧》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:a表示总和,b表示均值.

根据过滤结果以及策略1)和2),对维汉对齐词典进行同义词抽取,得到4类维吾尔语同义词集分别对应汉语孤立词集、汉语歧义词集、汉语消歧同义词集以及未在汉语同义词词林中出现的汉语词集,具体抽取结果如表2所示.其中,维汉对齐词典和结构化词典的词数分别为385 505和63 477,对应抽取出的以上4类维吾尔语同义词集数分别为332,2 740,4 363和8 088条.对每类抽取结果按照词条中维吾尔语词频区间分布,各自随机抽样100组词条进行人工评价,准确率分别为88.43%,76.09%,85.00%和83.13%.合计抽取维吾尔语同义词集共15 523条,平均准确率为83.16%.