《表1 维语词汇的词缀个数统计》

《表1 维语词汇的词缀个数统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向维汉机器翻译的层次化多特征融合模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

如表1所示,对训练数据集中的词汇进行统计发现:大部分维语词汇的词缀个数在两个及以下,因此仅仅保留一个维语词汇中的前两个词缀可以基本满足要求,并且减轻维语的形态复杂性和数据稀疏性问题;如果对应位置没有词缀,则使用“”进行标注.该方法考虑到维吾尔语词汇的词缀特征信息,在一定程度上保证句法和语义知识的完整性,分别使用“词缀μ-1”和“词缀μ-2”表示两个词缀,并保留词缀μ-1和词缀μ-2对应的词缀形态标签特征.如果对应的位置没有词缀,则使用“”表示其词缀形态标签,所有的词缀共享相同的词缀形态标签集合.