《表1 老维语字母转换为拉丁字母的可替换形式Tab.1 Possible Latin alphabet alternatives of Uyghur Perso-Arabic alphabet》

《表1 老维语字母转换为拉丁字母的可替换形式Tab.1 Possible Latin alphabet alternatives of Uyghur Perso-Arabic alphabet》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于子词信息的维吾尔语词项规范化》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

一项关于维吾尔族民众使用拉丁字母情况的调查显示,170名受访者中有39.8%不使用拉丁字母,29.7%使用标准的拉丁字母,还有30.5%使用不规则的拉丁字母,例如“X”、“SH”和“爦”都可能作为老维语字母的转换[7].在老维语的32个字母中有15个存在2~4个可能的拉丁字母转换[7],这15个字母的转换方式如表1所示.这种不规则转换会产生严重的文本歧义现象(如表2所示),给后续自然语言处理操作的有效性带来很大的影响.因此,本研究主要针对拉丁维语中的不规则转换来进行文本规范化处理.