《表7 音节粒度syll+BME切分示例》

《表7 音节粒度syll+BME切分示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《带标记音节的双向维汉神经机器翻译方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

另外,对实验结果进行错误分析后发现,当维吾尔文音节作为输入,中文汉字作为输出时,会出现一些严重的歧义问题。比如,维吾尔语的“sepil”(城墙),可切分成两个音节“se+pil”,其中“pil”音节单独(可视为一个单词)能表达“大象”;维吾尔文中“sugukkanlik”(坦然)可切分成4个音节“su+guk+kan+lik”,其中的“kan”音节有“血”的意思,这些歧义问题的存在影响着翻译效果。为有效解决歧义问题,进一步提升翻译质量,本文首先将维吾尔语切分成音节,将单词的首音节标注为“_B”,中间的音节全部标注为“_M”,末音节标注为“_E”,单独一个音节或符号时标注为“_BE”,具体示例如表7所示。