《表7 音节粒度syll+BME切分示例》
另外,对实验结果进行错误分析后发现,当维吾尔文音节作为输入,中文汉字作为输出时,会出现一些严重的歧义问题。比如,维吾尔语的“sepil”(城墙),可切分成两个音节“se+pil”,其中“pil”音节单独(可视为一个单词)能表达“大象”;维吾尔文中“sugukkanlik”(坦然)可切分成4个音节“su+guk+kan+lik”,其中的“kan”音节有“血”的意思,这些歧义问题的存在影响着翻译效果。为有效解决歧义问题,进一步提升翻译质量,本文首先将维吾尔语切分成音节,将单词的首音节标注为“_B”,中间的音节全部标注为“_M”,末音节标注为“_E”,单独一个音节或符号时标注为“_BE”,具体示例如表7所示。
图表编号 | XD00201546300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.15 |
作者 | 艾山·吾买尔、斯拉吉艾合麦提·如则麦麦提、西热艾力·海热拉、刘文其、吐尔根·依布拉音、汪烈军、瓦依提·阿不力孜 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学新疆多语种信息技术实验室、新疆大学软件学院、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |