《表5 融合不同语法特征的实验结果对比》
为了验证不同的维语语法特征对于机器翻译质量的影响,同时将维语词汇特征分别与词干特征、词性特征、词缀特征进行融合实验,结果如表5所示,每个“[]”表示单一编码器结构中的嵌入单元,包含词汇特征和其他特征的嵌入大小.由表5可知,单一的词干特征、词性特征、词缀特征与维语词汇特征进行融合,均可以提高机器翻译质量.其中词干特征的效果最为显著,原因在于:1)维语的词干特征相比于词汇特征显著降低了词汇表规模;2)词干序列中包含了维语语句的结构信息,可以更好地捕获其中的句法知识.词性特征和词缀特征同样具有提升效果但不是很明显,原因在于:1)维语词汇切分工具的准确率不是很高,无法获取高质量的词性标注和词缀切分数据;2)两者的词汇表规模较小,无法提供大规模的句法和语义知识.对比表4和5可知,将以上所有的语法特征融合之后,机器翻译系统的性能达到最优,说明多特征融合模型可以更好地捕获维语语句中的语义内容,从而获取更加准确的汉语译文.
图表编号 | XD00140615900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 潘一荣、李晓、杨雅婷、董瑞 |
绘制单位 | 中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室 |
更多格式 | 高清、无水印(增值服务) |