《表2 术语词个性化实验BLEU分对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《会议场景下融合外部词典知识的领域个性化机器翻译方法》
实验中,为了减少实体词识别错误对翻译性能带来的影响,我们采用了自己研发的基于BiLSTM-CRF[21]的NER工具,通过调参使得系统在体育、商务和医学三个测试集合上的平均正确率为94.21%,平均召回率为89.31%。基于该NER策略,术语词个性化实验如表1和表2所示。从表1可以看出,单独采用占位符替换方法,术语词翻译准确率较高,平均达到93.44%,而拼接融合方法由于需要靠模型自动学习指定术语译文的输出,导致部分术语词翻译准确率较低,平均为89.06%。术语词个性化方法在术语词准确率上与单独采用占位符替换方法相当,平均达到93.17%。从表2可以看出,拼接融合方法由于源句保留了术语词的原文和目标译文信息,BLEU分指标平均由基线的32.48提升至39.49,提升了7.01个BLEU,使得翻译结果更加流畅自然。占位符替换方法虽然术语词准确率最高,但由于句子整体流畅性差,存在译文直译等问题,其BLEU分平均为37.64,比拼接融合方法低了1.85个BLEU。术语词个性化方法在BLEU分指标上与拼接融合方法相当,达到了39.50,高于占位符替换方法1.86个BLEU。
图表编号 | XD0091823100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.01 |
作者 | 刘庆峰、刘晨璇、王亚楠、张为泰、刘俊华 |
绘制单位 | 语音及语言信息处理国家工程实验室、语音及语言信息处理国家工程实验室、认知智能国家重点实验室、认知智能国家重点实验室、认知智能国家重点实验室、认知智能国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |