《表2 神经网络结构对WMT 2018QE任务中德语→英语验证集上实验结果的影响》
实验结果如表2所示,其中,BERT-CLS模型是使用BERT作回归任务的基础结构,BERT+Bi-GRU+Split模型表示使用Multi-BERT对原文和译文单独编码之后拼接送入Bi-GRU中.可以发现不同种类的神经网络应用在微调阶段取得的效果差别不大.相比之下,融合外部特征的模型,如BERT+Bi-GRU+LASER+Baseline和BERT+Bi-GRU+LASER能够在相关性上取得更大的提升.
图表编号 | XD00140611500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 陆金梁、张家俊 |
绘制单位 | 中国科学院自动化研究所模式识别国家重点实验室、中国科学院大学、中国科学院自动化研究所模式识别国家重点实验室、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |