《表1 实验数据设置:融合句法解析树的汉-越卷积神经机器翻译》
在实验数据预处理中,首先利用JIEBA(https://github.com/jieba)中文分词工具对汉语进行分词,然后使用MOSES对全部训练数据进行tokenization,lowercase以及clean最终保留长度在80个词以内的句对.本实验使用的基准系统是Face Book的开源神经机器翻译模型fairseq,采用卷积神经网络进行编码、LSTM进行解码.以及Google开源的nmt模型,采用基于RNN的编码器与解码器.所有实验均使用132K的双语平行语料作为训练集.所使用的实验数据见表1.
图表编号 | XD00193814200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 王振晗、何建雅琳、余正涛、文永华、郭军军、高盛祥 |
绘制单位 | 昆明理工大学信息工程与自动化学院、云南省人工智能重点实验室(昆明理工大学)、昆明理工大学信息工程与自动化学院、云南省人工智能重点实验室(昆明理工大学)、昆明理工大学信息工程与自动化学院、云南省人工智能重点实验室(昆明理工大学)、云南省人工智能重点实验室(昆明理工大学)、昆明理工大学信息工程与自动化学院、云南省人工智能重点实验室(昆明理工大学)、昆明理工大学信息工程与自动化学院、云南省人工智能重点实验室(昆明理工大学) |
更多格式 | 高清、无水印(增值服务) |