《表1 测试集在不同模型上的训练结果》

《表1 测试集在不同模型上的训练结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多重CCA算法的柬汉双语词向量构建方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在本节实验中,设置词向量维度d为200进行计算。通过Word2vec工具包对三种语言语料进行单语词向量训练,分别得到52 947个英语单语词向量、44 805个汉语单语词向量以及39 054个柬语单语词向量。以文献[8]中多语言典型相关分析模型作为baseline,将单语词向量分别放入多语言典型相关分析模型和本章所提出模型中进行训练,得到双语词向量,并将通过多语言典型相关分析模型训练得到的英-汉、英-柬、汉-柬双语词向量所表示的词对与英-汉测试集Ten-ch、英-柬测试集Ten-kh、汉-柬测试集Tch-kh进行分析比较;而后将通过本章模型训练得到的多语词向量所表示的词对与英-汉测试集Ten-ch、英-柬测试集Ten-kh、汉-柬测试集Tch-kh进行分析比较,得到词对之间的相关系数,将本章所提模型的实验结果与基准实验的结果进行对比分析。CCA算法通过Matlab工具实现,斯皮尔曼相关系数越大,所测试的模型得到的双语词向量对应的双语词对相关度越高,实验结果如表1所示。