《表1 词汇使用频率与权重的关系Tab.1 Relationship between vocabulary frequency and weight》

《表1 词汇使用频率与权重的关系Tab.1 Relationship between vocabulary frequency and weight》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《汉语-印尼语平行语料自动对齐方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文句对来源于《罗盘报》、安塔拉通讯社等12个印尼语网站,共有2 115 467条印尼语句子。在进行词频统计后,将词频大于5的词汇设定为高频词汇,小于等于5的词汇设定为低频词汇,并根据词汇出现的“稀有”程度设定权重。本文在实验过程中对随机选择的5 000个双语句对进行实验,并采用递归方法输入不同权重值得出不同的成功对齐率,选取对齐率最高的权重值作为最终权重。词汇使用频率的权重如表1所示。