《表1 词汇使用频率与权重的关系Tab.1 Relationship between vocabulary frequency and weight》
本文句对来源于《罗盘报》、安塔拉通讯社等12个印尼语网站,共有2 115 467条印尼语句子。在进行词频统计后,将词频大于5的词汇设定为高频词汇,小于等于5的词汇设定为低频词汇,并根据词汇出现的“稀有”程度设定权重。本文在实验过程中对随机选择的5 000个双语句对进行实验,并采用递归方法输入不同权重值得出不同的成功对齐率,选取对齐率最高的权重值作为最终权重。词汇使用频率的权重如表1所示。
图表编号 | XD0032539900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 郑铿涛、林楠铠、付颖雯、王连喜、蒋盛益 |
绘制单位 | 广东外语外贸大学信息科学与技术学院、广东外语外贸大学信息科学与技术学院、广东外语外贸大学信息科学与技术学院、广州市非通用语种智能处理重点实验室(广东外语外贸大学)、广东外语外贸大学信息科学与技术学院、广州市非通用语种智能处理重点实验室(广东外语外贸大学) |
更多格式 | 高清、无水印(增值服务) |