《表3 分段结果分析表:满族典籍平行语料库对齐方法与评价——以《尼山萨满》为例》

《表3 分段结果分析表:满族典籍平行语料库对齐方法与评价——以《尼山萨满》为例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《满族典籍平行语料库对齐方法与评价——以《尼山萨满》为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

本文的满汉双语语料分段方法的对齐结果分析见表3。由于《尼山萨满》正文部分比较规范,回车符均是分段换行符,因此基于回车符分段的准确率和召回率均为百分之百,对于《尼山萨满》附录部分,由于很多回车符不是分段换行符,因而对齐的准确率和召回率会显著下降。使用基于人名关键字的方法,虽然准确率和召回率相比基于回车符分段略有下降,但其准确率和召回率均在可接受范围之内,而且其优点是会使句子对齐的准确率和召回率有很大提高;对于《尼山萨满》附录部分,很多回车符不是分段换行符,基于回车符的分段技术准确率和和召回率均有所下降,而基于人名关键字的对齐方法则不受影响。