《表5 主要词性信息:融合词预测的半监督老挝语词性标注研究》

《表5 主要词性信息:融合词预测的半监督老挝语词性标注研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合词预测的半监督老挝语词性标注研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验统计,老挝语中98%的数词(CNM)使用阿拉伯数字表示,因此使用了正则表达式来辅助标注,F值可以达到99.2%.在动态助词(PRA)的标注中,由于老挝语中仅有四个动态助词(、、、),因此其F值可以达到100%.在普通名词(N)的标注中,由于未登录词处理做了如下设置:若未登录词的左右皆为未登录词,则认为该词的词性唯一且为普通名词,因此普通名词的标注准确率提高到93.3%,同时也使得其召回率大于准确率.动词(V)与量词(CLF)在未使用老挝语法规则前标注准确率为94.5%与85.2%,使用之后准确率提高到了95.5%与86.2%.且召回率均高于准确率.但老挝语中量词搭配丰富,因此量词的标注准确率仍然较低.介词(PRE)的准确率为92.7%,F值为94%,标注效果相对较好.形容词(ADJ)的标注准确率最低,为83%,但是90.5%的召回率相对较好.而形容词在语料库中占5.3%,因此认为形容词是降低其他词性标注准确率的主要原因之一.关系副词(REL)的标注准确率为93.1%,但是70.2%的召回率比较低,后期工作将致力于提高形容词的准确率及关系副词的召回率.