《表5 主要词性信息:融合词预测的半监督老挝语词性标注研究》
实验统计,老挝语中98%的数词(CNM)使用阿拉伯数字表示,因此使用了正则表达式来辅助标注,F值可以达到99.2%.在动态助词(PRA)的标注中,由于老挝语中仅有四个动态助词(、、、),因此其F值可以达到100%.在普通名词(N)的标注中,由于未登录词处理做了如下设置:若未登录词的左右皆为未登录词,则认为该词的词性唯一且为普通名词,因此普通名词的标注准确率提高到93.3%,同时也使得其召回率大于准确率.动词(V)与量词(CLF)在未使用老挝语法规则前标注准确率为94.5%与85.2%,使用之后准确率提高到了95.5%与86.2%.且召回率均高于准确率.但老挝语中量词搭配丰富,因此量词的标注准确率仍然较低.介词(PRE)的准确率为92.7%,F值为94%,标注效果相对较好.形容词(ADJ)的标注准确率最低,为83%,但是90.5%的召回率相对较好.而形容词在语料库中占5.3%,因此认为形容词是降低其他词性标注准确率的主要原因之一.关系副词(REL)的标注准确率为93.1%,但是70.2%的召回率比较低,后期工作将致力于提高形容词的准确率及关系副词的召回率.
图表编号 | XD009528100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 王兴金、周兰江、张金鹏、周枫、郭剑毅 |
绘制单位 | 昆明理工大学信息工程与自动化学院智能信息处理重点实验室、昆明理工大学信息工程与自动化学院智能信息处理重点实验室、云南财经大学信息管理中心、昆明理工大学信息工程与自动化学院智能信息处理重点实验室、昆明理工大学信息工程与自动化学院智能信息处理重点实验室 |
更多格式 | 高清、无水印(增值服务) |