《表5 主要词性信息:融合词结构特征的多任务老挝语词性标注方法》
由表5可得,数词(CNM)、动态助词(PRA)与动词(V)的标注效果较好,F值分别能达到100%、99.5%与98.2%。由实验统计,语料库存在99%的数词使用阿拉伯数字表达,因此本文还使用了匹配阿拉伯数字的正则表达式来帮助数词的标注。而老挝语的动词与动态助词被搭配使用来表示句子时态,模型可以很容易学习这些规则,应用于预测中。普通名词(N)与介词(PRE)的标注准确率次佳,F值分别为96.7%与97.2%。专有名词(PRN)与量词(CLF)的标注效果较差,F值分别为93.2%与85.7%。其中,量词未注是影响模型准确率的主要原因之一,因为老挝语的量词数量丰富,且使用灵活。
图表编号 | XD00109142900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 王兴金、周兰江、张建安、周枫 |
绘制单位 | 昆明理工大学信息工程与自动化学院、昆明理工大学信息工程与自动化学院、昆明理工大学信息工程与自动化学院、昆明理工大学信息工程与自动化学院 |
更多格式 | 高清、无水印(增值服务) |