《表5 原子特征模板的实验结果》
从表5中可以看出,考虑不同的原子特征,发现词、前缀音节、后缀音节、机构名特征词对维吾尔文机构名的识别影响相对较大,其中前缀音节和后缀音节主要是词的主要成分,前缀音节接近词干,从而会减少数据稀疏问题;后缀音节中主要是词的附加成分,比如格,单复数,人称等,与词本身有关系;机构名特征词能有效表示某一个机构名的结束标识,与一般词语相比,有助于机构名的识别。然而其它特征基本属于机构名识别的外部特征,因此这些特征对机构名识别的影响度相对较小。
图表编号 | XD0040524500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.16 |
作者 | 买合木提·买买提、王路路、吐尔根·依布拉音、艾山·吾买尔、卡哈尔江·阿比的热西提 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |