《表1 词性标注类别:字符序列标注的维吾尔语词干提取方法》
训练集是在官方提供的数据集基础上抽取的词对(Kursantlarda|Kursant),再对其进行字符切分和标记;而测试集使用新疆多语种信息技术实验室自然语言处理组维吾尔语自然语言处理工具包,将进行词例、词性标注等预处理操作,词性标注集如表1所示。本文根据词性进行筛选,仅保留部分词性的单词,保留单词的词性见表中的加粗部分。
图表编号 | XD00174664700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 古丽尼格尔·阿不都外力、买合木提·买买提、吐尔根·依布拉音、早克热·卡德尔、西热艾力·海如拉、王路路 |
绘制单位 | 新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |