《表2 特征模板:字符序列标注的维吾尔语词干提取方法》
维吾尔语形态的丰富性造成了词干提取的复杂性。如果单一地从字符特征出发,难以达到理想的结果。条件随机场模型的关键是利用选取的特征构建特征模板,因此,选择具有代表性的特征模版能够充分利用相关信息且能减少信息冗余,同时还能提高词干提取性能。本文在特征模板的设计中不仅定义了原子特征模板,还定义了复合特征模板。假设C是字符特征,F为非字符特征,则特征模板定义如表2所示。
图表编号 | XD00174664500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 古丽尼格尔·阿不都外力、买合木提·买买提、吐尔根·依布拉音、早克热·卡德尔、西热艾力·海如拉、王路路 |
绘制单位 | 新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |