《表4 语料集的基本情况:基于条件随机场的维吾尔文机构名识别》
目前,针对维吾尔文命名实体识别的公开语料库未见报道,因此,我们利用语言技术平台(LTP)提供的汉语命名实体识别技术标注CWMT2017评测语料,获取相应包含实体的语料,从中选取8819个句子作为训练集,2518句作为测试集,然后通过人工标注的方式建立了维吾尔文机构名标注语料库。语料集的基本情况见表4。
图表编号 | XD0040524400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.16 |
作者 | 买合木提·买买提、王路路、吐尔根·依布拉音、艾山·吾买尔、卡哈尔江·阿比的热西提 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |