《表1 实验语料基本情况》
本实验语料来自人民网、藏语广播网、阿坝新闻网的藏语版,语料覆盖新闻、政治、宗教、文化等多个领域,不仅包含大量藏族人名,还包含大量译名。实验语料一共1 500个文本,其中训练语料1 360个文本(人工标注语料100个文本、未标注语料1 260个文本)、测试语料140个文本,语料基本情况如表1所示。
图表编号 | XD0070613100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 王志娟、刘飞飞、赵小兵、宋伟 |
绘制单位 | 中央民族大学信息工程学院、国家语言资源监测与研究少数民族语言中心、好未来教育科技集团、中央民族大学信息工程学院、国家语言资源监测与研究少数民族语言中心、中央民族大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |