《表1 实验语料基本情况》

《表1 实验语料基本情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于置信度的藏文人名识别的主动学习模型研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本实验语料来自人民网、藏语广播网、阿坝新闻网的藏语版,语料覆盖新闻、政治、宗教、文化等多个领域,不仅包含大量藏族人名,还包含大量译名。实验语料一共1 500个文本,其中训练语料1 360个文本(人工标注语料100个文本、未标注语料1 260个文本)、测试语料140个文本,语料基本情况如表1所示。