《表2 标点训练与测试集规模》

《表2 标点训练与测试集规模》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BERT的古文断句研究与应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

标点任务由于获取的带标点古文文本较为杂乱,多种文本类别并存,标点使用非常不一致,有只有逗号、句号的,也有使用了所有现代标点符号的。我们最终仅使用相对标点质量较高的《道藏》文本进行标点任务的训练和测试。《道藏》标点语料的训练集与测试集规模如表2所示。