《表5 模型泛化能力《道藏》测试集结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于BERT的古文断句研究与应用》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

真正的古文正文由长串文字序列组成，无法直接用来测试断句。测试数据的构造方法文献[10]并未提及。考虑到门控RNN虽在一定程度上解决了长距离依赖问题，但如果序列长度过长，计算依然是不可能的。为不失一般性，我们将连续的几句或十几句合并为不超过64个字的小段落作为测试对象（参数选择理由参见本文第4节）。不同模型的具体结果如表3～表5所示。

图表编号	XD00109145000 严禁用于非法目的
绘制时间	2019.11.01
作者	俞敬松、魏一、张永伟
绘制单位	北京大学软件与微电子学院、北京大学软件与微电子学院、中国社会科学院语言研究所
更多格式	高清、无水印（增值服务）