《表5 模型泛化能力《道藏》测试集结果》
真正的古文正文由长串文字序列组成,无法直接用来测试断句。测试数据的构造方法文献[10]并未提及。考虑到门控RNN虽在一定程度上解决了长距离依赖问题,但如果序列长度过长,计算依然是不可能的。为不失一般性,我们将连续的几句或十几句合并为不超过64个字的小段落作为测试对象(参数选择理由参见本文第4节)。不同模型的具体结果如表3~表5所示。
图表编号 | XD00109145000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 俞敬松、魏一、张永伟 |
绘制单位 | 北京大学软件与微电子学院、北京大学软件与微电子学院、中国社会科学院语言研究所 |
更多格式 | 高清、无水印(增值服务) |