《表4 DSTC语料分布情况》
基于机器学习的文档结构理解需要大量的训练数据,我们广泛采集了多种学术期刊或会议的共计1 734篇学术论文,如表4所示。并按照前文提出的标注方法对其标注,构建了流式文档结构标注语料库(Document Structure Tagging Corpus,DSTC)。
图表编号 | XD0091817200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 刘倩、李宁、田英爱 |
绘制单位 | 北京信息科技大学计算机学院、北京信息科技大学计算机学院、北京信息科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |