《表7 语料基础数据:宏观篇章结构表示体系和语料建设》
本文已标注720篇文章,共有3 985个段落,形成2 870个篇章关系.平均每篇有5.53个段落,每篇最大段落数为22,最小段落数为2.总句子数为8 319句,平均段落长度为2.1个句子.共计398 829个字,平均每篇文档554个字.具体的统计数据见表7.
图表编号 | XD00136457400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 褚晓敏、奚雪峰、蒋峰、徐昇、朱巧明、周国栋 |
绘制单位 | 苏州大学自然语言处理实验室、苏州科技大学电子与信息工程学院、苏州大学自然语言处理实验室、苏州大学自然语言处理实验室、苏州大学自然语言处理实验室、苏州大学自然语言处理实验室 |
更多格式 | 高清、无水印(增值服务) |