《表1 训练与测试样本分布》
本文采用由搜狗实验室语料库整理而成的数据集,共分为财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9大类,为了保证每篇文章归属一个类别,筛选出各类别中分布均匀且分类明确的文章共14 755篇,其中训练样本数8 849,测试样本数5 906,详细样本分布如表1。
图表编号 | XD002732500 严禁用于非法目的 |
---|---|
绘制时间 | 2018.05.20 |
作者 | 易军凯、王超、李辉 |
绘制单位 | 北京化工大学信息科学与技术学院、北京化工大学信息科学与技术学院、北京化工大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |