《表4 新闻主题分类数据集样本分布》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合一维扩展卷积与Attention机制的NLP模型》
THUCNew是根据新浪新闻RSS订阅频道2005—2011年的历史数据筛选过滤获得的,一共包含74万篇新闻,约为2.19 GB。本文从该数据集中提取出10个主题,每个主题随机抽取5 000篇新闻作为训练集,500篇新闻作为验证集,1 000篇新闻作为测试集。样本分布如表4所示。
图表编号 | XD00201540000 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.15 |
作者 | 廖文雄、曾碧、徐雅芸 |
绘制单位 | 广东工业大学计算机学院、广东工业大学计算机学院、广东工业大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |