《表4 新闻主题分类数据集样本分布》

《表4 新闻主题分类数据集样本分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合一维扩展卷积与Attention机制的NLP模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

THUCNew是根据新浪新闻RSS订阅频道2005—2011年的历史数据筛选过滤获得的,一共包含74万篇新闻,约为2.19 GB。本文从该数据集中提取出10个主题,每个主题随机抽取5 000篇新闻作为训练集,500篇新闻作为验证集,1 000篇新闻作为测试集。样本分布如表4所示。