《表1 中文新闻文本数据集》

《表1 中文新闻文本数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《RHS-CNN:一种基于正则化层次Softmax的CNN文本分类模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

清华大学THUCTC文本分类工具提供的中文新闻语料(2),共有836 075个文本,如表1所示。该数据集将用于评估模型的分类效果(实验b和实验c),在每个分类中取70%作为训练集,30%为测试集。