《表1 样本类别和数量统计信息》

《表1 样本类别和数量统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于TF-IDF的卷积神经网络新闻文本分类优化》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实验数据来源于清华大学的新闻数据集THUCNews,从中抽取了财经、游戏、房产、股票、家具、教育、科技、社会、时尚、时政等10个类别,每个类别13 000个文本,通过数据预处理对文本进行jieba分词,去除停用词,并且过滤文本长度超过2 000的新闻。详细的样本类别以及处理后的数据统计信息如表1所示。本文使用的嵌入向量是搜狗的中文新闻语料训练的嵌入向量。