《表1 新闻文本数据分布:基于Multi-TWE模型的短文本分类研究》

《表1 新闻文本数据分布:基于Multi-TWE模型的短文本分类研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Multi-TWE模型的短文本分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

该数据集中的新闻标题的长度主要集中于10~30字之间,所以该数据集中的新闻标题很适合作为短文本分类的研究对象。数据集共涉及了9个邻域,每篇文本内容都包括网址、标题、内容等,只抽取其中的新闻标题部分,最终获得的新闻文本数据分布见表1。其中,每个类别的文档按照80%作为训练数据,20%作为测试数据。