《表1 测试文本数据:基于word2vec和CNN的短文本聚类研究》

《表1 测试文本数据:基于word2vec和CNN的短文本聚类研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于word2vec和CNN的短文本聚类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证算法的有效性,本文从搜狗实验室(https://www.sogou.com/labs)下载的全网新闻数据(解压后大小为1.4 G)作为训练文本集训练词向量,训练过程设置词向量的维度为100。从互联网爬取的6个热点事件的微博,筛选出长度大于8个字符且少于140字符的文本数据一共1 020条作为测试文本数据。测试文本数据如表1所示。