《表1 Doc2vec参数设置》

《表1 Doc2vec参数设置》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA模型和Doc2vec的学术摘要聚类方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文通过Python的requests库爬取中国知网中“计算机技术”主题下的摘要数据,共7 923条,采用jieba分词,去除停用词后保存为文本文件,一行数据代表一份文档。经过预处理后得到的文档如图4所示。之后对预处理后的语料库通过Doc2vec训练词向量,向量模型参数如表1所示。