《表2 word2vec参数设置》

《表2 word2vec参数设置》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多标签文本分类模型对比研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

训练词向量就是将文本采用向量表示。本文使用爬取的数据进行word2vec[10]模型训练。训练好的词向量将用于多标签文本分类模型的训练。使用Gensim接口调用word2vec工具训练词向量,Gensim的word2vec的输入是句子的序列,每个句子是一个单词列表。本文采用Skip-Gram模型将数据集训练生成词向量,具体参数设置如表2所示。通过以上方式,将文本数据转为其对应的词向量,词向量作为模型训练的输入,为后续实验提供方便。