《表2 word2vec参数设置》
训练词向量就是将文本采用向量表示。本文使用爬取的数据进行word2vec[10]模型训练。训练好的词向量将用于多标签文本分类模型的训练。使用Gensim接口调用word2vec工具训练词向量,Gensim的word2vec的输入是句子的序列,每个句子是一个单词列表。本文采用Skip-Gram模型将数据集训练生成词向量,具体参数设置如表2所示。通过以上方式,将文本数据转为其对应的词向量,词向量作为模型训练的输入,为后续实验提供方便。
图表编号 | XD00144924100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 姜炎宏、迟呈英、战学刚 |
绘制单位 | 辽宁科技大学计算机与软件工程学院、辽宁科技大学计算机与软件工程学院、辽宁科技大学计算机与软件工程学院 |
更多格式 | 高清、无水印(增值服务) |