《表2 word2vec训练的参数Table 2 Training parameters of word2vec》
本文利用ICTCLAS分词工具对全部语料库进行分词,在对语料库分词前要进行预处理操作,其中预处理包括:删除@user、删除网址、删除话题、删除转发或回复原文等。使用Google提供的开源词向量训练工具word2vec进行词向量的训练,其训练参数如表2所示,最终训练得到一个15 035的词向量字典。
图表编号 | XD0016981900 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.01 |
作者 | 郑啸、王义真、袁志祥、秦锋 |
绘制单位 | 安徽工业大学计算机科学与技术学院、安徽工业大学计算机科学与技术学院、安徽工业大学计算机科学与技术学院、安徽工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |