《表1 Doc2vec参数设置》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA模型和Doc2vec的学术摘要聚类方法》
本文通过Python的requests库爬取中国知网中“计算机技术”主题下的摘要数据,共7 923条,采用jieba分词,去除停用词后保存为文本文件,一行数据代表一份文档。经过预处理后得到的文档如图4所示。之后对预处理后的语料库通过Doc2vec训练词向量,向量模型参数如表1所示。
图表编号 | XD00133687800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.15 |
作者 | 张卫卫、胡亚琦、翟广宇、刘志鹏 |
绘制单位 | 兰州交通大学电子与信息工程学院、兰州交通大学电子与信息工程学院、兰州理工大学经济管理学院、兰州交通大学电子与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |