《表2 部分类簇关键词:基于大数据分析的大学生创新创业主要影响因素探究》
基于以上两个方法,本文首先将采集到的创新创业影响因素相关文本数据分词,然后过滤停用词、常用词等得到候选词组集合;然后用WORD2VEC计算候选词组集合中每一个词组的词向量;接着利用SINGLEPASS聚类方法对每个词组进行聚类,计算结果如表2所示。其中,簇类标签由人工给出,本文首先挑选三名有标注经验并且有创新创业相关经验的人员分别对这些类簇打上簇类标签,然后利用投票的方式得到簇类名称。
图表编号 | XD0013264300 严禁用于非法目的 |
---|---|
绘制时间 | 2018.12.25 |
作者 | 谢晓默、林敏 |
绘制单位 | 福州大学数学与计算机科学学院、福州大学数学与计算机科学学院 |
更多格式 | 高清、无水印(增值服务) |