《表1 K-Means聚类结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于短语表示学习的主题识别及其表征词抽取方法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

根据聚类结果统计每个类簇的词语数量及每个类簇的高频词，如表1所示，可以发现基于语义向量的聚类效果较好，如web、internet、data等属于一个类簇，scientific field、scientific literature、scientific collaboration等属于一个类簇，这些词均在语义上具有相似性或相关性。值得注意的是，如果以这些高频词表征研究主题和分析主题内容，会发现这些高频词仍然具有较高的概括性。因此，在此基础上将聚类结果进一步作为TP2Vec模型的输入，在同一语义空间学习主题和短语的向量表示，以抽取语义相关的、更具区分度的短语作为主题表征词。

图表编号	XD00212871400 严禁用于非法目的
绘制时间	2021.02.25
作者	张金柱、于文倩
绘制单位	南京理工大学经济管理学院、江苏省社会公共安全科技协同创新中心、南京理工大学经济管理学院
更多格式	高清、无水印（增值服务）