《表1 K-Means聚类结果》

《表1 K-Means聚类结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于短语表示学习的主题识别及其表征词抽取方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据聚类结果统计每个类簇的词语数量及每个类簇的高频词,如表1所示,可以发现基于语义向量的聚类效果较好,如web、internet、data等属于一个类簇,scientific field、scientific literature、scientific collaboration等属于一个类簇,这些词均在语义上具有相似性或相关性。值得注意的是,如果以这些高频词表征研究主题和分析主题内容,会发现这些高频词仍然具有较高的概括性。因此,在此基础上将聚类结果进一步作为TP2Vec模型的输入,在同一语义空间学习主题和短语的向量表示,以抽取语义相关的、更具区分度的短语作为主题表征词。