《表1 K-Means聚类结果》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于短语表示学习的主题识别及其表征词抽取方法研究》
根据聚类结果统计每个类簇的词语数量及每个类簇的高频词,如表1所示,可以发现基于语义向量的聚类效果较好,如web、internet、data等属于一个类簇,scientific field、scientific literature、scientific collaboration等属于一个类簇,这些词均在语义上具有相似性或相关性。值得注意的是,如果以这些高频词表征研究主题和分析主题内容,会发现这些高频词仍然具有较高的概括性。因此,在此基础上将聚类结果进一步作为TP2Vec模型的输入,在同一语义空间学习主题和短语的向量表示,以抽取语义相关的、更具区分度的短语作为主题表征词。
图表编号 | XD00212871400 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.25 |
作者 | 张金柱、于文倩 |
绘制单位 | 南京理工大学经济管理学院、江苏省社会公共安全科技协同创新中心、南京理工大学经济管理学院 |
更多格式 | 高清、无水印(增值服务) |