《表1 相似主题表达的主题小类举例》
注:由于社交媒体用语的特殊性,个别的英文单词的拼写与标准有区别,但不影响识别。此外,为了便于模型识别,将所有单词均转化为小写。
由主题模型建模后,将得到主题-词概率分布矩阵和文本-主题概率分布矩阵。主题-词概率分布矩阵中的每个值代表了某一小类下不同词出现的概率。实验挑选了每个主题下出现概率最大的前50个词,然后人工对该小类所表达的具体含义进行描述。经人工识别之后,对具有相似主题表达的小类聚成一个主题大类,如表1中的4类均表示“需求相关”。
图表编号 | XD0056580900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.25 |
作者 | 苏凯、程昌秀、Nikita Murzintcev、张婷 |
绘制单位 | 北京师范大学地理科学学部地理数据与应用分析中心、北京师范大学地理科学学部地理数据与应用分析中心、中国科学院地理科学与资源研究所、北京师范大学地理科学学部地理数据与应用分析中心 |
更多格式 | 高清、无水印(增值服务) |