《表1 区域政务微博主题建模结果》
其中,θd,k表示在第k个主题与文档d形成的采样向量,体现了文档d中主题k的概率,φk,w代表主题k中特征词w的概率,K为潜在主题数,α和β均为隐含狄利克雷分布超参数。在模型参数的设置方面,本文采用专家咨询法结合困惑度判断法,设定主题数K=4,Gibbs抽样迭代次数i=500对模型进行训练,最终抽取各个主题及事件中TF-IDF值排名前10的特征词项,如表1所示。
图表编号 | XD00198126900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 高晨翔、黄新荣 |
绘制单位 | 中国人民大学信息资源管理学院、西北大学公共管理学院 |
更多格式 | 高清、无水印(增值服务) |