《表8 突发事件主题类别划分》
对于数值型指标的处理,主要通过数据透视等统计分析方法。对于文本内容的处理,运用基于相关性的LDA话题模型进行话题抽取和分析。首先按发布者对其所有微博内容进行聚合,一个发布者对应一篇文档。对分好词的文档进行话题抽取和结果的可视化展示,结合困惑度和话题在二维空间上的分布确定话题数,保证话题较好的独立性。根据已有研究,设置相关性参数λ为0.6[39],增强话题的可读性。依据前30个最能体现话题的关键话题词,概括出各话题的含义。以话题的含义为主,结合话题在二维空间上的分布情况,对主题类别进行划分。分析得到埃博拉病毒疫情、中东呼吸综合征和山东疫苗案的主题类别如表8所示。
图表编号 | XD00121801900 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 安璐、陶延芳 |
绘制单位 | 武汉大学信息管理学院、武汉大学信息资源研究中心、武汉大学信息资源研究中心 |
更多格式 | 高清、无水印(增值服务) |