《表1 实验微博数据组成:基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例》

《表1 实验微博数据组成:基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文以我国环境保护部宣传教育中心和北京市环境保护宣传中心于12月30日联合曝光的2016年雾霾谣言和新浪微博的微博辟谣官方账号发布的辟谣微博作为谣言评判基准,采用爬虫软件爬取以关键词搜索的2016年新浪微博数据以及同时间范围内的非谣言微博,共采集到1032条微博数据,数据包含微博内容信息(文本内容、点赞数、转发数、评论数)和发布微博的用户信息(微博数、关注数、粉丝数)。在筛选删除原始数据池中的缺失、冗余和无关等数据后,最终获得872条有效数据。本文根据曝光的雾霾谣言对采集的数据进行人工标注,其中谣言数据351条,非谣言数据521条,数据组成如表1所示。