《表3 采集的微博数据指标及其说明》

《表3 采集的微博数据指标及其说明》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《奖赏与惩罚:社交媒体中网络用户身份与情感表达的双重结构》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在确定相应的话题后,本研究根据相应的关键词,采集新浪微博上相关的文本。数据的采集是通过Python语言并采用高级搜索的方式,其具体流程如下:首先,以某个话题的关键词为线索(搜索规则例如乒乓球国家队退赛:乒乓球退赛OR国家队退赛),在新浪微博中检索到所有相关的微博。其次,根据被检索到的微博获取本研究所需的数据,其包括两个层面:1.微博博文层面的数据,包括检索到的有关微博的正文、发文时间、网页链接;2.微博账户层面的数据,也就是所检索到的微博其发文账户的数据,包括账户名、账户ID、账户的认证信息,具体的指标和内容如表3。之后,将这些信息依次爬取并存储至数据库。在采集数据的时间区间上,本研究将其设定为事件发生后的15天内。