《表1“疫情通报”微博内容数据格式》

《表1“疫情通报”微博内容数据格式》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于用户情感变化的新冠疫情舆情演变分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

2020年1月23日,受新冠肺炎疫情影响,湖北省武汉市实行“封城”政策。2020年4月8日,武汉市解除“封城”。期间内全国各地迅速启动并开展疫情防控工作,与新冠肺炎疫情有关的微博讨论活跃度高,“人民日报”微博发布的每日疫情报道下汇集了大量的评论内容。因此,本文以1月23日至4月8日(共计76 d)“人民日报”每日通报全国新冠疫情的微博评论(简称“疫情通报”)为爬取对象[24],以一条微博为一个目标单元,一天为一个时间节点,共获取疫情通报微博及其评论61 376条。每条微博抓取内容包括:话题链接、发布日期、话题内容、转发量、评论量和点赞量。每条微博评论抓取内容包括:评论者ID、评论者性别、评论者地址、评论日期、评论内容。获得的数据均以csv文本的形式存储,并对文本进行数据清洗。该过程去除了微博评论中无评论内容的记录以及评论内容仅为数字、标点符号(如!,?,.....)、转发信息(@***)以及非中文评论的记录。得到的微博话题及评论数据示例如表1和表2所示。