《表3 微博数据集:基于情感的社会网传播模型及影响最大化算法研究》

《表3 微博数据集:基于情感的社会网传播模型及影响最大化算法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于情感的社会网传播模型及影响最大化算法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

新浪微博数据集的获取选择了网络爬虫技术,在微博用户中任意挑选了100名用户为种子用户,并设置用户之间的关系距离为3,随后,获取了170万名微博用户以及4 000万条有向边。总共爬取了10亿条微博数据(收集了用户最近的1 000条微博),同时还收集了用户的基本信息。数据集按照微博转发和用户行为对10亿条微博进行了过滤,保留了30万条对研究有意义的微博数据,平均每个微博被转发80次。经过预处理后,数据的统计信息如表3所示。