《表3 微博数据集:基于情感的社会网传播模型及影响最大化算法研究》
新浪微博数据集的获取选择了网络爬虫技术,在微博用户中任意挑选了100名用户为种子用户,并设置用户之间的关系距离为3,随后,获取了170万名微博用户以及4 000万条有向边。总共爬取了10亿条微博数据(收集了用户最近的1 000条微博),同时还收集了用户的基本信息。数据集按照微博转发和用户行为对10亿条微博进行了过滤,保留了30万条对研究有意义的微博数据,平均每个微博被转发80次。经过预处理后,数据的统计信息如表3所示。
图表编号 | XD0067436800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 宋健、刘勇、郭龙江、玄萍 |
绘制单位 | 黑龙江大学计算机科学技术学院、黑龙江大学计算机科学技术学院、黑龙江大学计算机科学技术学院、黑龙江大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |