《表2 数据集统计:基于PageRank的微博用户影响力评估模型研究》

《表2 数据集统计:基于PageRank的微博用户影响力评估模型研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于PageRank的微博用户影响力评估模型研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

随着微博的普及,所采集到的微博原始数据数量巨大,但其中有价值的数据有可能只是一小部分,因此对微博数据的预处理过程是必不可少的。数据的预处理过程分为两步,第一步是对微博原始数据进行分类并提取与计算影响力相关的有用信息,第二步是根据提取的有用信息对微博用户进行筛选,只保留粉丝量和微博被转发数都达到一定量级并且实名认证的用户,这样既不会忽略微博网络中的高影响力用户,又缩短了各算法计算影响力排名的时间。数据预处理可以提高后期数据存储分析和计算用户影响力的效率,论文对于微博数据的分类提取如表1所示,最终的数据统计情况如表2所示。