《表1 数据清洗后有效用户数以及相应的点赞微博数》

《表1 数据清洗后有效用户数以及相应的点赞微博数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA主题模型的用户特征预测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

微博作为当今人们交流和共享信息的热门平台,能够提供用户行为等各方面丰富的公开数据,为学术研究奠定了充足的数据基础。因此,本文以微博平台数据为例,提取某热点事件下参与讨论的所有用户近1年内的点赞微博,并剔除点赞次数低于5次的用户以及被点赞次数低于10次的微博文本,最终筛选出64 598位用户及这些用户的点赞微博共计1 854 548条,并划分训练集和测试集,分别作为训练模型的数据以及待预测的新数据集。测试集为总数据集中随机选取的约20%用户以及对应的点赞微博。最终得到表1所列数据集合: