《表1 豆瓣达人加入的小组成员数与所有豆瓣小组成员数对比》

《表1 豆瓣达人加入的小组成员数与所有豆瓣小组成员数对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于RBM模型的豆瓣小组推荐系统设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

最终,选取649位豆瓣达人的行为数据。通过脚本统计,得到以下结果:649位豆瓣达人总共加入了27804个小组。对这27804个小组按加入人数进行分段,并与所有小组已加入人数进行对比,得到如表1所示结果。其中,“10001~627180 num”代表所有小组成员数量情况,“active user group num”代表“豆瓣达人”加入的小组成员数量情况,“percentage”代表同一人数段“active user group num”与“10001~627180 num”的比值。由表1可以看出,人数较少的小组,豆瓣达人加入的比例也较小。随着小组加入人数规模上升,爬取到的豆瓣达人加入的小组占所有同等规模小组的比例也在上升。因此,爬取到的豆瓣达人的行为数据,能很好地包含豆瓣活跃小组的绝大多数,一定程度上,起到对豆瓣全量数据缩放的效果。于是,可将模型层输入的用户数据从接近2亿骤减至千人左右规模。