《表1 u.data文件的源数据(部分)》

《表1 u.data文件的源数据(部分)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于用户偏好预测的无人机部署和缓存策略》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文所使用的MovieLens数据集由GroupLens组织提供,并且已经被广泛应用于教育、研究和工业领域的科研和实践当中。本文需要通过用户的人口学信息来预测内容请求概率,因此选择使用MovieLens数据集的100k版本。该版本完整的数据集包含了943名用户对1 682部电影的共计100 000条评分信息,每个用户至少对20部电影进行了评分。本文认为一个电影评分意味着在该时间点向无线网络发出的一个对该内容的请求。根据长尾理论,只有很少一部分的内容被大多数的用户请求。因此本文仿真中仅对请求概率最高的前100部电影进行了实验分析。此外,该数据集也包含了用户的人口学信息,可以用来计算用户相似性。部分MovieLens数据集源数据(u.data文件和u.user文件)如表1和表2所示。表1数据包括用户ID、电影ID、评分和时间戳,其中,用户ID和电影ID可用来预测用户对内容的偏好,评分表示用户对电影的打分,时间戳表示评分的时间。本文忽略评分高低,仅认为其代表该时间点向无线网络发出的内容请求。表2数据包括用户ID、年龄、性别、职业等信息,可用来分析用户之间的相似性。