《表1 ML-100k数据集》

《表1 ML-100k数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于双层相似度的协同过滤推荐算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

ML-100k数据集参数见表1。每一个用户通过一个用户ID唯一标识,每一部电影通过一个电影ID标识,每条评分数据是一个由用户ID、电影ID、评分值、评分时间组成的四元组,评分值r∈{1,2,3,4,5},稀疏度[18]计算公式见式(21),其中N为评价条数。根据文献[4],将用户年龄分为1~10、11~20、21~30、31~40、41~50、51~60、61~70、71~80,用离散的8个数字标识,同样用离散的整数标识2种性别和21种职业,则最多可将用户分成336组。具体的用户组数目将根据评分数据中涉及的用户根据式(9)进行分组。