《表1 ML-100k数据集》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于双层相似度的协同过滤推荐算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

ML-100k数据集参数见表1。每一个用户通过一个用户ID唯一标识，每一部电影通过一个电影ID标识，每条评分数据是一个由用户ID、电影ID、评分值、评分时间组成的四元组，评分值r∈{1，2，3，4，5}，稀疏度[18]计算公式见式（21），其中N为评价条数。根据文献[4]，将用户年龄分为1~10、11~20、21~30、31~40、41~50、51~60、61~70、71~80，用离散的8个数字标识，同样用离散的整数标识2种性别和21种职业，则最多可将用户分成336组。具体的用户组数目将根据评分数据中涉及的用户根据式（9）进行分组。

图表编号	XD0025784900 严禁用于非法目的
绘制时间	2018.02.28
作者	谢毅刚、郭卫斌、李建华
绘制单位	华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院
更多格式	高清、无水印（增值服务）