《表1 ML-100k数据集》
ML-100k数据集参数见表1。每一个用户通过一个用户ID唯一标识,每一部电影通过一个电影ID标识,每条评分数据是一个由用户ID、电影ID、评分值、评分时间组成的四元组,评分值r∈{1,2,3,4,5},稀疏度[18]计算公式见式(21),其中N为评价条数。根据文献[4],将用户年龄分为1~10、11~20、21~30、31~40、41~50、51~60、61~70、71~80,用离散的8个数字标识,同样用离散的整数标识2种性别和21种职业,则最多可将用户分成336组。具体的用户组数目将根据评分数据中涉及的用户根据式(9)进行分组。
图表编号 | XD0025784900 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.28 |
作者 | 谢毅刚、郭卫斌、李建华 |
绘制单位 | 华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院、华东理工大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |