《表2 3个数据集的统计信息》
本文用到的数据集都包括用户-电影评分信息,以及用户和电影的属性信息,包括用户性别、用户年龄、用户职业、电影名称、电影类别、上映时间等,评分值在1到5之间,且每个用户至少评分过20部电影。MovieLens100K数据集包含了943位用户对1 682部电影的100 000条评分信息,MovieLens1M数据集中包含6 040位用户对3 900部电影的1 000 209条评分数据。MovieLens10M数据集包含71 567位用户对10 681部电影的10 000 054条评分,本文从中随机抽取10 000名用户对10 681个物品的评分记录作为训练集和测试集的数据。表2统计这3个数据集的相关信息。
图表编号 | XD00165378900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 赵传、张凯涵、梁吉业 |
绘制单位 | 山西大学计算机与信息技术学院、山西大学计算智能与中文信息处理教育部重点实验室、山西大学智能信息处理研究所、山西大学计算机与信息技术学院、山西大学计算智能与中文信息处理教育部重点实验室、山西大学智能信息处理研究所、山西大学计算机与信息技术学院、山西大学计算智能与中文信息处理教育部重点实验室、山西大学智能信息处理研究所 |
更多格式 | 高清、无水印(增值服务) |