《表1 3个数据集的统计信息》
首先使用30 min为间隔将每个用户的序列划分为不同会话.然后以30 d作为间隔将movie和book中的会话划分为不同区块,以15 d为间隔将music中的会话划分为不同区块.同时删除出现次数小于20的项目、包含项目数小于3的会话、包含会话数小于2的区块及包含区块数小于3的用户.数据集的统计信息如表1所示,其中“*”处的统计值为平均值.另外,3个数据集的测试集都采用最后3个月的数据,并过滤掉其中没有在训练集中出现的项目以及长度小于3的会话.验证集也均是对应训练集中最后3个月的数据.
图表编号 | XD00129615400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 冯春燕 |
绘制单位 | 北京邮电大学信息与通信工程学院、北京邮电大学先进信息网络北京实验室 |
更多格式 | 高清、无水印(增值服务) |