《表3 TalkingData数据集中用户行为排在前20名的用户信息》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于经验分布和KL散度的协同过滤推荐质量评价研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在进行实验时，由于数据量庞大，为了推荐实际结果的可用性起见，本文对上述数据进行了筛选（表3）。在原始数据中，用户每次对App产生行为时就会自动生成一次事件，这些行为包括利用App接入互联网、使用新的App、删除旧的App等等。该事件中包含着用户的行为时间信息（具体到秒为单位），用户此时正在使用的App（包括了后台开启行为）。在对用户的行为次数进行了统计、排序之后，为了尽量减少数据稀疏性带来的影响，本文选择了行为次数在500～1 000的总计2 020名用户作为实验数据集。其原因是这些用户的行为次数处于所有用户行为次数的中间，行为较为规律且相对比较稳定，既不会固守已经使用的App不变，也不会进行盲目跟风使用，数据相对来说具有代表性。而这2 020名用户中，有250名用户使用的App数量小于10，对于App的推荐来说，这些用户本身的信息不足以产生合理的推荐，所以剔除这250名用户，选择余下的1 770名用户作为本文的实验对象。对这1 770名用户的个人信息、动态行为进行汇总后，作为本文研究的实验数据集。

图表编号	XD0067696500 严禁用于非法目的
绘制时间	2019.09.01
作者	张文、姜祎盼、张思光、崔杨波、杜宇航
绘制单位	北京化工大学经济管理学院、北京化工大学经济管理学院、中国科学院科技战略咨询研究院、北京化工大学经济管理学院、北京化工大学经济管理学院
更多格式	高清、无水印（增值服务）