《表1 数据处理的内容:基于用户日志的OPAC推荐系统设计与实现》

《表1 数据处理的内容:基于用户日志的OPAC推荐系统设计与实现》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于用户日志的OPAC推荐系统设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

虽然日志数据在采集时经过一定的筛选,但由于网络、浏览器和系统性能等原因,采集的数据可能存在不完整或重复采集等问题,这些无效的数据会影响数据分析的结果,造成推荐内容匹配度低。因此,在数据分析前,需要进行细致的数据处理。数据处理包括三方面的内容:一是删除不完整的数据;二是规范数据格式;三是甄别重复的用户请求,去掉由于误操作或网络爬虫产生的一些批量请求,进而保证数据的真实性。数据处理的内容见表1。