《表1 数据处理的内容:基于用户日志的OPAC推荐系统设计与实现》
虽然日志数据在采集时经过一定的筛选,但由于网络、浏览器和系统性能等原因,采集的数据可能存在不完整或重复采集等问题,这些无效的数据会影响数据分析的结果,造成推荐内容匹配度低。因此,在数据分析前,需要进行细致的数据处理。数据处理包括三方面的内容:一是删除不完整的数据;二是规范数据格式;三是甄别重复的用户请求,去掉由于误操作或网络爬虫产生的一些批量请求,进而保证数据的真实性。数据处理的内容见表1。
图表编号 | XD0042386300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.25 |
作者 | 唐乐、李向前 |
绘制单位 | 西南交通大学图书馆、西南交通大学图书馆 |
更多格式 | 高清、无水印(增值服务) |