《表1 网站日志文件会话集片段》

《表1 网站日志文件会话集片段》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《医院网站日志挖掘数据预处理的研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用SQL2000数据库技术删除音频等数据,得到32 500多条医院网站访问记录,清除率为80%。网页唯一性编码共计1 850多个,即为经过数据过滤后该日用户浏览的所有界面集合。对这些记录进行会话识别和补充,得到2 800多个不同会话,见表1。其中:time表示当日时间;no表示该用户访问医院网页对应的编码;ping表示融合IP地址、浏览器和操作系统等内容的字段;work表示区分会话字段。若ping相同,用户会话会分割记录点,两者time字段相差≥25.5 min,即分为两个会话记录。