《表2 导出的数据集合:Web站点的点击流数据分析方法的设计与实现》
这个数据集合是一个事务数据库,在这里网页的点击顺序是很重要的,认识产生这个序列的模式就是数据分析的目的。这个数据集合包括近10万个观测数据,每个观测数据对应一个点击。这个数据集合描述了10 294个用户在组成这个电子商店的32个网页上的浏览路径。像表1形式的数据集合可以直接使用,它决定了关联和序列规则,表中行数就是点击的次数。但这种方法会使分析的海量数据更加庞大。另一种方法是使用一个称为Exports的导出数据集合,它由会话组织而成,包含描述每个会话特征的变量,这些变量包括重要的定量变量,比如服务器会话的整个持续时间(Length)、在一个会话内点击的总次数(Clicks)和会话开始的时间Start。更重要的分析是这个数据集合中包含描述每一个网页是否被访问过的二值变量,如果至少访问过一次,则值为1,否则为0。表2列出了Exports数据库中的部分数据,这和表1中的会话相对应。
图表编号 | XD0079770000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.25 |
作者 | 梁志恒 |
绘制单位 | 沈阳师范大学科信软件学院 |
更多格式 | 高清、无水印(增值服务) |