《表1 日志片段中的符号含义》
通过对所选取的数据集(该数据集来源于data tang.com共享平台)中的1000个用户的日志文件进行清洗、过滤等预处理。接着,把从数据集中抽取的12个用户(其中这12个用户在数据集中的序号为87,89,91,170,177,450,656,665,741,773,776,898)的日志信息作为分析对象:首先计算用户间的相似度,然后进行聚类。样本数据包中的数据文件可分为2部分,其中behavior文件夹中是按日期归档的样本行为日志,demographic.csv是样本的人口属性信息,二者可通过样本ID关联。图1展示了一个典型的日志片段,表1表示了该日志片段中各符号代表的含义。
图表编号 | XD008457400 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.10 |
作者 | 贾小贝、方欢 |
绘制单位 | 安徽理工大学数学与大数据学院、安徽理工大学数学与大数据学院 |
更多格式 | 高清、无水印(增值服务) |