《表1 采样尺度在时间、空间、普通数据维度上的概念描述》

《表1 采样尺度在时间、空间、普通数据维度上的概念描述》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《ASExplorer:基于联合熵的多维相关性可视分析系统》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

但是对于普通数据维度,缺乏像时间或空间维度那样约定俗成的采样粒度。对此,ASExplorer系统采用数据分组聚合的方式,在普通数据维度建立多层级的采样粒度。例如,对于年龄这一数值型维度,可以划分为三级采样粒度:在第一级采样粒度下不分组;在第二级采样粒度下划分为儿童(0~12岁)、少年(12~18岁)、青年(18~35岁)、中年(35~65岁)、老年(65岁+)共5个分组;在第三级采样粒度下划分为未成年人(0~18岁)、成年人(18岁+)共2个分组。经此处理后,采样位置对应着分组位置,参考单位为当前分组粒度;采样范围对应着分组范围,由开始分组和结束分组唯一确定;采样粒度即当前分组粒度。考虑到在数据预处理时对每个普通数据维度都人为指定采样粒度工作量过大,ASExplorer系统在默认情况下遵照直方图的方式平均划分分组和三级粒度层级。由于在基于联合熵的维度重要性评价算法中,已经为了计算联合熵而在数据预处理阶段构建了紧凑存储的联合直方图,所以采用默认的平均分组策略时并不需要进行额外的计算,直接使用紧凑存储的联合直方图即可计算分组位置、分组范围和分组粒度。最终,在任意数据维度上采样尺度的计算得到了统一描述,如表1所示。