《表1“德国纽伦堡体育馆足球比赛数据集”数据流乱序情况统计》

《表1“德国纽伦堡体育馆足球比赛数据集”数据流乱序情况统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于混合处理模型的乱序数据流分布式聚合查询处理技术》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验使用的集群由3个计算节点构成,每个计算节点的配置是双核CPU、2GB内存,运行64位的Linux(Ubuntu 16.04)操作系统。参数设置方面,参照文献[16]的参数设置方法,将HPM涉及的PD控制器的输入参数Kp和Kd的值分别设置为0.2和4;将HPM批处理模块触发条件判定时用到的参数Γ设定为5s;将用户给定的查询结果质量要求设置为(0.05,0.05);并将聚合查询的滑动窗口大小和滑动步长分别设置为0.5s和0.1s。在查询设置方面,以连续聚合查询SUM为测试对象。由于分布式计算环境下单机聚合查询的计算量不是主要代价,因而对聚合查询SUM的实验测试结论也同样适用于解释对其他聚合查询(例如COUNT、MEDIAN、QUAN-TILE和AVERAGE)的处理效果。实验数据方面,使用“德国纽伦堡体育馆足球比赛数据集(RTLS)”[21]中两条真实的乱序数据流Game 1和Game 2进行,如表1所示,与Game 1相比,Game 2拥有更高的晚到流元组个数、流元组最大延迟值、流元组平均延迟值和晚到流元组比率值,因而乱序程度更高。为了便于描述,实验部分将本文所提出的基于HPM的乱序数据流分布式聚合查询处理技术简记为△HPM。