《表1 实验结果Tab.1 Experimental results》

《表1 实验结果Tab.1 Experimental results》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《空气质量监测大数据区间的统计问题》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在数据的写入过程中,当Region的数量分别为3、5、7、9、11时,对存储NO2实时浓度数据的列RTData按0.00~41.00μg/m3,43.05~82.00μg/m3,84.05~123.00μg/m3,125.05~164.00μg/m3,166.05~205.00μg/m3进行区间统计,参数为:地区码4201,站点编码为空,表示统计该地区下的所有站点(9个子站+城区),统计时间段覆盖所有Region。为减少客户端Scan统计过程RPC调用,可以为Scan操作设置一个扫描缓存值,表示一次RPC调用可以从服务端读取的行数,从而减少客户端RPC请求次数,但扫描缓存值不能设置太高,否则会过多消耗客户端内存,严重时还会导致内存溢出,且延长next操作的时间,反而降低了查询效率。扫描缓存值的设置需要在减少RPC请求及客户端内存消耗之间取得平衡,实验中将扫描缓存值设置为256。客户端Scan的统计过程的具体实现算法类似于区间统计协处理器,这里不再具体描述。各区间值统计的结果,使用协处理器进行区间统计及客户端Scan进行统计所需的时间如表1所示,时间对比如图4所示。