《表3 不同环境不同数据量下时空数据存储时间》

《表3 不同环境不同数据量下时空数据存储时间》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于HDFS+Spark的时空大数据存储与处理——以智慧无锡时空大数据为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从实验结果可以看出,当时空数据集大小为500 M时,单机环境下数据存储时间为8秒,耗时最少,相比之下存储性能效率最高。这是因为数据量较少时,Hadoop集群中涉及到多个节点之间的数据交换,并且会自动进行数据备份,存在较为固定的数据传输时间和数据备份时间消耗。随着数据量增加到1.8 G、10 G,集群环境下的存储效率优势得到了明显的体现。尤其当时空数据增加到10 G时,单机环境下的耗时明显增加,为500 M数据耗时的103倍。这是由于单机环境的硬件配置受限所导致的,而在集群环境下,随着存储量增大,而其固定的时间消耗占比逐渐减小至可忽略不计,这时才能体现出集群环境下时空大数据存储的优势。