《表3 不同环境不同数据量下时空数据存储时间》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于HDFS+Spark的时空大数据存储与处理——以智慧无锡时空大数据为例》
从实验结果可以看出,当时空数据集大小为500 M时,单机环境下数据存储时间为8秒,耗时最少,相比之下存储性能效率最高。这是因为数据量较少时,Hadoop集群中涉及到多个节点之间的数据交换,并且会自动进行数据备份,存在较为固定的数据传输时间和数据备份时间消耗。随着数据量增加到1.8 G、10 G,集群环境下的存储效率优势得到了明显的体现。尤其当时空数据增加到10 G时,单机环境下的耗时明显增加,为500 M数据耗时的103倍。这是由于单机环境的硬件配置受限所导致的,而在集群环境下,随着存储量增大,而其固定的时间消耗占比逐渐减小至可忽略不计,这时才能体现出集群环境下时空大数据存储的优势。
图表编号 | XD00110616100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 贾旖旎、周新民、曹芳 |
绘制单位 | 无锡市自然资源和规划局、武大吉奥信息技术有限公司、武大吉奥信息技术有限公司 |
更多格式 | 高清、无水印(增值服务) |