《表4 处理每个数据集的时间》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于ANN的改进Spark系统在空管大数据处理中的应用》
表3分别列出了5个不同大小的输入数据集中的每一个的Wordcount任务的执行时间以及最佳参数组合。通过表3和表4可以看出,默认配置下,处理大小为50 GB、100 GB、150 GB、200 GB和250 GB的数据分别需要41.27 min、80.99 min、119.43 min、155.48 min和194.66 min,而改进的Spark系统分别只需要28.62 min、55.51 min、74.29 min、96.44 min和119.07 min。结果表明,无论数据集的大小是多少,使用默认参数配置的执行时间都明显高于使用改进Spark系统得到的执行时间,并且平均可以节约35.34%的时间。
图表编号 | XD00199345300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 潘卫军、刘皓晨、王润东、胡博文 |
绘制单位 | 中国民用航空飞行学院空中交通管理学院、中国民用航空飞行学院空中交通管理学院、中国民用航空飞行学院空中交通管理学院、中国民用航空飞行学院空中交通管理学院 |
更多格式 | 高清、无水印(增值服务) |