《表4 处理每个数据集的时间》

《表4 处理每个数据集的时间》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于ANN的改进Spark系统在空管大数据处理中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表3分别列出了5个不同大小的输入数据集中的每一个的Wordcount任务的执行时间以及最佳参数组合。通过表3和表4可以看出,默认配置下,处理大小为50 GB、100 GB、150 GB、200 GB和250 GB的数据分别需要41.27 min、80.99 min、119.43 min、155.48 min和194.66 min,而改进的Spark系统分别只需要28.62 min、55.51 min、74.29 min、96.44 min和119.07 min。结果表明,无论数据集的大小是多少,使用默认参数配置的执行时间都明显高于使用改进Spark系统得到的执行时间,并且平均可以节约35.34%的时间。