《表1 DBLP数据中各类数据数量》

《表1 DBLP数据中各类数据数量》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于层次分割和聚合的大数据流水线任务处理方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

某次实验结果如错误!未找到引用源。所示,结果表明,在使用本文方法处理数据的过程中,由于P、IC类型的数据量较少,最先处理完毕并写入Hive数据库,A、IP类型的数据量较多,最后处理完毕写入Hive数据库,同时任务处理的无序性与并行性导致P、IC类型的数据量虽然比B、MT类型的数据量多,但比B、MT类型的数据先处理完毕。与Apache NiFi传统处理方法处理DBLP数据相比,传统方法写Hive数据库的次数总计68525次,本文方法写Hive数据库的次数总计8次,最终导致本文方法处理DBLP数据的速率是Apache NiFi传统处理方法处理速率的7倍多。