《表1 DBLP数据中各类数据数量》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《一种基于层次分割和聚合的大数据流水线任务处理方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

某次实验结果如错误!未找到引用源。所示，结果表明，在使用本文方法处理数据的过程中，由于P、IC类型的数据量较少，最先处理完毕并写入Hive数据库，A、IP类型的数据量较多，最后处理完毕写入Hive数据库，同时任务处理的无序性与并行性导致P、IC类型的数据量虽然比B、MT类型的数据量多，但比B、MT类型的数据先处理完毕。与Apache NiFi传统处理方法处理DBLP数据相比，传统方法写Hive数据库的次数总计68525次，本文方法写Hive数据库的次数总计8次，最终导致本文方法处理DBLP数据的速率是Apache NiFi传统处理方法处理速率的7倍多。

图表编号	XD0091303900 严禁用于非法目的
绘制时间	2019.01.20
作者	陈天乐、蒲军、朱小杰、崔文娟、冯伟华、王锐、杜一、周园春
绘制单位	中国科学院计算机网络信息中心、中国科学院大学、中国科学院计算机网络信息中心、中国科学院大学、中国科学院计算机网络信息中心、中国科学院计算机网络信息中心、中国烟草总公司郑州烟草研究院、中国烟草总公司郑州烟草研究院、中国科学院计算机网络信息中心、中国科学院计算机网络信息中心
更多格式	高清、无水印（增值服务）