《表1 分块处理数据运行结果》

《表1 分块处理数据运行结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《pandas大数据技术在央行监管中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

设数据总量为N,迭代次数为n,块的大小(ChunkSize)为m,那么前n-1次迭代时,每次都包含m条数据,当第n次迭代时,包含N-m(n-1)条数据。根据上述条件,笔者设分块个数为ChunkCount,那么则有公式ChunkCount=n=N/m(向上取整)。设m的值分别为10 000,50 000,100 000,150 000,300 000,500 000,700 000,1 000 000,1 500 000,2 000 000,根据数据总量N=8 452 237求出ChunkCount,并将各种情况的运行结果分别统计出来,见表1所列。