《表2 代理池性能测试实验》

《表2 代理池性能测试实验》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向网络爬虫的高可用动态池系统设计与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

访问延时因子阈值w经验设为0.9,通过w剔除比较慢的代理。Java定时器的时间间隔设定为1小时,池中的最小代理IP数阈值v设定为100,当代理池中的代理不足v个则调用代理IP采集模块从代理源Web爬取最新的代理IP并合并更新至Redis高速存储区。通过代理池访问六个网站的实验重复1000次,具体结果详见表2。从实验结果看,代理池的效率较高,连通率接近100%,响应速度较快。