《表1 两种采集模式性能比较》

《表1 两种采集模式性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《分布式主题舆情采集与分析系统设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以下对比分布式采集模式与单机采集模式的性能。分布式采集系统利用5台机器搭建,1台部署Spider Master,其余4台部署Spider Slave,采用相同的机器配置:CPU为酷睿i3-2100,内存为4GB(DDR3-1333MHz),磁盘容量为250GB(SATA)。局域网出口带宽为100Mb/s,交换机上下行带宽均为100Mb/s。单机采集系统仅用1台上述机器实现。系统调试成功后,设置Seed页面数为5个,depth为10,节点线程数为5,top N为100。选取关键词主题模式并手动输入关键词,分别运行15、30和60min进行实验,分布式采集与单机采集处理的链接数Ld和Ls如表1所示。