《表1 两种采集模式性能比较》
以下对比分布式采集模式与单机采集模式的性能。分布式采集系统利用5台机器搭建,1台部署Spider Master,其余4台部署Spider Slave,采用相同的机器配置:CPU为酷睿i3-2100,内存为4GB(DDR3-1333MHz),磁盘容量为250GB(SATA)。局域网出口带宽为100Mb/s,交换机上下行带宽均为100Mb/s。单机采集系统仅用1台上述机器实现。系统调试成功后,设置Seed页面数为5个,depth为10,节点线程数为5,top N为100。选取关键词主题模式并手动输入关键词,分别运行15、30和60min进行实验,分布式采集与单机采集处理的链接数Ld和Ls如表1所示。
图表编号 | XD00193793800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.15 |
作者 | 董富江、张文学 |
绘制单位 | 宁夏医科大学理学院、宁夏医科大学理学院 |
更多格式 | 高清、无水印(增值服务) |