本书分为4个部分:第一部分对网络爬虫做了概要性的介绍,主要介绍了网络爬虫的常识和所涉及的技术概览;第二部分是本书的重点之一,详细讲解了网络爬虫的核心技术,包括网络爬虫的实现原理与实现技术、Urllib库和URLError库的异常处理、正则表达式与Cookie的使用、Fiddler的使用、爬虫的浏览器伪装技术、爬虫的定向爬取技术等;第三部分讲解了最流行的爬虫框架Scrapy的使用、架构和高级应用,是目前关于Scrapy最详细的讲解;第四部分是3个实战案例,讲解了博客爬虫、图片爬虫和模拟登陆爬虫的编写方法。

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。