![]() ![]() |
网络爬虫开发
本书的基本框架分为八个项目,项目一、初识爬虫,包括认识爬虫,以及网站robots协议和反爬虫技术三个学习任务;项目二、网页基础,包括HTTP原理、网页基础知识、会话和COOKIE机制、谷歌浏览器开发者工具的使用等四个学习任务;项目三、Python基础,包括搭建python开发环境、python基础语法等六个任务。项目四、常用爬取库,包括认识HTTP请求、urllib网络请求库基础、初识requests网络请求库三个学习任务;项目五、常用解析库,包括网页解析基础、XPath解析网页、BS解析网页、PyQuery解析库四个学习任务。项目六、数据存储,包括数据存储在文本文件、实战案例篇;关系型数据库介绍、Mysq数据库的安装与启九个学习任务;项目七、动态网页数据爬取,包括动态网页的含义、Selenium的安装和使用案例、AJAX的概念和AJAX的分析方法、AJAX分析与爬取实战四个学习任务。高级篇:项目八Scrapy爬虫框架,包括Scrapy安装与使用、案例分析两个学习任务。
你还可能感兴趣
我要评论
|