Python网络爬虫【共142课时】_深度学习课程-51CTO学堂

唐宇迪金牌讲师讲师评分4.9学员3376797课程85

同济大学硕士，华东理工大学博士，精通机器学习算法，主攻计算机视觉方向，著有《跟着迪哥学Python数据分析与机器学习实战》，线上选课学员30W+，累计开发课程50余门覆盖人工智能热门方向。联...

课程介绍
课程大纲

适合人群：

机器学习，数据领域工作以及要转向人工智能方向的同学们

你将会学到：

学习Python网络爬虫原理与实战

课程简介：

概述：

在人工智能来临的今天，数据显得格外重要。在互联网的浩瀚大海洋中，隐藏着无穷的数据和信息。因此学习网络爬虫是在今天立足的一项必备技能。本路线专门针对想要从事Python网络爬虫的同学而准备的，并且是严格按照企业的标准定制的学习路线。路线从最基本的Python基础开始讲起，到如何借助代码发起网络请求以及将请求回来的数据解析，到后面的分布式爬虫，让你能够系统的学习到一个专业的网络爬虫工程师所具备的所有技能。课程讲解通俗易懂，实战案例丰富，技术栈贴近企业需求。学完后可无缝转移到企业开发中

大纲：

一、爬虫基础：

1. 爬虫介绍及其应用场景。

2. chrome浏览器抓包工具介绍。

3. http协议。

4. urllib网络请求模块。

5. 实战：使用urllib技术实现拉勾网爬虫实战。

6. cookie技术和cookiejar模块。

7. 实战：使用cookiejar技术实现模拟登录爬虫实战。

8. ProxyHandler和ip代理。

9. requests网络请求库。

10. xpath语法和lxml解析。

11. 实战：使用xpath技术实现电影天堂爬虫实战。

12. BeautifulSoup解析库。

13. 实战：使用BeautifulSoup实现中国天气网爬虫实战。

14. 正则表达式和re模块。

15. 实战：使用正则表达式实现中国古诗文网爬虫实战。

16. json文件处理。

17. csv文件处理。

18. excel文件处理。

二、爬虫进阶：

1. 多线程与threading模块。

2. 实战：使用多线程技术实现快速下载图片爬虫实战。

3. ajax异步获取技术介绍。

4. Selenium+PhantomJS获取ajax异步加载的数据。

5. 实战：使用Selenium+PhantomJS技术实现简书爬虫实战。

6. 图形验证码自动识别技术。

7. 实战：使用图形验证码自动识别技术模拟登录知乎网站。

三、Scrapy框架：

1. Scrapy框架介绍。

2. Scrapy Shell介绍。

3. Spider爬虫。

4. CrawlSpider爬虫。

5. Item Pipeline。

6. Request和Response对象。

7. 随机请求头和ip代理池。

8. 实战：使用Scrapy技术实现知名新闻网爬虫实战。

9. 实战：使用Scrapy技术实现知名问答平台爬虫实战。

10. Redis键值对数据库详解。

11. Scrapy-redis分布式组件介绍。

12. 实战：使用Scrapy-redis技术实现知名房源网爬虫实战。

13. 部署Scrapy爬虫。

学习建议：

建议学习过程中，每看一个视频就自己动手实践。把这个视频的知识点学习后再继续下一个知识点。课程内容多而且有深度，切不可为了追求速度而忽略了对知识点的理解。预计学习20天。

展开更多

课程大纲-Python网络爬虫

第1章爬虫前奏(1小时4分钟3节)
1-1
网络爬虫概述
[23:05]开始学习
1-2
http协议和chrome抓包工具
[16:29]开始学习
1-3
http协议和chrome抓包工具（2）
[24:49]开始学习
第2章网络请求(3小时9分钟16节)
2-1
urlib库之urlopen函数用法
[09:43]开始学习
2-2
urllib库之urlretrieve函数用法
[04:35]开始学习
2-3
urllib库之参数编码和解码函数
[10:01]开始学习
2-4
urllib库之urlparse和urlsplit函数用法
[10:17]开始学习
2-5
【实战】用request爬取拉勾网职位信息
[18:36]开始学习
2-6
【作业】内涵段子爬虫作业
[02:14]开始学习
2-7
ProxyHandler实现代理ip
[23:08]开始学习
2-8
cookie原理和格式详解
[13:01]开始学习
2-9
【实战】爬虫使用cookie模拟登录
[14:05]开始学习
2-10
【实战】爬虫自动登录访问授权页面
[22:27]开始学习
2-11
cookie信息的加载与保存
[12:35]开始学习
2-12
request库的基本使用
[18:36]开始学习
2-13
requests发送post请求
[08:14]开始学习
2-14
requests使用代理ip
[11:21]开始学习
2-15
requests处理cookie信息
[08:58]开始学习
2-16
requests处理不信任的ssl证书
[02:02]开始学习
第3章数据解析(8小时22分钟28节)
3-1
xpath简介以及工具安装
[09:00]开始学习

展开更多

“唐宇迪”老师的其他课程更多+

人工智能深度学习入门视频课程
4.9唐宇迪
￥49.00
人工智能-深度学习框架-Tensorflow案例实战视频课程
4.9唐宇迪
￥198.00
人工智能-数学基础视频课程
5.0唐宇迪
￥298.00
【2020新版更新】人工智能-深度学习入门视频课程（下篇）
5.0唐宇迪
￥128.00
【2019新版更新】人工智能-机器学习实战视频课程（上篇）
4.9唐宇迪
￥168.00
大数据:深度学习项目实战视频课程-人脸检测
4.8唐宇迪
￥128.00
Python数据分析(机器学习)经典案例视频课程
4.9唐宇迪
￥198.00
自然语言处理-Word2Vec视频教程
4.9唐宇迪
￥89.00
深度学习论文算法详解视频课程
4.7唐宇迪
￥128.00
大数据——机器学习视频课程（下篇）
4.8唐宇迪
￥198.00
大数据——深度学习框架Caffe使用案例视频课程
4.9唐宇迪
￥128.00

课程介绍
课程大纲

在线
客服

APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部