爬虫基础复习3：正则表达式复习与编写技巧总结-51CTO学堂

{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }} {{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }} {{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}

提问 {{ interaction.noteNum > 0 ? interaction.noteNum + '篇笔记' : '记笔记' }} 离线观看

下载学堂APP

缓存视频离线看

报告问题离线观看

下载学堂APP

缓存视频离线看

课程介绍

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

适合人群

对Python感兴趣的零基础同学各个专业的大学生企业乐于提高自己的员工终身学习者对爬虫感兴趣的朋友

你将会学到

掌握金融商业爬虫及数据挖掘技巧、培养数据化思维提升工作效率、掌握金融科技基础分析能力

课程简介

本课程是《Python金融大数据挖掘与分析》系列课的第2版块，主要介绍Python爬虫的基础知识，并对百度新闻进行深度挖掘，包括批量获取多个公司的百度新闻、自动生成数据报告、自动异常处理、24小时实时数据挖掘、批量爬取多个网页等多个知识点，从而初步搭建简易舆情监控系统。

之后将讲解搜狐新闻 & 新浪财经 & 新浪微博 & 中国证券报等网站的数据挖掘，深入熟悉了解Python商业爬虫相关知识点。之后我们会讲解常见的数据清洗优化技巧：数据清洗、日期统一、文本内容深度过滤、数据乱码问题处理，之后还会通过jieba实现爬虫数据中文分词并绘制相关词云图。最后会介绍一个完整的舆情监控评分系统，使大家更好的熟悉爬虫的文本分析技巧。

课程特色

亮点1：零基础入门Python爬虫，案例为王

（1）只需初中以上的数学及英语基础，即可快速入门Python爬虫世界，教学通俗易懂，适合零基础学习；

（2）在入门后会通过多个实际商业案例来真正学以致用，手把手教你搭建一套初步的舆情监控系统。

亮点2：配套书籍 + 源代码文件

（1）配套书籍（感兴趣的可淘宝/京东等搜索“王宇韬”购买）：

《Python金融大数据挖掘与分析全流程详解》与

《Python大数据分析与机器学习商业案例实战》等相关书籍

（2）提供所有源代码文件及相关辅助材料。

亮点3：配套练习

（1）章节都提供相关练习题方便练习，巩固相关知识点；

展开更多