文本大数据抓取与挖掘专题
文本数据是大数据时代的核心数据种类之一,从数据的采集、整理到分析挖掘都形成了独特的一套工具与方法体系。 本专题针对实际的大数据需求,从网络文本数据的采集开始,直至利用Python完成文本数据的分析挖掘,帮助零基础的学员逐步深入,渐次学习文本大数据抓取与分析的全部技能,直接升级至业界的**技术前沿。
3
门课程
193163
人学习
32小时20分钟
课程总时长
文本数据是大数据时代的核心数据种类之一,从数据的采集、整理到分析挖掘都形成了独特的一套工具与方法体系。 本专题针对实际的大数据需求,从网络文本数据的采集开始,直至利用Python完成文本数据的分析挖掘,帮助零基础的学员逐步深入,渐次学习文本大数据抓取与分析的全部技能,直接升级至业界的**技术前沿。
门课程
人学习
课程总时长
在实战中学习如何对新浪、淘宝、微博等网站数据进行抓取,学员将学习如何独立设计相应的网络爬虫,抓取所需的页面数据,满足自身工作和研究中的几乎所有数据抓取需求。
学习学习Pandas包的使用方法,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。
多面学习文本挖掘技术的各个方面,从词袋模型直至目前最热的word2vec,gensim 等均结合实际案例进行学习,学员最终将能够独立使用Python环境完成中文文本挖掘的各种工作。
课程名称 | 操作 |
零代码玩转网络爬虫!(2021版) | 付费用户专享 |
Python数据分析系列视频课程--学习Pandas | 付费用户专享 |
Python数据分析系列视频课程--学习文本挖掘 | 付费用户专享 |