文本大数据抓取与挖掘专题

文本数据是大数据时代的核心数据种类之一，从数据的采集、整理到分析挖掘都形成了独特的一套工具与方法体系。本专题针对实际的大数据需求，从网络文本数据的采集开始，直至利用Python完成文本数据的分析挖掘，帮助零基础的学员逐步深入，渐次学习文本大数据抓取与分析的全部技能，直接升级至业界的**技术前沿。

门课程

人学习

课程总时长

讲师评分：5.0

长久观看

系统化学习

课程内容答疑

第一阶段：网络爬虫设计与网络数据抓取

1门课程37080

在实战中学习如何对新浪、淘宝、微博等网站数据进行抓取，学员将学习如何独立设计相应的网络爬虫，抓取所需的页面数据，满足自身工作和研究中的几乎所有数据抓取需求。

1门课程40920

学习学习Pandas包的使用方法，学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作，为后续进一步进行数据分析建模和数据挖掘打下坚实基础。

1门课程38340

多面学习文本挖掘技术的各个方面，从词袋模型直至目前最热的word2vec，gensim 等均结合实际案例进行学习，学员最终将能够独立使用Python环境完成中文文本挖掘的各种工作。