专题 > 大数据 > 数据挖掘 > 文本大数据抓取与挖掘专题

文本大数据抓取与挖掘专题

文本数据是大数据时代的核心数据种类之一,从数据的采集、整理到分析挖掘都形成了独特的一套工具与方法体系。 本专题针对实际的大数据需求,从网络文本数据的采集开始,直至利用Python完成文本数据的分析挖掘,帮助零基础的学员逐步深入,渐次掌握文本大数据抓取与分析的全部技能,直接升级至业界的最新技术前沿。

3

门课程

163

人学习

 

课程总时长:30小时17分钟

授课讲师:张文彤

打包优惠
 
大牛讲解
 
一键下载
 
讲师24h答疑
专题价 ¥285
折上8折 ¥228
总价 ¥477

第一阶段:  网络爬虫设计与网络数据抓取

在实战中学习如何对新浪、淘宝、微博等网站数据进行抓取,学员将学习如何独立设计相应的网络爬虫,抓取所需的页面数据,满足自身工作和研究中的几乎所有数据抓取需求。

1门课程 11小时58分钟
  • 不会写代码?照样玩转网络爬虫!

    61节 11小时58分钟
    课程目标:
    本课程内容已全部发布,未来将根据学员反馈不定期更新。【学员基础】有EXCEL之类的Office软件使用经验即可,不要求事先接触/使用过网页抓取工具。【课程大纲】序章:网络爬虫,有啥可怕,不写代码,照样干翻!案例一:先拿某浪新闻开刀案例二:双11之后伸向某宝的黑手案例三:微博很牛?照样搞定!案例四:微信公号,统统拿下!尾声:我们和专业爬虫工程师相比还差什么?彩蛋:如果你需要高速抓取静态页面网站【课程长度】总时长:12小时【视频清晰度】1080P,请学习时在播放器右下角将视频清晰度调为超清格式。

第二阶段:  数据预处理

学习学习Pandas包的使用方法,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。

1门课程 8小时4分钟
  • Python数据分析系列视频课程--玩转Pandas

    57节 8小时4分钟
    课程目标:
    Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准,掌握其使用方法,是使用Python进行数据分析和数据挖掘的必备条件。本课程将从中国高校综合排名和北京PM2.5实测数据两个实际案例出发,在实战中学习Pandas包的使用方法。学习完本课程后,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,掌握如何使用统计图表工具进行数据信息呈现,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。本课程已全部连载完成,未来将根据Pandas功能的变化不定期更新内容。【课程长度】总时长:8小时【学员基础】学员需要懂得Python语言的基本编程知识。学员事前不要求掌握统计分析的基本知识。学员事前不要求有任何统计软件的使用经验。【课程大纲】第1章:工具准备第2章:数据的导入与导出第3章:变量列的基本操作第4章:胖哒黑魔法:索引第5章:案例行的基本操作第6章:变量变换第7章:文件级别的数据管理第8章:数据清洗第9章:处理日期时间变量第10章:数据的图形展示第11章:数据特征的分析探索第12章:北京PM2.5数据分析

第三阶段:  文本数据的挖掘分析

全面学习文本挖掘技术的各个方面,从词袋模型直至目前最热的word2vec,gensim 等均结合实际案例进行学习,学员最终将能够独立使用Python环境完成中文文本挖掘的各种工作。

1门课程 10小时14分钟
  • Python数据分析系列视频课程--玩转文本挖掘

    63节 10小时14分钟
    课程目标:
    文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,其所涉及的人机对话系统,推荐算法,文本分类等技术在BAT等企业中都得到广泛应用。本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。本次课程将会从最基础的分词、词袋模型、分布式表示等概念开始,全面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员从零基础直接升级至业界的最新技术前沿。学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。本课程已全部更新完毕,未来将根据方法学的最新进展做不定期更新。【课程长度】总时长:约11小时【学员基础】学员需要懂得Python语言的基本编程知识。建议学员事先学习本系列课程中的Pandas课程,本课程中的数据管理将会用到Pandas的相关知识和操作。【课程大纲】第1章:文本挖掘概述第2章:磨刀不误砍柴工第3章:分词第4章:词云展示第5章:文档信息的向量化第6章:关键词提取第7章:抽取文本主题第8章:文本相似度第9章:文档分类第10章:情感分析第10章:自动摘要第11章:自动写作

文本大数据抓取与挖掘专题

¥477 ¥228
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

返回
顶部