【Python版pyspark】Spark大数据基础入门视频课程

Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

3626人学习

中级55课时2018/04/18更新

二维码下载学堂APP缓存视频离线看

张敏
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
Python大数据新兵成长之路系列专题
Spark大数据处理及机器学习【基于Python的Spark 2.3**版】
71545人学习
¥399.00
Python3科学计算库Numpy入门视频课程
2350人学习
¥29.00
Python3数据处理Pandas入门视频课程
4089人学习
¥29.00
更 多 4 门 课 程
Spark基础+SparkSql+Spark内核+流数据视频课程套餐
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
8185人学习
¥99.00
【大数据 Spark 2.x 流数据 多案例】Spark Streaming流数据处理基础与提升
7152人学习
¥99.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2573人学习
¥99.00
更 多 4 门 课 程
Spark基础+Spark中级数据处理+Spark内核分析视频课程套餐
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
8185人学习
¥99.00
【大数据 hadoop生态 Spark2.x】深入Spark2.x内核大数据
1970人学习
¥49.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2573人学习
¥99.00
更 多 3 门 课 程
GoldenGate+ETL/Kettle专题(92个项目)
GoldenGate数据库容灾迁移01(OGG同构异构、数据库迁移、数据同步、容灾复制)
161563人学习
¥998.00
GoldenGate数据库容灾迁移02(OGG同构异构、数据库迁移、数据同步、容灾复制)
42387人学习
¥889.00
GoldenGate数据库容灾迁移03(OGG同构异构、数据库迁移、数据同步、容灾复制)
22306人学习
¥889.00
更 多 7 门 课 程
GoldenGate+ETL/Kettle专题(92个项目)
GoldenGate数据库容灾迁移01(OGG同构异构、数据库迁移、数据同步、容灾复制)
161563人学习
¥998.00
GoldenGate数据库容灾迁移02(OGG同构异构、数据库迁移、数据同步、容灾复制)
42387人学习
¥889.00
GoldenGate数据库容灾迁移03(OGG同构异构、数据库迁移、数据同步、容灾复制)
22306人学习
¥889.00
更 多 7 门 课 程
  • 课程介绍
  • 课程大纲

适合人群:

Python开发者 大数据从业者 Spark爱好者 数据挖掘

你将会学到:

Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

课程简介:

      【注意:本课程只包含pyspark系列课程的基础入门部分】 

       Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

        本课程会提供基于Docker的Hadoop及Spark的环境搭建,使用Docker制作Hadoop,Spark镜像一键启动Spark集群。镜像制作简单,并且一次制作,随时随地都能使用镜像一键启动集群。

         通过本课程的学习,能够对Spark的部署及运行原理有非常深刻的了解,并且学习Docker中基本的命令及使用技巧。这门课程是pyspark大数据系列课程中的基础课程,SparkSQL,SparkStreaming,Spark机器学习的内容在单独课程中发布,后续会陆续的发布新的课程。由浅到深的带大家深入学习大数据领域火的项目Spark。帮助大家进入大数据领域,抓住大数据浪潮的尾巴。


    软件版本:     

  • Hadoop2.7.3

  • Spark2.3.0

  • Scala2.11.8

  • Python2.7.12

  • Jdk-8u101-linux-x64

  • Docker 1.12.6

  • Apache-hive-2.3.2-bin

  • Mysql-5.5.45-linux2.6-x86_64

  • Mysql-connector-java-5.1.37-bin


   内容涉及:   

  • pyspark 基础模块

  • 中间还会涉及到云计算中的docker容器技术,课程的学习环境就是使用Docker三个容器搭建的分布式环境

spark.jpg学以致用,一键起飞!

展开更多

课程大纲-【Python版pyspark】Spark大数据基础入门视频课程

展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部