【Python版pyspark】Spark大数据基础入门视频课程

Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

3626人学习

中级55课时2018/04/18更新

二维码下载学堂APP缓存视频离线看

张敏
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
  • 课程介绍
  • 课程大纲

适合人群:

Python开发者 大数据从业者 Spark爱好者 数据挖掘

你将会学到:

Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

课程简介:

      【注意:本课程只包含pyspark系列课程的基础入门部分】 

       Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大数据的有力工具。本课程提供细致详尽的Spark API的讲解,以实战的方式帮助广大Python开发人员,使用Spark这一强有力的工具进行数据分析。

        本课程会提供基于Docker的Hadoop及Spark的环境搭建,使用Docker制作Hadoop,Spark镜像一键启动Spark集群。镜像制作简单,并且一次制作,随时随地都能使用镜像一键启动集群。

         通过本课程的学习,能够对Spark的部署及运行原理有非常深刻的了解,并且学习Docker中基本的命令及使用技巧。这门课程是pyspark大数据系列课程中的基础课程,SparkSQL,SparkStreaming,Spark机器学习的内容在单独课程中发布,后续会陆续的发布新的课程。由浅到深的带大家深入学习大数据领域火的项目Spark。帮助大家进入大数据领域,抓住大数据浪潮的尾巴。


    软件版本:     

  • Hadoop2.7.3

  • Spark2.3.0

  • Scala2.11.8

  • Python2.7.12

  • Jdk-8u101-linux-x64

  • Docker 1.12.6

  • Apache-hive-2.3.2-bin

  • Mysql-5.5.45-linux2.6-x86_64

  • Mysql-connector-java-5.1.37-bin


   内容涉及:   

  • pyspark 基础模块

  • 中间还会涉及到云计算中的docker容器技术,课程的学习环境就是使用Docker三个容器搭建的分布式环境

spark.jpg学以致用,一键起飞!

展开更多

课程大纲-【Python版pyspark】Spark大数据基础入门视频课程

展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部