Spark大数据处理及机器学习【基于Python的Spark 2.3**版】

对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。

71545人学习

中级105课时2018/08/28更新

二维码下载学堂APP缓存视频离线看

张敏
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
Python大数据新兵成长之路系列专题
Spark大数据处理及机器学习【基于Python的Spark 2.3**版】
71545人学习
¥399.00
Python3科学计算库Numpy入门视频课程
2350人学习
¥29.00
Python3数据处理Pandas入门视频课程
4089人学习
¥29.00
更 多 4 门 课 程
Spark基础+SparkSql+Spark内核+流数据视频课程套餐
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
8185人学习
¥99.00
【大数据 Spark 2.x 流数据 多案例】Spark Streaming流数据处理基础与提升
7152人学习
¥99.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2573人学习
¥99.00
更 多 4 门 课 程
Spark基础+Spark中级数据处理+Spark内核分析视频课程套餐
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
8185人学习
¥99.00
【大数据 hadoop生态 Spark2.x】深入Spark2.x内核大数据
1970人学习
¥49.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2573人学习
¥99.00
更 多 3 门 课 程
GoldenGate+ETL/Kettle专题(92个项目)
GoldenGate数据库容灾迁移01(OGG同构异构、数据库迁移、数据同步、容灾复制)
161275人学习
¥998.00
GoldenGate数据库容灾迁移02(OGG同构异构、数据库迁移、数据同步、容灾复制)
42385人学习
¥889.00
GoldenGate数据库容灾迁移03(OGG同构异构、数据库迁移、数据同步、容灾复制)
22303人学习
¥889.00
更 多 7 门 课 程
GoldenGate+ETL/Kettle专题(92个项目)
GoldenGate数据库容灾迁移01(OGG同构异构、数据库迁移、数据同步、容灾复制)
161275人学习
¥998.00
GoldenGate数据库容灾迁移02(OGG同构异构、数据库迁移、数据同步、容灾复制)
42385人学习
¥889.00
GoldenGate数据库容灾迁移03(OGG同构异构、数据库迁移、数据同步、容灾复制)
22303人学习
¥889.00
更 多 7 门 课 程
  • 课程介绍
  • 课程大纲

适合人群:

Python Spark 大数据 机器学习 数据挖掘 云计算 人工智能 Docker

你将会学到:

对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。

课程简介:

        自2013年开始出现的大数据概念及伴随出现的以Hadoop,Spark为代表的分布式大数据处理技术,大数据一词让人耳熟能详。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,帮助Python开发人员完成大数据任务。

spark.png

        本课程主要讲解Spark技术,借助Spark对外提供的Python接口,使用Python语言开发。涉及到Spark内核原理、Spark基础知识及应用、Spark基于DataFrame的Sql应用、机器学习及深度学习等内容。由浅到深的带大家深入学习大数据领域最火的项目Spark。帮助大家进入大数据领域,抓住大数据浪潮的尾巴。


    软件版本:     

  • Hadoop2.7.3

  • Spark2.3.0

  • Scala2.11.8

  • Python2.7.12

  • Jdk-8u101-linux-x64

  • Docker 1.12.6

  • Apache-hive-2.3.2-bin

  • Mysql-5.5.45-linux2.6-x86_64

  • Mysql-connector-java-5.1.37-bin


  内容涉及:   

  • pyspark 基础模块

  • pyspark.sql 模块

  • pyspark.ml 基于DataFrame的机器学习模块

  • pyspark.mllib package 基于RDD的机器学习模块

  • 中间还会涉及到云计算中的docker容器技术,课程的学习环境就是使用Docker三个容器搭建的分布式环境

  • pyspark中Numpy、Pandas、Scikit-learn的互操作和相互对比

展开更多

课程大纲-Spark大数据处理及机器学习【基于Python的Spark 2.3**版】

展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部