Spark大数据处理及机器学习【基于Python的Spark 2.3**版】

对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。

5.0 (个评分) 67333人学习

中级 105课时 28小时26分钟 2018/08/28更新

资料下载

二维码 下载学堂APP 缓存视频离线看

    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
Python大数据新兵成长之路系列专题
总价:
695.00
套餐价:
401.78
节省
¥293.22
Python3数据可视化(Matplotlib和Seaborn)
2000人学习
¥69.00
Python3数据处理Pandas入门视频课程
4023人学习
¥29.00
Python3科学计算库Numpy入门视频课程
2323人学习
¥29.00
更 多 5 门 课 程
Spark基础+SparkSql+Spark内核+流数据视频课程套餐
总价:
346.00
套餐价:
269.91
节省
¥76.09
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
7842人学习
¥99.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2443人学习
¥99.00
【大数据 Spark 2.x 流数据 多案例】Spark Streaming流数据处理基础与提升
6985人学习
¥99.00
更 多 4 门 课 程
Spark基础+Spark中级数据处理+Spark内核分析视频课程套餐
总价:
247.00
套餐价:
195.13
节省
¥51.87
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升
7842人学习
¥99.00
【大数据 hadoop生态 Spark2.x】深入Spark2.x内核大数据
1805人学习
¥49.00
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升
2443人学习
¥99.00
更 多 3 门 课 程
大数据运维架构师实战培训专题2.0
总价:
4350.00
套餐价:
3915.00
节省
¥435.00
MySQL数据库工程师入门培训实战教程(从MySQL5.7 到 MySQL8.0)
149052人学习
¥58.00
大数据运维架构师培训(1):Hadoop集群(HDFS,MR,Yarn),Zookeeper集群
19021人学习
¥499.00
大数据运维架构师培训(2):Hbase,Hive, Phoenix,Pig,Impala,Kudu
7275人学习
¥333.00
更 多 12 门 课 程
赵强-大数据课程之从Hadoop到Spark专题
总价:
2059.00
套餐价:
1441.30
节省
¥617.70
赵渝强老师:Hadoop 2.x(一) 大数据基础实战视频课程
64999人学习
¥279.00
赵渝强老师:Hadoop 2.x (二) 大数据进阶实战视频课程
22893人学习
¥199.00
赵渝强老师:Hadoop 2.x (三) 数据分析引擎:Hive视频课程
27902人学习
¥249.00
更 多 11 门 课 程
大数据专题 新人优惠券
  • 课程介绍
  • 课程大纲 试看
  • 讲师好课 29
  • 学员评价

适合人群:

Python Spark 大数据 机器学习 数据挖掘 云计算 人工智能 Docker

课程目标:

对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。

课程简介:

        自2013年开始出现的大数据概念及伴随出现的以Hadoop,Spark为代表的分布式大数据处理技术,大数据一词让人耳熟能详。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,帮助Python开发人员完成大数据任务。

spark.png

        本课程主要讲解Spark技术,借助Spark对外提供的Python接口,使用Python语言开发。涉及到Spark内核原理、Spark基础知识及应用、Spark基于DataFrame的Sql应用、机器学习及深度学习等内容。由浅到深的带大家深入学习大数据领域最火的项目Spark。帮助大家进入大数据领域,抓住大数据浪潮的尾巴。


    软件版本:     

  • Hadoop2.7.3

  • Spark2.3.0

  • Scala2.11.8

  • Python2.7.12

  • Jdk-8u101-linux-x64

  • Docker 1.12.6

  • Apache-hive-2.3.2-bin

  • Mysql-5.5.45-linux2.6-x86_64

  • Mysql-connector-java-5.1.37-bin


   内容涉及:   

  • pyspark 基础模块

  • pyspark.sql 模块

  • pyspark.ml 基于DataFrame的机器学习模块

  • pyspark.mllib package 基于RDD的机器学习模块

  • 中间还会涉及到云计算中的docker容器技术,课程的学习环境就是使用Docker三个容器搭建的分布式环境

  • pyspark中Numpy、Pandas、Scikit-learn的互操作和相互对比

展开更多

课程大纲-Spark大数据处理及机器学习【基于Python的Spark 2.3**版】

资料下载
展开更多

5

条学员评分 超过  “大数据系统”   99%的课程
      展开更多
      加载中
      没有了哦~

      ¥399.00

      立即购买
      关注公众号 领VIP会员
      下次再说

      点击打包下载,即可获取该课程全部资料

      迎新春满300减35 满400减50
      是否单独购买该课程?
      直接购买 去凑单
      在线
      客服
      APP
      下载

      下载Android客户端

      下载iphone 客户端

      官方
      微信

      关注官方微信

      返回
      顶部