[老汤]Spark 2.x精讲套餐
由浅入深的精讲Spark 2.x中的Spark Core(RDD)、Spark SQL(DataFrame & Dataset)、Spark Streaming、Spark内核原理四个方面
16
门课程
124400
人学习
课程总时长
分别从以下四步轻而易举的学习Spark 2.x的核心编程: 正确理解Spark 、RDD API 、正确提交Spark应用、Spark job核心原理
学习Spark SQL的前生今世及未来,从而达到思想上入门Spark SQL、详细并且多面的学习Spark SQL所有的应用点、Spark SQL兼容Hive
首先站在使用的层面学习Spark Streaming的编程模型;然后深入到讲解Spark Steaming的性能与稳定、容错与语义;最后站在实践的层面上来讲解Spark Streaming在实时流处理
分别从内核的级别讲解Spark 2.x的序列化机制、内存管理、存储管理以及shuflle管理