- 畅销套餐
- 精选套餐
- 人气套餐
- 尊享套餐
- 高薪套餐

















- 课程介绍
- 课程大纲 试看
- 讲师好课 136
适合人群:
本课程适合已经掌握了Spark Core内容的学员。
课程目标:
学习并学习Spark SQL的基础知识,并熟练学习如何使用Spark SQL操作不同的数据源。并学习在集成开发工具中开发Spark SQL的程序。
课程简介:
Spark SQL 是一个用来处理结构化数据的spark组件。它提供了一个叫做DataFrames的可编程抽象数据模型,并且可被视为一个分布式的SQL查询引擎。
赵渝强老师博客地址:http://collen7788.blog.51cto.com/
《赵渝强老师:Spark系列视频课程》
===================================================
1、Spark系列视频课程之一:Scala编程语言
https://edu.51cto.com/course/6724.html
2、Spark系列视频课程之二:Spark Core
https://edu.51cto.com/course/10698.html
3、Spark系列视频课程之三:Spark SQL
https://edu.51cto.com/course/10796.html
4、Spark系列视频课程之四:Spark Streaming
https://edu.51cto.com/course/11066.html
5、Spark系列视频课程之五:Spark Structured Streaming
即将发布
===《Spark系列视频课程之三:Spark SQL》课程大纲===
一、Spark SQL基础
1、Spark SQL的简介
2、基本概念:DataSets和DataFrames
3、创建DataFrames
4、DataFrames操作
5、Global Temporary view
6、创建DataSets
7、DataSets的操作案例
二、使用数据源
1、通用的load/save函数
2、Parquet文件
3、JSON文件
4、使用JDBC
5、使用Hive Table
三、性能的优化
1、在内存中的缓存数据
2、性能优化相关参数
四、在IDEA中开发Spark SQL程序
1、案例一:指定的Schema的格式
2、案例二:使用case class
3、案例三:将数据保存到关系型数据库中
课程大纲-赵渝强老师:Spark 2 系列视频课程之三:Spark SQL
资料下载-
第1章 Spark SQL基础 (2小时15分钟 8节)
-
第2章 使用数据源 (1小时22分钟 5节)
-
第3章 性能的优化 (27分钟 2节)
-
第4章 在IDEA中开发Spark SQL程序 (35分钟 3节)