Object对象

2016 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
对大数据有基本的了解,已掌握了Hadoop的学员;并想进一步学习Spark的学员。
你将会学到
Spark课程,让学员从基础的Scala编程语言开始学习,从而进一步学习Spark生态圈组件。
课程简介

Spark课程,让学员从最基础的Scala编程语言开始学习,从而进一步学习Spark Core、Spark SQL、Spark Streaming的内容。



赵渝强老师:大数据系列视频课程

=========================

1、Hadoop大数据迅速学习高级应用系列套餐

      https://edu.51cto.com/topic/1155.html    


2、Spark 2系列课程视频套餐

      https://edu.51cto.com/topic/1258.html 


3、大数据消息(Kafka)与实时处理(Storm)系统系列套餐

      https://edu.51cto.com/topic/1003.html 


4、NoSQL 数据库实战系列视频课程专题(上)

      https://edu.51cto.com/topic/955.html 


5、NoSQL 数据库实战系列视频课程专题(下)

      即将发布


====大数据处理引擎Spark课程大纲====

第一章:课程概述与Linux基础
(01)Spark从基础开始
(02)安装Linux的实验环境
(03)Linux的配置与课程概述
(04)使用vi编辑器
(05)Linux的常用命令和JDK的安装
(06)案例:分析Java的死锁


第二章:Scala编程基础
(07)Scala简介和配置
(08)Scala中数据的类型
(09)变量、函数、条件判断
(10)Scala中的循环
(11)函数的参数
(12)懒值和异常处理
(13)数组
(14)元组和映射


第三章:Scala的面向对象编程
(15)Scala面向对象语言概述
(16)面向对象的概念和类的定义
(17)属性的get和set方法
(18)内部类
(19)类的构造器
(20)Object对象
(21)类的apply方法
(22)继承
(23)trait
(24)包和包对象


第四章:Scala的函数式编程

(25)Scala语言的函数式编程概述
(26)Scala的函数和匿名函数
(27)带函数参数的函数
(28)闭包
(29)柯里化
(30)高阶函数示例


第五章:Scala的集合

(31)可变集合和不可变集合
(32)可变列表和不可变列表
(33)序列
(34)集Set
(35)模式匹配
(36)样本类


第六章:Scala的高级特性

(37)泛型类
(38)泛型函数
(39)上界和下界
(40)视图界定
(41)协变和逆变
(42)隐式转换函数
(43)隐式参数和隐式类


第七章:Spark的体系结构与安装配置

(44)Spark Core课程概述
(45)什么是Spark和特点
(46)Spark的体系结构
(47)安装和部署Spark环境
(48)基于文件目录的单点故障恢复
(49)基于ZooKeeper的Spark HA的实现
(50)利用ZooKeeper实现分布式锁


第八章:执行Spark任务

(51)使用spark-submit提交spark任务
(52)使用spark-shell交互式命令行工具
(53)开发Scala版本的WordCount程序
(54)开发Java版本的WordCount程序
(55)分析WordCount程序的执行过程
(56)Spark提交任务的流程


第九章:RDD和RDD的算子

(57)什么是RDD
(58)RDD的算子
(59)RDD基本算子示例
(60)RDD的缓存机制
(61)RDD的容错机制
(62)RDD的依赖关系和Spark任务中的Stage
(63)高级算子:mapPartitionsWithIndex
(64)高级算子:aggregate
(65)高级算子:aggregate(1)
(66)高级算子:aggregate(2)
(67)高级算子:aggregateByKey
(68)高级算子:coalesce和repartition


第十章:Spark RDD编程案例

(69)案例一:求网站访问量
(70)案例二:自定义分区28:55
(71)案例三:访问关系型数据库29:58
(72)案例四:使用JdbcRDD


第十一章:Spark SQL基础

(73)Spark SQL课程概述
(74)什么是Spark SQL?
(75)通过case class创建DataFrame
(76)通过SparkSession创建DataFrame
(77)通过带格式的文件创建DataFrame
(78)操作DataFrame
(79)临时视图
(80)DataSet简介


第十二章:Spark SQL的数据源

(81)load和save函数
(82)什么是Parquet文件
(83)Parquet文件Schema的合并
(84)读取JSON文件
(85)使用JDBC数据源
(86)访问HiveTable
(87)指定schema的格式
(88)使用caseclass
(89)保存到关系型数据库中
(90)SparkSQL性能的优化


第十三章:Spark Streaming基础

(91)SparkStreaming课程概述
(92)什么是SparkStreaming和结构
(93)演示Demo:NetworkWordCount
(94)开发自己的NetworkWordCount程序


第十四章:Spark Streaming进阶

(95)StreamingContext和DStream简介
(96)DStream中的转换操作
(97)窗口操作
(98)DStream的输入和输出
(99)集成Spark SQL


第十五章:使用外部数据源

(100)集成Spark Streaming和Flume(1)
(101)集成Spark Streaming和Flume(2)
(102)Kafka消息系统简介和体系结构
(103)搭建Kafka环境
(104)集成Spark Streaming和Kafka


展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交