DStream的输出操作和foreachRDD的设计模式

5816 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
本课程适合于具有Spark基础,并想进一步学习Spark Streaming的学员
你将会学到
学习并学习Spark Streaming的基本原理;并学习使用Spark Streaming的基本数据源和高级数据源来采集数据。了解并学习Spark Streaming优化的基本原则
课程简介


Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集,提供了比MapReduce更丰富的模型,可以在快速在内存中对数据集进行多次迭代,以支持复杂的数据挖掘算法和图形计算算法。Spark Streaming是一种构建在Spark上的实时计算框架,它扩展了Spark处理大规模流式数据的能力。


赵渝强老师博客地址:http://collen7788.blog.51cto.com/


《赵渝强老师:Spark系列视频课程》

===================================================

1、Spark系列视频课程之一:Scala编程语言

     https://edu.51cto.com/course/6724.html 


2、Spark系列视频课程之二:Spark Core

      https://edu.51cto.com/course/10698.html 


3、Spark系列视频课程之三:Spark SQL

      https://edu.51cto.com/course/10796.html 


4、Spark系列视频课程之四:Spark Streaming

      https://edu.51cto.com/course/11066.html 


5、Spark系列视频课程之五:Spark Structured Streaming

      即将发布



===《Spark 2 系列视频课程之四:Spark Streaming》课程大纲===


一、Spark Streaming基础
    1、Spark Streaming简介
    2、Spark Streaming的特点
    3、Spark Streaming的内部结构
    4、小小案例:wordcount程序:NetworkWordCount
    5、开发自己的NetworkWordCount

二、Spark Streaming进阶
    1、StreamingContext 对象详解
    2、离散流: DStream
    3、DStream的转换操作
    4、窗口操作
    5、DStream的输入:基本数据源
    6、DStream的输出操作和foreachRDD的设计模式
    7、DataFrame和SQL操作
    8、缓存和持久化
    9、检查点

三、高级数据源
    1、集成Flume
    2、集成Kafka

四、性能优化
    1、减少批数据的执行时间
    2、如何设置批的容量
    3、内存调优

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交