11天通用引擎Spark生态圈学习教程

体验Spark技术,加深对大数据的认识,为后续做项目夯实基础。

78人学习

高级130课时2020/03/16更新

二维码下载学堂APP缓存视频离线看

猿课教育
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
大数据企业级真实案例系列视频专题
互联网常用的大数据指标系列视频课程
1432人学习
¥30.00
Hadoop流量统计案例视频课程
735人学习
¥99.00
Facebook数据查询引擎Presto教程
720人学习
¥108.00
更 多 6 门 课 程
大数据+Python+机器学习实战班
IDEA版Java高级开发知识第1季IDEA+Maven+HashMap原理
677人学习
¥12.00
IDEA版Java高级开发知识第2季数据类型+设计模式+原理剖析
58人学习
¥12.00
IDEA版Java高级开发知识第3季多线程-线程安全性-同步代码块
79人学习
¥12.00
更 多 40 门 课 程
征服Hadoop之实战大数据工程师视频课程套餐
Hadoop(一)入门与环境配置视频课程
3586人学习
¥34.00
Hadoop(二)HDFS使用源码分析
371人学习
¥69.00
Hadoop(三)高级特性压缩串行化视频课程
183人学习
¥51.00
更 多 6 门 课 程
7期专业的大数据实战班(理论+实战)
7期大数据之10天Java高级技术教程(数据类型、IO、连接池、NIO、JVM、Rose、线程池等)
449人学习
¥128.00
7期大数据之图解Hadoop技术教程(入门、原理、MR、Avro、容灾)
184人学习
¥198.00
7期大数据之数据仓库Hive技术教程(含优化)
92人学习
¥128.00
更 多 11 门 课 程
7期专业的大数据实战班(理论+实战)
7期大数据之10天Java高级技术教程(数据类型、IO、连接池、NIO、JVM、Rose、线程池等)
449人学习
¥128.00
7期大数据之图解Hadoop技术教程(入门、原理、MR、Avro、容灾)
184人学习
¥198.00
7期大数据之数据仓库Hive技术教程(含优化)
92人学习
¥128.00
更 多 11 门 课 程
  • 课程介绍
  • 课程大纲

适合人群:

对大数据有所了解,有一定编程基础

你将会学到:

体验Spark技术,加深对大数据的认识,为后续做项目夯实基础。

  • 体验Spark技术,加深对大数据的认识,为后续做项目夯实基础。
  • 理解和熟悉Spark生态圈

课程简介:

本课程授课老师

徐培成老师先后在软件公司人软件工程师、系统分析师、项目经理、软件架构师,主持开发了大产权交易系统,异构数据库协同系统、电信资源管理系统、互联网综合性调查等系统,对java技术、大数据(hadoop、storm、spark)、Python、机器学习、数据库技术、互联网应用、远程通信、网络编程、分布式应用、高可用性计算机网络集群等技术有着丰富的实战经验和深厚的技术功底。

Spark最初由美国加州伯克利大学的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。


Spark主要具有如下优点:

Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活;
Spark提供了内存计算,中间结果直接放到内存中,带来了更高的迭代运算效率;
Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制。
Spark最大的特点就是将计算数据、中间结果都存储在内存中,大大减少了IO开销

Spark提供了多种高层次、简洁的API,通常情况下,对于实现相同功能的应用程序,Spark的代码量要比Hadoop少2-5倍。

但Spark并不能完全替代Hadoop,主要用于替代Hadoop中的MapReduce计算模型。实际上,Spark已经很好地融入了Hadoop生态圈,并成为其中的重要一员,它可以借助于YARN实现资源调度管理,借助于HDFS实现分布式存储。


Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等,而在 Spark 出现之前,我们一般需要学习各种各样的引擎来分别处理这些需求。因此大数据研发者需要进行Spark的学习。

展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部