11天通用引擎Spark生态圈学习教程【共130课时】

猿课教育新锐讲师讲师评分4.9学员659013课程265

10余年软件研发及企业培训经验，曾为多家大型企业提供企业内训如中石化，中国联通，中国移动等企业。拥有丰富的企业应用软件开发经验、深厚的软件架构设计理论基础及实践能力。项目开发历程：...

畅销套餐
精选套餐
人气套餐
尊享套餐
高薪套餐

Facebook数据查询引擎Presto教程

IDEA版Java高级开发知识第1季IDEA+Maven+HashMap原理

677人学习

￥12.00

IDEA版Java高级开发知识第2季数据类型+设计模式+原理剖析

58人学习

￥12.00

IDEA版Java高级开发知识第3季多线程-线程安全性-同步代码块

79人学习

￥12.00

更多 40 门课程

征服Hadoop之实战大数据工程师视频课程套餐

Hadoop（三）高级特性压缩串行化视频课程

7期大数据之10天Java高级技术教程（数据类型、IO、连接池、NIO、JVM、Rose、线程池等）

449人学习

￥128.00

7期大数据之图解Hadoop技术教程（入门、原理、MR、Avro、容灾）

184人学习

￥198.00

7期大数据之数据仓库Hive技术教程（含优化）

7期大数据之10天Java高级技术教程（数据类型、IO、连接池、NIO、JVM、Rose、线程池等）

449人学习

￥128.00

7期大数据之图解Hadoop技术教程（入门、原理、MR、Avro、容灾）

184人学习

￥198.00

7期大数据之数据仓库Hive技术教程（含优化）

92人学习

￥128.00

更多 11 门课程

课程介绍
课程大纲

适合人群：

对大数据有所了解，有一定编程基础

你将会学到：

体验Spark技术，加深对大数据的认识，为后续做项目夯实基础。

体验Spark技术，加深对大数据的认识，为后续做项目夯实基础。
理解和熟悉Spark生态圈

课程简介：

本课程授课老师

徐培成老师先后在软件公司人软件工程师、系统分析师、项目经理、软件架构师，主持开发了大产权交易系统，异构数据库协同系统、电信资源管理系统、互联网综合性调查等系统，对java技术、大数据（hadoop、storm、spark）、Python、机器学习、数据库技术、互联网应用、远程通信、网络编程、分布式应用、高可用性计算机网络集群等技术有着丰富的实战经验和深厚的技术功底。

Spark最初由美国加州伯克利大学的AMP实验室于2009年开发，是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序。

Spark主要具有如下优点：

Spark的计算模式也属于MapReduce，但不局限于Map和Reduce操作，还提供了多种数据集操作类型，编程模型比MapReduce更灵活；
Spark提供了内存计算，中间结果直接放到内存中，带来了更高的迭代运算效率；
Spark基于DAG的任务调度执行机制，要优于MapReduce的迭代执行机制。
Spark最大的特点就是将计算数据、中间结果都存储在内存中，大大减少了IO开销

Spark提供了多种高层次、简洁的API，通常情况下，对于实现相同功能的应用程序，Spark的代码量要比Hadoop少2-5倍。

但Spark并不能完全替代Hadoop，主要用于替代Hadoop中的MapReduce计算模型。实际上，Spark已经很好地融入了Hadoop生态圈，并成为其中的重要一员，它可以借助于YARN实现资源调度管理，借助于HDFS实现分布式存储。

Spark 是一个通用引擎，可用它来完成各种各样的运算，包括 SQL 查询、文本处理、机器学习等，而在 Spark 出现之前，我们一般需要学习各种各样的引擎来分别处理这些需求。因此大数据研发者需要进行Spark的学习。

展开更多

课程大纲-11天通用引擎Spark生态圈学习教程