权威课程 品质保证

8大必修课程+3大国际国内项目案例

学习4个月,具备大数据平台应用开发、集群架构设计、平台数据分析能力

  • 体系完整

    结合国际顶尖的课程体系,经过长时间的设计、磨合和实践,梳理出成熟的大数据知识体系和学习路径,让大数据学习贴近实际应用,知识体系不发散。

  • 贯穿原理

    注重原理上的一脉相承:从文件系统到数据库,从分布式文件系统再到NoSQL所有管理数据的应用都秉承数据 data 与元数据 metadata 分开管理的思路。

  • 紧贴实战

    课程设计完全按照大数据通用的业务上线流程,对大数据纷繁复杂的知识点加以梳理。整个课程学习过程就是一个大数据的实际项目。

  • 注重效率

    大数据开发语言我们选择 Python ,Python 是多家大数据公司的首选开发语言。Python 能够让学员快速的掌握大数据项目开发流程的精要。

大数据课程体系

BDA- Big Data Architecture

  • 大数据平台的基础软件平台:Linux、关系数据库、Mysql

    学习安排:2周 · 41课时 · 2次作业 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:Linux 操作系统基础;关系型数据库理论与 MySQL 数据库。
    大数据应用离不开基础软件的支撑,且大部分大数据组件部署在 Linux 操作系统上的用户空间,也有很多组件也借鉴了Linux 操作系统的一些设计精髓,所以 Linux 既是大数据的强力支撑,也是很多性能问题的始作俑者。本部分通过对 Linux 操作系统、Java 虚拟机原理的剖析,展示大数据赖以生存的基础环境。

  • Hadoop的核心组件:HDFS、MapReduce、Hadoop 集群

    学习安排:2周 · 42课时 · 2次作业1次阶段考核 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:HDFS;MapReduce;Hadoop 集群规划与搭建;Hadoop 集群的高级配置
    Hadoop 起源于 Google 的三篇论文,Google Bigtable 被用 Java 语言开源实现变成了今天的HBase,Doug Cuting 现任 Cloudera 首席架构师开源实现了 Google filesystem 和 MapReduce,变成了今天 Hadoop 核心组件中的HDFS 和 MapReduce。然后由这三个核心组件逐渐衍生出了大数据的生态系统。本模块通过学习 HDFS,YARN(MapReduce)Spark 等核心组件,了解Hadoop 的基本运行框架。

  • 原始数据的查询与分析:Hive、Impala、Pig

    学习安排:2周 · 36课时 · 2次作业 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:Hadoop 集群数据查询与分析:Hive、Impala、Pig
    传统数据仓库在面对更大规模数据时显得力不从心,在寄希望于大数据平台时,MapReduce 编程门槛让很多数据分析师望而却步,加上多年 DB+应用模式培养的强大的 SQL 生态圈,催生了大数据平台上一些数据仓库应用。本模块通过学习 Hive、Impala 等大数据 SQL 分析组件,让用户将隐匿在泥沙之下的数据价值挖掘出来。

  • 增删改查样样精通:NoSQL 数据库之 HBase

    学习安排:2周 · 37课时 · 2次作业1次阶段考核 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:分布式数据库的理论基础;HBase 基础;HBase 体系结构和读写流程;HBase优化和管理
    在上个模块中,OLAP 类型的需求得到了很好的解决方案,即针对数据查询分析的应用。但是这些组件对于数据的随机删改并不擅长。针对此种 OLTP 类型应用,大数据生态系统中有另外一类组件处理这样的问题,那就是 NoSQL 家族。这部分将介绍 NoSQL 的数据模型和分类,着重讲述最具代表的 HBase

  • 复杂需求有编程应对:Python、Spark、RDD、DataFrame和Dataset、Hadoop 其它组件

    学习安排:3周 · 57课时 · 2次作业 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:Python;Spark 基础;Spark 编程及性能优化;Spark2.0 新特性:RDD;DataFrame 和 Dataset;Hadoop 其它组件
    SQL 语句属于声明式编程语言,这种 Relational方式擅长处理结构化数据。大数据的数据来源种类繁多,数据类型多种多样,SQL并不能处理所有问题。所以需要用procedural 方式,即编程方式处理复杂多变的数据类型和应用。本章介绍 MapReduce、Spark编程模型,着重讲述利用Python 在 Spark 平台做数据转换和分析。

  • 大数据平台的提速:索引技术、流式计算

    学习安排:2周 · 32课时 · 2次作业1次阶段考核 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:大数据平台的索引技术;流式计算
    以上模块学习完毕之后,对于大数据平台的大部分问题,我们都会有思路去解决了。系统稳定运行之后,就要考虑运行的好不好,快不快。本模块针对 HDFS 数据、HBase 数据、实时抓取数据加索引,以及 Spark Streaming 流式处理技术做重点介绍,为大数据处理提速。

  • 大数据的皇冠数据科学:数据科学与数学基础、机器学习、Spark MLlib

    学习安排:3周 · 34课时 · 2次作业1次阶段考核 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:数据科学概述与数学基础;机器学习的理论基础、Spark MLlib
    事物的原理和规律隐藏在纷繁杂乱的数据中,如何从数据中将他们挖掘出来服务生产生活,大数据的核心价值体现在此。
    本模块我们一起学习数据科学的数学基础、机器学习的算法。因为Spark 正在取代 MapReduce成为大数据平台数据处理的全新引擎,它也使得在大数据环境下高效的运用数据科学成为可能,所以我们着重介绍基于 Spark 的机器学习的实现, 把握大数据的发展趋势,步入数据科学的殿堂。

  • 行业案例及项目精讲:Cloudera案例、Hadoop 电商公司& Airbnb & 百度搜索

    学习安排:2周 · 20课时 · 2次作业1次阶段考核 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:Cloudera 提供的客户案例分享(金融、医疗、电商、制造业);项目精讲
    项目1:Hadoop 电商公司精准营销案例
    项目2: Airbnb 民宿服务型互联网应用 Spark 流式计算案例
    项目3: 百度 大规模多媒体数据 Spark 处理平台

  • 大数据平台的安全:Hadoop 集群的安全机制选修

    学习安排:1周 · 5课时 · 1次练习 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:Hadoop 集群的安全机制
    大数据时代需要数据开放,同时又需要保障敏感数据的安全。企业如何保障数据中心的安全性成为即将面临的重大课题,本章通过介绍安全理论,学习大数据平台下静态数据和动态数据的数据宝库策略和实现。涉及组件 Apache Sentry,Kerberos以及常用加密算法。

  • 统计利器 R 语言:R 语言基础及用 R 语言做数据分析选修

    学习安排:1周 · 11课时 · 1次练习 <申请免费试听>

    学习形式:录播视频+在线作业考核+助教一对一辅导答疑

    课程内容:R 语言背景知识;R 语言基础;用 R 语言做数据分析
    R 语言具有丰富的统计方法,大多数人使用R语言是因为其具有强大的统计功能, R 语言内部包含了许多经典统计技术的环境。本届通过对 R 语言基础知识的学习,了解 R 数据分析的通用流程。同时学习R 语言在 Spark 计算框架的基本使用方法,为实现更强大的数据分析打基础。

国际国内典型项目

申请0元入学 免费领取资料

讲师介绍

孟硕

Cloudera原厂ACTP授权认证讲师,恩墨学院大数据培训产品总监。前甲骨文 Oracle BigData咨询顾问。在Oracle任职期间,接触大量一线大数据应用案例, 并结合十余年的丰富操作系统、数据库以及大数据的经验,从原理层展示大数 据的运用之妙,绝对让学员收获于课程之外。加入Oracle之前,曾任职于中科 红旗操作系统服务器组,负责安全,虚拟化产品自动化 QE。

侯圣文(secooler)

北京大学理学硕士,金牌培训专家,BDA大数据联盟创始人,OCM联盟创始人, ACCUG创始人,Oracle ACE 总监、ACOUG核心专家、DATAGURU专家, Blogger。曾任职于海关总署数据中心,负责运维国家级海量数据库。为多家大 中型企业提供过Oracle、MySQL、Hadoop大数据及云计算相关课程培训,经验 丰富,讲课富有激情和感染力,善于理论联系实践,擅长以通俗易懂、诙谐幽默 的语言讲解枯燥深奥的技术理论。

特色教育辅导

随到随学+闯关式学习+体系化教学

随到随学 报名立即进入学习状态

闯关式学习 本阶段考核达标方可进入下一阶段学习

一对一辅导 享专属学习计划,及专属学习助教服务

一线企业大型实战项目

难点作业在线直播批改

学员学业问题100%答疑

现在报名 享好礼

· 免费获得价值5000元技术大礼包

· 企业大数据项目实习机会

· 免费参加一次51CTO、云和恩墨主办的技术峰会

· 成为中国 Cloudera 用户组(ACCUG)成员

滴滴打车专为本课程体系提供奖学金

奖学金回馈报名截止 12121212

仅剩20个名额 点击抢占奖学金名额

闯关完成颁发微职位证书

已有445人学习本课程

陈同学 已完成了大数据微职位第一节

陈同学 已完成了大数据微职位第一节

王同学 已完成了大数据微职位第一节

钟同学 已完成了大数据微职位第一节

孙同学 已完成了大数据微职位第一节

任同学 已完成了大数据微职位第一节

谭同学 已完成大数据微职位第二节

赵同学 已完成大数据微职位第二节

学完可从事三大方向

  • 大数据平台运维管理方向
  • 运维工程师 薪资 10-15k
  • 高级运维工程师 薪资 20-25k
  • 架构师 薪资 16-25k
  • 大数据应用开发类方向
  • 开发工程师 薪资 15-30k
  • 高级开发工程师 薪资 25-45k
  • 组件代码提交者 薪资 45k+
  • 大数据分析方向
  • 数据清洗师 薪资 12-15k
  • 数据分析师 薪资 20-45k
  • 数据科学家 薪资 50k+

就业推荐

考核通过学员推荐就业

立即提升身价

Q&A

  • 课程学习形式是什么样的?

    学习形式为随到随学+作业考核通关,一个阶段考核通过后方可进行下个阶段的学习,视频课程学习+QQ群&在线答疑+实战项目作业考核+助教一对一辅导。

  • 本次培训内容的安排是怎样的?

    本大数据工程师设有8门必修课程+2门选修课程,必修课程为期18周,17次作业+5次阶段考核,选修课程为期2周。每周视频安排3-5小时。

  • 大数据人才行业需求如何?

    国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元。目前,我国大数据人才只有46万,未来3到5年人才缺口达150万之多。

  • 开发语言为什么选择Python?

    让学员有一个快速的成功体验。大数据开发语言我们选择了 Python 语言,而 Python 是多家大数据公司的首选开发语言。语言是工具,重在理解思路和方法,Python 能够让学员快速的掌握大数据项目开发流程的精要,且大数据主要计算框架 Spark 2.0 之后对开发语言统一做了优化,Python 语言与其它语言几乎没有性能差别。

  • 作业如何提交,如何通关?

    课程开始之后,学员通过我的培训班进入个人中心,选择报名课程进入,按照学习安排有明确的指示,学员点击做作业提交后老师会阅卷,阅卷后系统会提醒作业成绩是否合格,合格即进入到下一关。

  • 服务周期是多长?在规定时间内没通关怎么办?

    视频课程观看有效期2年,助教服务有效期18+2=20周。
    20周后没有通关的,学员可继续看视频做作业,如果需要教学服务,则需要交纳一定的费用。

  • 课程支持离线观看吗?

    支持。51CTO学院有Android、iPhone、iPad客户端,支持课程收藏、分享及云端同步,同时支持视频缓存,无网络情况离线观看极大地方便学员学习。

  • 为何要选择51CTO学院微职位?

    51CTO是中国领先的IT技术网站,11年品牌与口碑,拥有100000技术专家、知名企业一线工程师实时分享最前沿、最实战技术,一直秉承“技术成就梦想”的服务理念。
    51CTO学院微职位课程由知名企业一线工程师、行业知名专家打造,旨在让学员系统全面的学习并掌握工作方法和技能技巧,获得全新的职业提升!

做IT金领

拿百万年薪

提交成功!

确定

提交失败!

请输入完整信息~

确定