赵渝强老师：大数据系列视频课程（新版）（5）HDFS【共16课时】

赵渝强中级讲师讲师评分5.0学员1095811课程135

近20年IT行业从业经历，清华大学计算机软件工程专业毕业。曾任京东大学大数据学院院长，Oracle中国有限公司高级技术顾问；华为官方认证讲师。曾在BEA、甲骨文、摩托罗拉等世界500强公司担任高...

畅销套餐
精选套餐
人气套餐
尊享套餐
高薪套餐

赵强老师：大数据视频课程（新版）

赵渝强老师：大数据系列课程（新版）（2）背景知识与起源

6288人学习

￥59.00

赵渝强老师：大数据系列课程（新版）（4）Hadoop的体系结构

4343人学习

￥69.00

赵渝强老师：大数据系列视频课程（新版）（12）集群HA

1958人学习

￥109.00

更多 23 门课程

赵强-大数据课程之从Hadoop到Spark专题

赵渝强老师：Hadoop 2.x（一）大数据基础实战视频课程

67213人学习

￥279.00

赵渝强老师：Spark系列视频课程之一：Scala编程语言视频课程

19759人学习

￥179.00

赵渝强老师：Spark 2系列视频课程之二：Spark Core

赵渝强老师：Hadoop 2.x（一）大数据基础实战视频课程

67213人学习

￥279.00

赵渝强老师：Hadoop 2.x （二）大数据进阶实战视频课程

23783人学习

￥199.00

赵渝强老师：Hadoop 2.x （三）数据分析引擎：Hive视频课程

28686人学习

￥249.00

更多 7 门课程

赵强-大数据之Spark 2 课程视频专题

赵渝强老师：Spark系列视频课程之一：Scala编程语言视频课程

19759人学习

￥179.00

赵渝强老师：Spark 2系列视频课程之二：Spark Core

14650人学习

￥279.00

赵渝强老师：Spark 2 系列视频课程之三：Spark SQL

5208人学习

￥129.00

更多 4 门课程

赵强-大数据之Spark 2 课程视频专题

赵渝强老师：Spark系列视频课程之一：Scala编程语言视频课程

19759人学习

￥179.00

赵渝强老师：Spark 2系列视频课程之二：Spark Core

14650人学习

￥279.00

赵渝强老师：Spark 2 系列视频课程之三：Spark SQL

5208人学习

￥129.00

更多 4 门课程

课程介绍
课程大纲

适合人群：

具备Java基础学员，并想进一步学习大数据的学员。

你将会学到：

本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容，让学员深入理解并学习运行机制和原理，从而进一步学习大数据的相关内容。

课程简介：

RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容，让学员深入理解并学习运行机制和原理，从而进一步学习大数据的相关内容。

赵渝强老师博客地址：http://collen7788.blog.51cto.com/

HDFS是什么？

==========================================================================

HADOOP DISTRIBUTED FILE SYSTEM，简称HDFS，是一个分布式文件系统。它是谷歌的GFS提出之后出现的另外一种文件系统。它有一定高度的容错性，而且提供了高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案。

HDFS的设计思路？

==========================================================================

是什么提供它高吞吐量的数据访问和适合大规模数据集的应用的特性呢，这就要说一下它的设计思路。
首先HDFS的设计之初就是针对超大文件的存储的，小文件不会提高访问和存储速度，反而会降低；其次它采用了高效的访问模式，也就是经常所说的流式数据访问，特点就是一次写入多次读取；再有就是它运行在普通的硬件之上的，即使硬件故障，也就通过容错来保证数据的高可用。

HDFS的一些概念

==========================================================================

Block：大文件的存储会被分割为多个block进行存储。默认为64MB，每一个blok会在多个datanode上存储多份副本，默认为3份。[这些设置都能够通过配置文件进行更改]
Namenode：主要负责存储一些metadata信息，主要包括文件目录、block和文件对应关系，以及block和datanote的对应关系
Datanode：负责存储数据，上面我们所说的高度的容错性大部分在datanode上实现的[还有一部分容错性是体现在namenode和secondname，还有jobtracker的容错等]。

赵渝强老师：大数据系列视频课程

==========================================================================

1、Hadoop大数据迅速学习高级应用系列套餐

https://edu.51cto.com/topic/1155.html

2、Spark 2系列课程视频套餐

https://edu.51cto.com/topic/1258.html

3、大数据消息（Kafka）与实时处理（Storm）系统系列套餐

https://edu.51cto.com/topic/1003.html

4、NoSQL 数据库实战系列视频课程专题（上）

https://edu.51cto.com/topic/955.html

5、NoSQL 数据库实战系列视频课程专题（下）

即将发布

本门课程课程大纲

==========================================================================

一、HDFS概述
1、HDFS课程概述

二、操作HDFS
2、通过Web Console操作HDFS
3、通过命令行操作HDFS
4、使用Java API创建目录和权限问题
5、使用Java API上传和下载数据
6、使用Java API获取文件信息

三、HDFS的原理剖析
7、HDFS上传数据的过程和原理
8、HDFS下载数据的过程和原理

四、HDFS的高级功能
9、HDFS的回收站
10、HDFS的快照
11、HDFS的安全模式和权限
12、HDFS的配额
13、HDFS的集群简介

五、HDFS的底层原理
14、HDFS底层原理之一：代理对象
15、代理对象应用案例：实现数据库连接池
16、HDFS底层原理之二：什么是RPC？