05.hadoop镜像管理
本课程授课老师
徐培成老师先后在软件公司人软件工程师、系统分析师、项目经理、软件架构师,主持开发了大产权交易系统,异构数据库协同系统、电信资源管理系统、互联网综合性调查等系统,对java技术、大数据(hadoop、storm、spark)、Python、机器学习、数据库技术、互联网应用、远程通信、网络编程、分布式应用、高可用性计算机网络集群等技术有着丰富的实战经验和深厚的技术功底。
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。
通过5天的学习,你可以学习Hadoop的环境搭建、Hadoop工作原理、MapReduce、串行化-avro、串行化-protobuf、Hadoop高级管理等,满足企业开发需求。
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲
- 第一章 Hadoop技术day01
- 1-1试看 01.线程池回顾35:43
- 1-202.hadoop完全分布式部署22:27
- 1-303.hadoop配额-目录-空间27:43
- 1-404.hadoop快照管理13:45
- 1-505.hadoop镜像管理21:50
- 1-606.hadoop-savenamespace-rolled16:52
- 1-707.hadoop-API编程访问hdfs20:18
- 1-808.hadoop-数据写入过程剖析01:41:12
- 1-909.hadoop-压缩性能评测47:47
- 1-1010.hadoop-sequencefile-压缩33:06