Linux中的文件操作
通过课程逐步深入;对比windows操作系统学习linux系统,文件操作、用户操作、权限操作、服务软件安装等;对比java编程语言,轻松学习基于linux的shell脚本编程、awk脚本编程。对hadoop的核心概念,核心模块hdfs和yarn详细讲解;对hadoop进行本地、分布式模式和高可用(HA)进行搭建;讲解hdfs的shell命令、rpc机制和java对hdfs的API操作;对zookeeper作多面讲解和zookeeper集群搭建。mapreduce的重要知识点、运行方式和shuffle的复杂过程讲解;mapreduce的入门案例wordcount详解,经典案例倒排索引、分区、二次排序、join等详解;mapreduce和awk脚本的对比案例展示;mapreduce自定义数据类型;案例之mapreduce的自定义输入输出数据格式编写。hive的架构讲解、多种模式的安装和hive的hql语句;hive中的查询语句使用;hive中常用内部函数详解;hive的企业真实udf案例编写;hive的存储格式、serde、索引和优化的详解;sqoop的安装和不同数据源的相互整合。hbase的详细介绍和分布式的搭建详细讲解;java操作hbase的API和过滤器filter的编写;hbase和hive、hbase和mapreduce的整合案例;flume概念介绍、flume的安装、flume基础脚本和脚本的编写。
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲