3-Hive分区表原理

482 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
需要了解大数据,需要熟知大数据的管理,大数据的维护,hadoop开发,大数据数据挖掘分析的人
你将会学到
了解Hadoop分布式文件系统,懂得hdfs分布式文件系统的使用,熟知Hadoop集群硬件配置规划,懂得Hadoop集群配置及优化,学习如何维护和监测Hadoop集群学习怎么使用Sqoop连接关系数据库进行数据导入导出,了解Hive数据仓库的开发和应用
课程简介

第1部分:HDFS分布式文件系统详解

 1.什么是分布式文件系统HDFS

 2.HDFS基本架构

 3.基本概念

 4.主要涉及理念

 5.hdfs常用命令

 6.hdfs的上传文件 

 7.hdfs的下载文件

 8.hdfs的查看数据

 9.hdfs优点和缺点

 10.例子讲解

第2部分:Sqoop大数据同步工具介绍

 1.Sqoop基本介绍

 2.基本原理

 3.应用场景

 4.Sqoop和mysql的连接

 5.mysql数据到HDFS 

 6.HDFS数据到mysql

 7.关系型数据库到hive

 8.hive到关系型数据库

 9.Sqoop优点和缺点

 10.例子讲解

第3部分:Hive数据仓库及案例

 1.Hive 基本介绍

   1)Hive 是什么

   2)Hive 不是什么

   3)Hive 结构图

   4)Hive 元数据

   5)Hive 和普通关系数据的异同

   6)Hive 和 SQL 比较

 2.Hive 命令

  1)建表

  2)显示表

  3)修改表

  4)load 数据

 3.Hive 优化

  1)分区概念

  2)分区适用场景

  3)分区例子

  4)优化例子

  5)优化建议方案

 4.Hive 的用户自定义函数

  1)UDF 函数

  2)UDAF 函数

  3)UDTF 函数

 5.Hive 练习和案例

  1)练习

  2)案例讲解

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交