云数据湖产品介绍

1199 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
大数据开发工程师、数据平台开发工程师 从事数据湖设计开发的程序员 数据分析领域的工作者
你将会学到
深入理解建设数据湖的必要性,掌握数据湖的设计思路及建设方法。
  • 数据湖设计思路及建设方法
  • 阿里、华为云上数据湖建设案例学习
  • 数据湖建设实战
课程简介

11:36

课程介绍:

数据湖的概念最初是大数据厂商提出的,由Pentaho的创始人兼CTO--James Dixon,在2010年10月纽约Hadoop Word 大会上提出,一经提出便引起了大家的广泛关注。

相信从事数据相关工作的你已经对数据仓库、数据集市、ODS、OLAP等等这些常见的数据存储容器非常了解了,那么既然已经有了这些多种多样的数据存储容器,为什么还会有数据湖的诞生呢?它又能帮我们解决哪些问题呢?

数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。它按原样存储数据,而无需事先对数据进行结构化处理。

而依靠刚刚所提及的几种常见的数据存储容器去储存数据,往往会产生以下几个问题:非结构化的数据如何利用?我需要原始明细数据怎么办?数据仓库还需专业人士进行建模。而数据湖可以帮助企业轻松解决这些问题。

本节课储老师就会从“当前数据存储模式存在的问题”切入,分析学习数据湖的必要性,接着由浅入深讲解建设数据湖的设计思路及具体的实施方法,然后以阿里及华为的云上数据为例,分析如何在云上构建数据湖,最后从需要背景、应用架构、技术架构三个层面讲解业务场景下的数据湖建设。


讲师介绍:
储成宇
   大数据技术公司CTO;
   15年大数据,数据中台,数据仓库,数据建模领域工作及授课经验;
   实施客户客户包括中国移动,上海市政府等客户;
   长期为中国银行,招商银行,建设银行提供数据库和大数据相关培训服务;


注:本课程提供课件

数据湖构建方法与业务实践 大纲.png

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交