云数据湖产品介绍
- 数据湖设计思路及建设方法
- 阿里、华为云上数据湖建设案例学习
- 数据湖建设实战
11:36
课程介绍:
数据湖的概念最初是大数据厂商提出的,由Pentaho的创始人兼CTO--James Dixon,在2010年10月纽约Hadoop Word 大会上提出,一经提出便引起了大家的广泛关注。
相信从事数据相关工作的你已经对数据仓库、数据集市、ODS、OLAP等等这些常见的数据存储容器非常了解了,那么既然已经有了这些多种多样的数据存储容器,为什么还会有数据湖的诞生呢?它又能帮我们解决哪些问题呢?
数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。它按原样存储数据,而无需事先对数据进行结构化处理。
而依靠刚刚所提及的几种常见的数据存储容器去储存数据,往往会产生以下几个问题:非结构化的数据如何利用?我需要原始明细数据怎么办?数据仓库还需专业人士进行建模。而数据湖可以帮助企业轻松解决这些问题。
本节课储老师就会从“当前数据存储模式存在的问题”切入,分析学习数据湖的必要性,接着由浅入深讲解建设数据湖的设计思路及具体的实施方法,然后以阿里及华为的云上数据为例,分析如何在云上构建数据湖,最后从需要背景、应用架构、技术架构三个层面讲解业务场景下的数据湖建设。
讲师介绍:
储成宇
大数据技术公司CTO;
15年大数据,数据中台,数据仓库,数据建模领域工作及授课经验;
实施客户客户包括中国移动,上海市政府等客户;
长期为中国银行,招商银行,建设银行提供数据库和大数据相关培训服务;
注:本课程提供课件
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲