大数据生态圈系列
可以很清晰的知道什么是大数据,大数据和云计算物联网的关系和区别,学术怎么定义大数据,了解大数据在各个行业的现状和未来发展趋势,学习linux软件的安装,明白linux环境的配置,会使用linux的基本命令,学习Mysql设计表结构,动手标准的SQL编码,熟悉学习hadoop整个生态圈体系知识点和技能
11
门课程
22415
人学习
课程总时长
学习linux软件的安装,明白linux环境的配置,会使用linux的基本命令动手mysql的安装和配置,学习Mysql设计表结构,动手标准的SQL编写,动手数据的导入和导出,了解mysql基础知识
熟悉Clouders Manager的安装和部署,熟知CDH的安装配置,了解什么是Hadoop生态圈,熟悉Hadoop分布式文件系统,懂得hdfs分布式文件系统的使用,了解MapReduce工作原理。
学习怎么使用Sqoop连接关系数据库进行数据导入导出,了解Hive数据仓库的开发和应用,学习Hue的web页面的开发,精通Hbase列式数据库的开发,了解kafka消息队列的原理,精通ETL的设计原理
本课程涵盖了几乎所有hadoop常用的功能。hadoop是一个能够让用户轻松架构和使用的分布式计算平台,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。