-
Spark SQL性能优化1小时47分钟掌握在大规模数据集中(10T规模)对常见的Spark SQL性能问题,比如数据倾斜等进行诊断和调优Spark SQL数据倾斜和非数据倾斜优化 Spark SQL的存储和压缩格式 Spark SQL UI介绍和处理数据基础模型 Spark SQL调优常用的参数 自定义函数和JSON数据解析5.0 9课时 275人学习¥ 69.00 2023/08/21
-
CDH6大数据平台构建10小时41分钟能基于虚拟机和腾讯云服务器使用Cloudera Manager构建CDH6企业级大数据平台CM+CDH构建企业级大数据平台 真实服务器上安装VM虚拟机 集群扩容概述 轻松添加新服务(以zookeeper集群部署为例) 成功安装部署Cloudera Manager4.6 32课时 3097人学习¥ 79.00 2020/03/30
-
电信大数据项目离线数仓实训从入门到精通7小时42分钟畅销 01.掌握电信数据仓库项目建设的流程和实践方法;1.项目介绍 2.虚拟机创建和克隆 3.客户端链接工具 4.配置所有节点 5.配置免密登陆5.0 49课时 5854人学习¥ 80.00 2024/06/07
-
大数据分析教材精讲系列一10小时14分钟掌握数据分析的基础知识及分析方法了解大数据分析人员应当具有的法律及道德素养,胜任大数据分析的基本工作1.1数据分析概述 5.1Groupby分类统计 4.4数据运算+4.5数值的排序与排名 3.1查看数据表的信息和大小 2.1导入数据文件暂无评分 39课时 15人学习¥ 80.00 2023/02/10
-
大数据高级工程师:Spark 2.x 实战应用系列之正确理解Spark3小时31分钟本课程不会有太多的技术细节,主要是一些分布式存储和计算的基本理念和思想目标:1: 彻底弄懂什么是RDD及其特点2: 彻底弄懂什么是spark的分布式内存计算,进而理解spark真正解决的问题3: 彻底弄懂spark是怎样解决各个领域问题,以及在解决各个领域问题的时候的特点老汤大数据课程体系介绍 学习Spark的前置知识测试 正确理解spark课程内容简介 正确理解spark学习环境 概述5.0 20课时 19779人学习¥ 85.00 2021/06/23
-
老汤大数据课程之SQL19小时59分钟熟练使用 SQL 语言老汤大数据课程体系介绍 Java数据分析 单行函数 笛卡儿积的消除 数据准备5.0 98课时 3756人学习¥ 89.00 2020/09/07
-
Spark实战教程21小时25分钟多面深入理解Spark、Spark SQL、Spark Streaming、MLlib等模块核心概念1 Spark 简介 Spark SQL DataFrames Spark 集群模式概述 Spark SQL入门 与RDD互操作1 Spark RDD 编程14.7 86课时 1377人学习¥ 98.00 2020/03/31
-
HBase2.4.4版本全解析3小时25分钟掌握HBase产品精髓,构建大数据存储体系HBase1-课程介绍 HBase3-HBase安装 HBase11-课程总结 HBase7-Rest客户端 HBase课程资料5.0 12课时 99人学习¥ 98.00 2022/03/29
-
新一代大数据流处理框架Flink教程4小时48分钟老师通过图文解析,原理剖析,逐步深入的方式对Flink进行讲授,让学员知其然知其所以然。01Flink离线与实时计算的介绍 02Flink代码模板以及批处理代码讲解 03Flink用流式处理批处理代码实现讲解 04Flink无界流代码处理的流程讲解 05Flink的Lambda表达式写法暂无评分 39课时 7人学习¥ 98.00 2022/09/23
-
老汤大数据课程之 Storm2小时32分钟学习分布式实时计算技术 Storm老汤大数据课程体系介绍 Storm的基本概念 Storm实现实时WordCount一 Storm实现实时WordCount二 Storm实现实时WordCount三5.0 13课时 189人学习¥ 99.00 2020/09/07
-
Spark基础与提升第一季-核心编程视频课程11小时59分钟此课程需要学习搭建Spark环境,学习使用RDD以及算子操作。1spark介绍spark是否可以替换hadoop 2介绍spark架构发展历史和特点 3spark安装包下载和对应hadoop参数介绍 4spark所需要安装的软件和vmware与virtualbox简单对比 5vitualbox增强版本一个补充安装暂无评分 49课时 3086人学习¥ 99.00 2016/09/07
-
【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升5小时2分钟想学习Spark进入大数据领域的同学,花一个小时学习Spark大数据计算引擎在整个大数据生态圈的地位,并且跟跟着老师完成Spark学习环境的搭建,对常见的Spark运用场景进行实战操作。为学习Spark Sql、Spark Streaming、Spark图计算、Spark机器学习建立好环境基础!【实战】Spark2.0之大数据生态圈的10年 【实战】Spark2.0环境搭建_上 【实战】Spark2.0集群安装_下 【实战】Spark2.0之快速入门 【实战】Spark2.0中的基本抽象及术语4.5 10课时 8187人学习¥ 99.00 2017/07/21
-
【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升4小时45分钟SparkSql提供了一种强大的类Sql操作的数据分析方式,目前SparkSql是大数据企业用得最多的Spark组件之一,熟练使用SparkSql进行大数据分析,是进入大数据公司工作的技能!SparkSql概述及发展史 【实战】SparkSql2.0结果保存为CSV文件 【实战】SparkSql保存结果为json文件 【实战】SparkSql保存结果为parquet文件 【实战】SparkSql保存结果到hdfs的text文件4.5 19课时 2573人学习¥ 99.00 2017/03/06
-
【大数据 Spark 2.x 流数据 多案例】Spark Streaming流数据处理基础与提升7小时23分钟1.学习SparkStreaming三种使用场景2.监控HDFS目录3.处理Socket流式数据4.处理Kafka流式数据5.自定义Receiver接收器6.性能调优7.foreachRDD设计模式8.SparkStreaming+Kafka+SpringBoot+Mysql构建的实时微服务报表系统spark流式处理框架介绍及对比-1 Spark流式处理设计原理及编写streaming程序的三大注意事项-2 【实战】Spark监控HDFS目录的两种常见应用场景及实战-3 【实战】SparkStreaming对Socket数据进行两种场景的数据消费-4 【实战】Spark流数据处理之Zookeeper集群安装-55.0 24课时 7152人学习¥ 99.00 2022/03/28
-
Hive+Python+Sqoop+HDFS大数据统计与可视化系统系列视频课程17小时23分钟本课程基于企业大数据可视化项目,多方位、流程讲解大数据项目的业务流程、架构设计、安装部署、数据统计、任务调度和web可视化交互设计。课程介绍与VMware安装 开发环境软件安装 创建第一个项目 MySQL基本使用 MongoDB与Redis基本使用4.8 33课时 11022人学习¥ 99.00 2017/09/19
-
[老汤]Spark 2.x 实战应用系列四之Spark-core正确提交spark应用3小时37分钟理解透spark-submit中的每一个参数的用法及其原理,以达到正确提交各种业务场景下的spark应用课程内容简介 java命令启动JVM java ProcessBuilder启动JVM spark-submit感官认识 master和deploy-mode参数详解5.0 18课时 5120人学习¥ 99.00 2018/01/04
-
[老汤]Spark 2.x实战应用系列五之Schedulers On Driver10小时22分钟学习DAG图的原理及其调度、学习task的调度原理、学习driver端的资源的调度原理、学习动态资源分配机制,从而达到对driver端的核心原理有比较深入的理解,可以指导driver的调优课程内容 stage的划分 stage的调度 taskset调度的先进先出(FIFO)机制 taskset调度的公平调度(FAIR)机制5.0 45课时 7141人学习¥ 99.00 2019/04/01
-
[老汤]Spark 2.x实战应用系列六之Spark SQL的前生今世及未来2小时33分钟多面了解Spark2.x的Spark SQL的前世今生以及未来,并且对Spark SQL的核心概念Dataset做了详细的概述,从而达到思想上入门Spark SQL课程内容 DSL SQL 三种数据格式及其优缺点 Spark SQL的初衷5.0 17课时 7716人学习¥ 99.00 2017/10/14
-
[老汤]Spark 2.x实战应用系列八之Spark SQL with Hive10小时21分钟用一个例子看懂Hive的使用方式;用一个例子看懂Spark SQL是如何兼容Hive的;用一个案例弄明白什么情况下用Spark SQL以及什么情况下使用Hive。课程内容 课程需要的环境 Thrift与Socket编程模型对比 Thrift的使用方法 课程数据准备5.0 40课时 5593人学习¥ 99.00 2019/03/03
-
[老汤]Spark 2.x之Scala内功修炼视频课程四-面向对象编程基础4小时14分钟入门Scala,多面了解并学习Scala面向对象编程技能怎样学习Scala 抽象类的定义以及继承 Scala脚本的运行-fsc命令 trait的定义 Scala的类型体系5.0 27课时 7288人学习¥ 99.00 2018/01/05
-
[老汤]Spark 2.x之Scala内功修炼视频课程五-函数式编程基础3小时10分钟学习Scala函数式编程的语法以及学习函数式编程的思想和基本概念怎样学习Scala 本地(Local)函数 if表达式和while循环 高阶(high-order)函数 课程内容5.0 17课时 4782人学习¥ 99.00 2018/01/05
-
赵渝强老师:大数据系列课程(新版)(3)搭建Hadoop环境1小时52分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Hadoop的目录结构 搭建Hadoop的本地模式 搭建Hadoop的伪分布模式 免密码登录的原理和配置 搭建Hadoop的全分布环境5.0 5课时 5719人学习¥ 99.00 2017/12/07
-
Hbase列式数据库及应用案例1小时19分钟1、学习NoSQL数据库原理2、了解Hbase列式数据库原理3、动手实操Hbase实际代码4、了解Hbase性能测试5、熟知Hbase的使用场景6、Hbase在项目的实际应用案例Hbase体系结构和性能测试 Hbase例子实操(创建表+插入数据) 案例-运营商全国用户上网记录 HBase问题解决和基本用法 Hbase体系结构和应用场景暂无评分 6课时 266人学习¥ 99.00 2018/12/06
-
物联网大数据应用开发和业务架构设计(共3讲)44分钟学习大数据应用开发,高并发采集、灵活转发、高可扩展/高并发/高可靠海量存储、实时计算、智能分析的设计思想物联网大数据项目的课程内容安排和整体架构设计 物联网大数据应用的高并发和高可用系统的架构和业务流程讲解 物联网大数据应用项目的高并发和高可用系统的演示5.0 3课时 330人学习¥ 99.00 2019/01/18
-
实战cloudera cdh6系列 - sqoop导入导出数据1小时43分钟通过对本课程的学习,学习cdh6 sqoop的搭建和配置,基本操作,实践案例课程介绍 sqoop job命令 sqoop export命令基本用法 sqoop import命令基本用法 apache sqoop安装和配置3.0 15课时 145人学习¥ 99.00 2019/06/23
-
大数据平台性能调优、架构设计与故障汇总3小时10分钟通过本课程的学习,可以使大数据运维同学系统学习大数据调优、架构设计和故障处理经验yarn内存优化策略与配置 结课测试 大数据平台硬件选型经验 如何下线datanode节点以及节点磁盘故障案例 通过具体案例介绍Yarn参数优化策略5.0 12课时 729人学习¥ 99.00 2022/03/30
-
数智化转型:数据中台的构建与赋能2小时7分钟了解数智化转型所需要的能力,系统学习数据中台基础概念、框架,掌握数据赋能业务创新的方法论导课 企业面临的困境 什么是数据中台 数据中台原则与建设 数智化应用方向与数据能力需求5.0 12课时 10240人学习¥ 99.00 2021/03/04
-
数据中台的技术实施与落地——从支持运营到数据变现的技术实现2小时22分钟解决数字化转型背景下,企业的数据中台应该如何去进行架构设计和实施落地的问题导课 数据中台的基础设施 如何跨组织调度构建数据中台、中台之上如何进行高效协作 数据资产系统的重要性 课后习题5.0 16课时 11328人学习¥ 99.00 2021/03/04
-
大厂实例:大数据建设能力提升实践1小时24分钟以贝壳实际案例出发,学习大数据平台系统落地实践的干货 ,了解数据开发平台产品整体建设思路为什么要学习大数据平台建设? 经验总结 快速搭建:大数据平台从规划到落地 结课测试 平台系统化建设:数据管理平台5.0 11课时 36005人学习¥ 99.00 2022/03/30
-
数据工程:ETL项目实践多种业务场景1小时49分钟深入了解ETL在大数据领域及数据仓库中的应用,掌握搭建ETL框架方法。导课 结课测试 框架概述 什么是数据仓库 数据的基本概念5.0 20课时 236人学习¥ 99.00 2022/03/30