-
[老汤]Spark 2.x实时流计算之Structured Streaming解决的问题(系列五)30分钟理解透Spark中的Structured Streaming解决的问题,从high level的层面理解Structured Streaming,从而为学习和使用Structured Streaming打下坚实的基础本课程内容 Spark Streaming的优点和痛点 Continuous Applications Streaming in Spark的未来5.0 4课时 459人学习¥ 19.00 2018/01/19
-
[老汤]Spark 2.x实时流计算Flume+Kafka+Spark Streaming(系列四)3小时32分钟熟悉Flume、Kafka等技术。并且利用Flume+Kafka+Spark Streaming来实现真实的项目案例本课程内容 本课程需要的环境 本地运行Spark Streaming程序 Flume使用demo1 Flume使用demo25.0 26课时 7598人学习¥ 159.00 2018/01/19
-
[老汤]Spark 2.x大数据实时流计算之Spark Streaming性能与稳定(系列二)1小时23分钟深入学习Spark Streaming的原理、性能调优以及保证Spark Streaming稳定本课程内容 课程需要的环境 本地运行Spark Streaming程序 Spark应用对比Spark Streaming应用 Spark Streaming原理5.0 14课时 1311人学习¥ 99.00 2018/01/19
-
[老汤]Spark 2.x大数据实时流计算之Spark Streaming容错与语义(系列三)58分钟对Spark Streaming的容错机制进行深入的讲解,并且理解Spark Streaming真正的做到了Exactly Once的语义本课程内容 课程需要的环境 本地运行Spark Streaming应用程序 Executor失败容错 Driver失败容错5.0 11课时 956人学习¥ 99.00 2018/01/19
-
赵渝强老师:大数据系列视频课程(新版)(17)Scala面向对象2小时本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Scala面向对象编程简介 定义Scala的类 属性的get和set方法 嵌套类 类的构造器5.0 11课时 918人学习¥ 59.00 2018/02/03
-
赵渝强老师:大数据系列视频课程(新版)(16)Scala语言基础3小时29分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Scala语言概述 Scala简介和环境搭建 Scala的基本数据类型和变量常量 函数和条件判断 循环5.0 10课时 2260人学习¥ 59.00 2018/02/03
-
赵渝强老师:大数据系列视频课程(新版)(18)Scala函数式编程4小时8分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Scala函数式编程概述 Scala的函数和匿名函数 什么是高阶函数 高阶函数示例 闭包和柯里化5.0 18课时 1025人学习¥ 79.00 2018/02/08
-
赵渝强老师:大数据系列视频课程(新版)(19)Spark的体系结构3小时50分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。课程概述 什么是Spark和Spark的特点 Spark的体系结构 安装和部署Spark环境 基于文件系统的单点故障恢复5.0 13课时 2158人学习¥ 159.00 2022/04/01
-
赵渝强老师:大数据系列视频课程(新版)(20)Spark RDD4小时22分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。什么是RDD RDD的算子 RDD基本算子示例 RDD的缓存机制 RDD的容错机制和检查点5.0 15课时 2925人学习¥ 159.00 2018/02/15
-
Python大数据之Hadoop编程视频课程(含案例)6小时56分钟零基础学习使用Python编写Hadoop代码,学习使用Hadoop构建电商相似商品推荐引擎,学习Hadoop的架构原理和使用场景,贯穿课程的项目进行实战锻炼,熟练使用Hadoop进行MapReduce程序开发。课程还涵盖了分布式计算领域的常用算法,帮助学员为企业在利用大数据方面体现自身价值。Hadoop的由来、应用与原理 Hadoop HDFS指令全解析 启动hadoop的方法与注意事项 Mapreduce -Python编程原理+实战 在Hadoop集群中实际运行MapReduce5.0 18课时 2106人学习¥ 399.00 2021/02/21
-
[老汤]Spark 2.x内核原理四之shuffle管理(Shuffle Manager)视频课程54分钟深入了解Spark Shuffle的原理课程内容 MapOutputTracker HashShuffleWriter SortShuffleWriter UnsafeShuffleWriter5.0 9课时 1527人学习¥ 39.00 2019/05/22
-
Python大数据之Spark编程基础与提升视频课程6小时2分钟零基础学习使用Python编写Spark代码,贯穿课程的项目进行实战锻炼。学习使用Spark进行数据预处理、数据分析、机器学习、构建推荐引擎等。Spark简介和启动方法 【案例】使用Spark分析商品数据 【案例】使用Spark交互式分析商品数据 【案例】电影数据分析——用户分析 【案例】电影数据分析——电影分析5.0 15课时 592人学习¥ 399.00 2021/02/21
-
[老汤]Spark 2.x内核原理二之内存管理(Memory Manager)视频课程56分钟学习透Spark 2.x的内存管理的原理,进而可以达到对Spark应用在内存方面的调优课程内容 静态内存模型 统一内存模型 off_heap内存的管理 每一个task需要内存的分配5.0 6课时 1913人学习¥ 49.00 2018/02/26
-
[老汤]Spark 2.x内核原理一之序列化机制视频课程1小时4分钟通过讲解Spark支持的JavaSerializer和KryoSerializer两种序列化机制,使得我们在开发Spark应用的时候选择正确的序列化机制课程内容 Java自带的序列化机制 Kryo序列化机制 JavaSerializer对比KryoSerializer IO流的加解密5.0 6课时 674人学习¥ 39.00 2018/02/26
-
[老汤]Spark 2.x内核原理三之存储管理(Storage Manager)视频课程53分钟熟练学习Spark数据存储的原理课程内容 Block元数据信息 Block增查删流程 Disk存储特点 Memory存储特点5.0 7课时 5724人学习¥ 49.00 2018/02/27
-
赵渝强老师:大数据系列视频课程(新版)(21)Spark SQL3小时23分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Spark SQL课程概述 什么是Spark SQL? 通过case class创建DataFrame 通过SparkSession创建DataFrame 使用带格式的数据文件创建DataFrame5.0 18课时 2257人学习¥ 129.00 2018/02/28
-
赵渝强老师:大数据系列视频课程(新版)(22)Spark Streaming4小时4分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。Spark Streaming课程概述 什么是Spark Streaming和体系结构 演示Demo:NetworkWordCount 开发自己的NetworkWordCount程序 StreamingContext和DStream简介5.0 14课时 2095人学习¥ 129.00 2018/03/04
-
赵渝强老师:大数据系列视频课程(新版)(23)配置 Hive on Spark1小时19分钟本系列课程将基于RedHat Linux 7.4版本、Hadoop 2.7.3、Spark 2 版本多面介绍大数据的整体内容,让学员深入理解并学习运行机制和原理,从而进一步学习大数据的相关内容。知识回顾:Hive基础 准备实验环境 安装和配置MySQL数据库 安装和配置Hadoop 安装和配置Spark5.0 8课时 521人学习¥ 79.00 2021/07/05
-
Spark大数据处理及机器学习【基于Python的Spark 2.3**版】28小时26分钟对于想转行或学习大数据的Python学员,基于已有的Python知识,学习Python大数据,你们拥有巨大的优势。大部分框架使用类Java语言实现,对于Python学员,PySpark是使用Python作为开发语言的程序员的福音,借助PySpark,Python开发人员可以轻松学习大数据。课程简介 什么是Docker技术 为什么要使用Docker Docker中的基本概念 Docker安装5.0 105课时 72874人学习¥ 399.00 2018/08/28
-
大数据之HDFS/Hadoop集群管理视频课程11小时26分钟学习大数据之HDFS,即Hadoop集群管理大数据简介 Hadoop本地模式和伪分布模式 Hadoop完全集群准备工作 Hadoop完全集群安装配置 HDFS命令行接口5.0 19课时 691人学习¥ 190.00 2018/04/02
-
大数据之Mapreduce视频课程7小时30分钟学习MapReduceMapReduce入门案例 远程运行调试MapReduce MapReduce task考察示例 MR调用过程分析、单词统计案例 切片和任务数5.0 17课时 688人学习¥ 170.00 2018/04/17
-
Spark开发核心技能进阶宝典20小时54分钟学会本课程的学员,可以具备企业大数据中级开发/分析岗位所要求的Spark能力。什么是Spark Spark入门 Spark工具集概览 结构化API概览 基础结构化操作5.0 34课时 1515人学习¥ 199.00 2018/05/05
-
Spark的技术应用分享【企业内部分享】1小时20分钟Spark的技术应用分享【企业内部分享】,介绍了Spark在企业内部的使用实例,帮助大家更好的理解Spark及其应用Spark的技术应用分享【企业内部分享】5.0 1课时 2815人学习¥ 0 2018/05/17
-
基于MapReduce的用户评论分类器视频课程(实战京东商城)6小时8分钟本课程属于大数据项目实战课程,本课程主要应用Hadoop结合朴素贝叶斯算法(多项式模型)以及中文分词器构建用户评论分类系统。学完本课程能够学习朴素贝叶斯分类算法的思想及应用,并且能够利用Hadoop构建中文文本分类系统(包括:垃圾邮件分类、文章类型分类等)。课程简介 项目展示及介绍 开发工具、技术及功能分析 Linux环境准备 hadoop2.x分布式安装5.0 15课时 11154人学习¥ 0 2018/05/20
-
Hive语言基础知识筑基宝典视频课程7小时7分钟学习Hive语言开发能力Hive和Impala简介 Hive的安装和使用 数据类型 DDL DML5.0 16课时 3315人学习¥ 59.00 2018/05/26
-
大数据Hadoop-Hive实战视频课程43分钟懂得Hive基本原理了解数据仓库基本知识动手Hive实操建表了解Hive优化策略熟知Hive自定义函数熟悉分区表设计案例Hive结构图和RDBMS异同 Hive例子实操(创建表+Load数据) Hive分区概念和优化 Hive例子实操(连接hbase)5.0 4课时 7324人学习¥ 0 2018/06/06
-
Hadoop系列-HDFS分布式文件系统详解50分钟了解什么是HDFS分布式文件系统熟知HDFS基本概念了解HDFS采用命令动手实操HDFS上传/下载文件脚本了解HDFS的优点和缺点HDFS分布式文件系统概述 HDFS例子实操(创建文件上传数据等) HDFS优点和劣势 HDFS代码讲解和实操(java删除和读取hdfs) 大数据基础知识试卷5.0 5课时 872人学习¥ 19.00 2018/12/06
-
赵渝强老师:免费公开课第五季:大数据之搜狗Log分析1小时41分钟赵渝强老师:免费公开课第五季:大数据之搜狗Log分析赵强老师:免费公开课第五季:大数据之搜狗日志分析5.0 1课时 1874人学习¥ 0 2018/06/08
-
赵渝强老师:免费公开课第七季:分布式计算MapReduce基础1小时26分钟赵强老师:免费公开课第七季:分布式计算MapReduce基础赵强老师:免费公开课第七季:分布式计算MapReduce基础5.0 1课时 1798人学习¥ 0 2018/06/10
-
赵渝强老师:免费公开课第六季:分布式文件系统基础1小时30分钟赵强老师:免费公开课第六季:分布式文件系统基础赵强老师:免费公开课第六季:分布式文件系统基础5.0 1课时 1507人学习¥ 0 2018/06/10