-
集群管理本地软件栈构建41分钟学习HDP软件栈的执行原理072.Ambari Hadoop集群管理软件之HDP软件栈本地仓库搭建 073.Ambari Hadoop集群管理软件之AmbariServer通过本地仓库安装 074.Ambari Hadoop集群管理软件之Hadoop集群本地化安装4.8 3课时 2527人学习¥ 8.00 2015/11/29
-
1+1系列大数据实训视频教程-linux环境搭建1小时55分钟用较短短的时间带你学编程,做有良心的教育linux环境搭建简介 VMWare中安装Ubuntu系统 jdk和eclipse的安装 tomcat mysql和mysql客户端的安装 eclipse下jdbc驱动测试暂无评分 5课时 410人学习¥ 9.00 2017/02/14
-
赵渝强老师:电商大数据项目实战(直播版):(6)使用CDH部署集群1小时1分钟通过电商大数据项目实战课程,将大数据知识系统、多面地进行总结。同时引入机器学习相关的内容,为将来继续搭建CDH的准备工作 安装配置Cloudera Manager和Agent 部署CDH服务5.0 3课时 810人学习¥ 9.00 2019/01/02
-
大数据企业级实战应用:用户画像1小时54分钟企业真实项目,让学生学习企业大数据开发流程,帮助学生建立企业大数据应用思维.。01.用户画像概念 02.性别-年龄进行画像分析 03.性别-年龄进行用户画像MR代码分析与数据解析 04.性别-年龄进行用户画像第一阶段实现运行 05.性别-年龄进行用户画像算法实现5.0 6课时 231人学习¥ 18.00 2020/02/05
-
大数据企业级实战应用:团购网站标签生成59分钟通过学完本教程,你可以将复杂的应用场景快速学习和理解,并快速应用到自己的实战项目中。01.团购网站的标签生成应用-描述-数据结构 02.团购网站的标签生成应用-数据分析过程 03.java编程抽取json串中的评论 04.scala编程实现标签生成程序5.0 4课时 41人学习¥ 18.00 2020/02/05
-
ZooKeeper第三季-ZK客户端编程API使用、观察者模式回调处理视频课程52分钟学习zk核心类库的使用和编程技巧,重点在zk观察者中事件回调机制的使用以及one time方式的注意事项。007.ZooKeeper分布式集群协同之客户端API调用 008.ZooKeeper分布式集群协同之客户端API创建和删除path 009.ZooKeeper客户端API观察者模式与事件回调处理4.9 3课时 1625人学习¥ 19.00 2015/11/30
-
Spark企业案例运用日志分析通过H5跨平台展示【综合业务】2小时47分钟通过此案例学习使用Linux定时器,学习通过spark分析结果保存到mysql数据库里面,最终通过web技术展示到手机端.spark以前在公司做过的案例一个解说 spark案例解说 spark总体概况技术点 测试数据生成器的实现方法 读取日志文件创建可序列化对象5.0 14课时 1385人学习¥ 19.00 2017/06/12
-
大数据培训班之Hadoop视频课程-day5(HDFS架构)5小时56分钟学习HDFS搭建,执行过程。Hadoop第05天-001.HDFS HA搭建 Hadoop第05天-002.HDFS HA搭建-2 Hadoop第05天-003.HDFS分析读过程 Hadoop第05天-004.HDFS文件一致性考查-path立即可见 Hadoop第05天-005.HDFS机架感知-自定义感知类4.6 7课时 588人学习¥ 19.00 2016/08/25
-
大数据培训班之Hadoop视频课程-day3(Hadoop高级模式)5小时13分钟学习使用Xcall脚本,NAT静态ip和文本模式启动hadoop,安全模式使用,日志快照和回收站。Hadoop第03天-001.xcall脚本-NAT静态ip-文本模式启动 Hadoop第03天-002.进程独立启动-win7hosts配置. Hadoop第03天-003.dfs.hosts-dfs.hosts-exclude Hadoop第03天-004.安全模式-编辑日志 Hadoop第03天-005.目录快照.4.9 6课时 582人学习¥ 19.00 2016/08/25
-
[老汤]Spark 2.x实时流计算之Structured Streaming解决的问题(系列五)30分钟理解透Spark中的Structured Streaming解决的问题,从high level的层面理解Structured Streaming,从而为学习和使用Structured Streaming打下坚实的基础本课程内容 Spark Streaming的优点和痛点 Continuous Applications Streaming in Spark的未来5.0 4课时 459人学习¥ 19.00 2018/01/19
-
PowerBI流数据集和Power Automate的使用1小时54分钟掌握Streaming dataset的使用,PowerBI与Power Automate的集成课程介绍 通过流数据集和Automate获取实时数据 Form+Automate+PowerBI实时展示调查问卷 PowerBI通过Automate刷新sharepoint Power Automate视觉对象触发Flow和传递数据5.0 8课时 2994人学习¥ 20.00 2022/02/17
-
大数据培训班之Hadoop视频课程-day9(Hadoop集群)2小时41分钟学习在Hadoop集群上运行mepreduce job。Hadoop第09天-001.RedureTaskRunnable分析-combiner函数 Hadoop第09天-002.在hadoop集群上运行mr job Hadoop第09天-003.在hadoop集群上运行mr作业-YarnJobRunner Hadoop第09天-004.在hadoop使用计数器调试程序输出4.5 4课时 656人学习¥ 29.00 2016/09/09
-
利用Python实现爬虫案例教程3小时40分钟通过本教程的学习带你用Python实现爬虫,为以后的工作夯实基础。01.样本数据分析-影评数据 02.数据分析过程说明 03.直方图生成过程 04.体验使用python urllib2实现网页内容的爬取 05.IDEA下python环境处理5.0 11课时 173人学习¥ 38.00 2020/09/10
-
推荐系统原理剖析和算法实现教程5小时16分钟图文解析,原理剖析,逐步深入的方式对推荐系统进行讲授,让学员知其然知其所以然。01.推荐指标 02.用户行为数据说明 03.基于用户的协同过滤算法基础 04.userCF协同过滤算法实现 05.itemCF基于商品的协同过滤实现5.0 10课时 185人学习¥ 38.00 2020/10/06
-
大数据培训班之Hadoop视频课程-day12(远程调试)4小时9分钟学习RM与Async代码分析,远程调试分析。Hadoop第12天-001.RM与Async代码分析 Hadoop第12天-002.远程调试分析YARN时间二次分发机制 Hadoop第12天-003.远程调试分析-job在提交到集群上 Hadoop第12天-004.RM节点管理器中事件的创建过程 Hadoop第12天-005.使用Google的protobuf实现串行化4.7 5课时 208人学习¥ 39.00 2016/09/09
-
[老汤]Spark 2.x内核原理四之shuffle管理(Shuffle Manager)视频课程54分钟深入了解Spark Shuffle的原理课程内容 MapOutputTracker HashShuffleWriter SortShuffleWriter UnsafeShuffleWriter5.0 9课时 1527人学习¥ 39.00 2019/05/22
-
[老汤]Spark 2.x内核原理一之序列化机制视频课程1小时4分钟通过讲解Spark支持的JavaSerializer和KryoSerializer两种序列化机制,使得我们在开发Spark应用的时候选择正确的序列化机制课程内容 Java自带的序列化机制 Kryo序列化机制 JavaSerializer对比KryoSerializer IO流的加解密5.0 6课时 674人学习¥ 39.00 2018/02/26
-
大规模数据处理引擎Spark内存管理和广播变量教程第5季6小时43分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.shuffleHandle采用判断方式 02.bypassshuffleWriter写入剖析 03.后期合成文件考察 04.spark shuffleWriter总结 05.spark shuffle reader暂无评分 11课时 2人学习¥ 39.00 2020/02/10
-
大规模数据处理引擎Spark部署与资源分配教程第4季5小时14分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.sparkjob资源分配 02.spark配置参数指定-task内核数控制 03.spark job部署模式 04.spark job执行事件触发流出考察 05.spark yarn模式原理-关闭虚拟内存检查5.0 9课时 8人学习¥ 39.00 2020/02/10
-
大规模数据处理引擎Spark入门教程第1季3小时47分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.spark简介 02.spark安装-local 03.spark实现wc(shell版) 04.spark实现wordcount(idea) 05.spark实现wordcount(java版)5.0 10课时 223人学习¥ 39.00 2020/02/10
-
Hbase3小时21分钟学习IDEA下Hbase,能熟练使用和操作,企业级的开发。01.hbase回顾-HRegionServer架构 02.hbase api 03.hbase批量写入 04.hbase查询cache-batch 05.hbase原生查询-ttl-最小版本管理暂无评分 6课时 31人学习¥ 44.00 2019/06/09
-
大数据培训班之Hadoop视频课程-day13(RPC源码分析)4小时37分钟学习通过代码查询RPC,并且会自己分析.Hadoop第13天-001.通过代码考查RPC过程. Hadoop第13天-002.源代码分析RPC类调用构成 Hadoop第13天-003.顺序文件读写 Hadoop第13天-004.顺序文件的mrjob-压缩 Hadoop第13天-005.自定义输入格式-wholefile作为一次输入.4.9 5课时 243人学习¥ 45.00 2016/09/09
-
[老汤]Spark 2.x内核原理二之内存管理(Memory Manager)视频课程56分钟学习透Spark 2.x的内存管理的原理,进而可以达到对Spark应用在内存方面的调优课程内容 静态内存模型 统一内存模型 off_heap内存的管理 每一个task需要内存的分配5.0 6课时 1913人学习¥ 49.00 2018/02/26
-
[老汤]Spark 2.x内核原理三之存储管理(Storage Manager)视频课程53分钟熟练学习Spark数据存储的原理课程内容 Block元数据信息 Block增查删流程 Disk存储特点 Memory存储特点5.0 7课时 5724人学习¥ 49.00 2018/02/27
-
大规模数据处理引擎Spark机器学习教程第8季6小时30分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.Kafka分区和RDD分区对应关系-检查点控制 02.Kafka调优处理 03.spark机器学习-概念-术语 04.spark机器学习-贝叶斯-TF-IDF 05.spark机器学习线性回归-预测红酒质量5.0 12课时 85人学习¥ 50.00 2020/02/10
-
大规模数据处理引擎SparkSQL教程第6季4小时27分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.shuffle-内存-广播-累加器回顾 02.体验spark sql 03.spark sql访问hive(scala版) 04.spark sql访问hive(java版) 05.spark sql操纵list和rdd5.0 12课时 68人学习¥ 50.00 2020/02/10
-
大规模数据处理引擎SparkStreaming教程第7季6小时10分钟图文解析,原理剖析,逐步深入的方式对Spark进行讲授,让学员知其然知其所以然。01.Spark流计算体验 02.Spark流计算基础-集群模式运行流 03.Spark流计算-DStream的注意事项 04.Spark流计算 windows化操作 05.流计算java版实现wordcount5.0 13课时 96人学习¥ 50.00 2020/02/10
-
Hadoop(三)高级特性压缩串行化视频课程9小时25分钟提高Hadoop理解,学习Hadoop核心功能,为在企业更深刻的理解hadoophadoop压缩算法 maven打架与本地搭建 maven本地服务器搭建-maven本地库修改-eclipse配置使用 LZO编解码器编译-安装-集成 Snappy-lz4-编解码器性能对比暂无评分 10课时 183人学习¥ 51.00 2019/05/22
-
Hadoop(终结)RPC过程二次分发机制视频课程11小时21分钟了解YARN时间二次分发机制以及DBInputFormat操纵MySQL数据库。Hadoop第12天-001.RM与Async代码分析 Hadoop第12天-002.远程调试分析YARN时间二次分发机制 远程调试分析-job在提交到集群上后基于事件的变换过程 使用Google的protobuf实现串行化并进行性能对比 RM节点管理器中事件的创建过程2.3 14课时 202人学习¥ 51.00 2019/05/22
-
大数据流处理系统之Apache Kafka专题视频课程3小时21分钟帮助学员详细了解Kafka的分布式消息Q,以及它的原理和适用场景。以及在实际工作中的应用。**用Java的代码帮助学员有效的进行Kafka的分布式开发kafka的基本介绍 kafka设计理念 kafka伪集群部署模式 kafka集群部署模式 kafka的核心配置server.properties3.8 11课时 35845人学习¥ 55.00 2018/05/17