Spark IDEA调试环境搭建
- 深入理解Spark核心原理
- 精通Spark优化技巧
- 熟练使用Spark和Clickhouse进行分析
- 获得赠送《PyTorch深度学习实战》书籍的机会
数据分析职业是一个多金的职业,数据分析职位是一个金饭碗的职位,前景美好,但是要全面掌握大数据分析技术,非常困难,大部分学员的痛点是不能快速找到入门要点,精准快速上手。
本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
学员通过本课程的学习,不仅可以掌握使用Python3进行Spark3数据分析,还会掌握利用Scala/java进行Spark数据分析,多语言并进,力求全面掌握;另外通过项目驱动,掌握Spark框架的精髓,教导Spark源码查看的技巧;会学到Spark性能优化的核心要点,成为企业急缺的数据分析人才;更会通过Clickhouse和Spark搭建OLAP引擎,使学员对大数据生态圈有一个更加全面的认识和能力的综合提升。真实的数据分析项目,学完即可拿来作为自己的项目经验,增加面试谈薪筹码。
课程涉及内容:
Ø Spark内核原理(RDD、DataFrame、Dataset、Structed Stream、SparkML、SparkSQL)
Ø Spark离线数据分析(千万简历数据分析、雪花模型离线数仓构建)
Ø Spark特征处理及模型预测
Ø Spark实时数据分析(Structed Stream)原理及实战
Ø Spark+Hive构建离线数据仓库(数仓概念ODS/DWD/DWS/ADS)
Ø Clickhouse核心原理及实战
Ø Clickhouse engine详解
Ø Spark向Clickhouse导入简历数据,进行数据聚合分析
Ø catboost训练房价预测机器学习模型
Ø 基于Clickhouse构建机器学习模型利用SQL进行房价预测
Ø Clickhouse集群监控,Nginx反向代理Grafana+Prometheus+Clickhouse+node_exporter
Ø Spark性能优化
Ø Spark工程师面试宝典
课程组件:
集群监控:
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲
![Spark大数据处理及机器学习【基于Python的Spark 2.3**版】](https://s2.51cto.com/images/202101/25/23624972951c2d5c598bfc635d47a0d4.jpg?x-oss-process=image)
![【大数据 Hadoop生态 Spark 2.x 多案例】Spark 2.x基础与提升](https://s2.51cto.com/images/202101/28/2787286af1fa64b69b672a5ca8d002d7.jpg?x-oss-process=image)
![【大数据 Spark 2.x 流数据 多案例】Spark Streaming流数据处理基础与提升](https://s2.51cto.com/images/201801/11/7f1236c10dc8a7df7590f39cd2e4fd24.jpg?x-oss-process=image)
![Spark技术免费公开课视频课程[张敏老师]](https://s2.51cto.com/images/201704/b8cca7b14ee21ba601a961729eef8dbf984177.png?x-oss-process=image)
![【Python版pyspark】Spark大数据基础入门视频课程](https://s2.51cto.com/images/202101/25/1719a30d8680c2b28a527498cfdfa9c6.jpg?x-oss-process=image)
![Spark的技术应用分享【企业内部分享】](https://s2.51cto.com/images/201805/17/216c1e1caac30a89dff54ebf032136e8.jpg?x-oss-process=image)
![【大数据 Hadoop生态 Spark 2.x 多案例】Spark SQL基础与提升](https://s2.51cto.com/images/202101/28/1bea2e6cb1a4031c22df26f694deddc1.jpg?x-oss-process=image)
![【大数据 hadoop生态 Spark2.x】深入Spark2.x内核大数据](https://s2.51cto.com/images/201703/b55f6f1483e16870f1e267dbbe2d11585adac9.jpg?x-oss-process=image)