Spark提取特征1

592 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
Python开发者, 大数据开发者, Spark开发者, 零基础初学者
你将会学到
零基础学习使用Python编写Spark代码,贯穿课程的项目进行实战锻炼。学习使用Spark进行数据预处理、数据分析、机器学习、构建推荐引擎等。
课程简介

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。现在Spark的应用越来越广泛,市场上对Spark工程师的需求量也越来越大。

 

目前市面上的Spark课程基本上都是使用scala语言。但是随着Python在数据分析、大数据和人工智能的广泛使用,越来越多的企业选择使用Python来编写Spark代码。为适应更多企业的实际需求,特此推出Python大数据之Spark编程基础与提升系列课程。

 

本课程由清华学神51CTO高级讲师刘声老师亲自零基础授课,内容详实,深入浅出。学员可在两周内学习大数据Spark开发的Python编程技术

 

此外,学员还可以学习刘声老师的另一个大数据课程《Python大数据之Hadoop编程基础与提升》https://edu.51cto.com/course/12650.html

 

课程目录

一、Spark入门

Spark简介和启动方法

【案例】使用Spark分析商品数据

【案例】使用Spark交互式分析商品数据

 

二、Spark数据预处理与分析

【案例】电影数据分析——用户分析

【案例】电影数据分析——电影分析

【案例】电影数据分析——评分分析

 

三、Spark机器学习之特征提取

one-hot向量的原理与实战

Spark提取特征1

Spark提取特征2

 

四、Spark机器学习之核心应用

Spark SQL库介绍

Spark机器学习库ml介绍

Spark机器学习实战

 

五、企业项目实战:使用Spark机器学习库构建电影推荐引擎

spark机器学习之推荐引擎1

spark机器学习之推荐引擎2

 

六、附:使用Spark完成Hadoop作业

【作业解答】商品数据分析


展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交