数据转换六

1640 未经授权,禁止转载了解课程
广告图
关闭按钮

试看结束,购买课程后可继续观看

试看结束,本课程暂不对外售卖

课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
了解回归算法的同学
你将会学到
学习Spark中回归算法的使用
课程简介

这个课程以一个项目来讲解Spark中怎么使用线性回归、逻辑回归以及SVM等算法模型。


项目主要是预测航班的延迟时间,项目是按照如下的流程来讲解:

图片.png在数据转换中,也详细讲解了Spark中的StringIndexer、OneHot编码、VectorAssembler等特征转换API。

在模型训练地方,详细讲解了交叉验证的功能



【老汤人工智能】机器学习课程体系分为三部分:

机器学习一之数学基础(https://edu.51cto.com/course/14792.html):从微积分和线性代数两个方面讲解机器学习需要的数学知识

机器学习二之线性回归(https://edu.51cto.com/course/16010.html  ):讲解机器学习中最简单也是最常用的线性回归算法(包括一元线性回归和多元线性回归算法)

机器学习三之逻辑回归(https://edu.51cto.com/course/16009.html  ):讲解机器学习中分类算法(也就是逻辑回归算法),还讲解了解决机器学习的过拟合问题

机器学习四之模型调试(https://edu.51cto.com/course/16004.html ):讲解机器学习中怎么来评估模型、测试模型以及怎样定位模型问题等

机器学习五之SVM算法(https://edu.51cto.com/course/16003.html):讲解机器学习中应用很广泛的支持向量机算法(即SVM算法)

机器学习六Spark机器学习实战一(https://edu.51cto.com/course/17300.html  ):航班延迟预测

机器学习七之决策树算法(https://edu.51cto.com/course/16002.html):讲解机器学习中决策树算法,以及基于决策树的回归树算法、提升树算法以及梯度提升算法等算法

机器学习八Spark机器学习实战二(https://edu.51cto.com/course/17345.html):运动数据分类

机器学习九之非监督类型算法(https://edu.51cto.com/course/16001.html):讲解机器学习中非监督类型的算法,包括:聚类算法(K-Means算法)以及PCA降维算法

机器学习十Spark机器学习实战三(https://edu.51cto.com/course/17381.html  ):uber载客位置聚类分析

机器学习十一Spark推荐系统实战(https://edu.51cto.com/course/14871.html ):讲解怎样使用Spark实现推荐系


Scala、Spark Core、Spark SQL以及Spark Streaming的学习,请在51CTO学堂搜索"老汤"


展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
讨论区空空如也,你来讲两句~
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交

课程大纲

自动连播
华为新版模拟器ENSP_Pro 优缺点介绍软考施行机考,大家觉得是好?还是不好?评论区一起讨论一下吧!华为新版模拟器ENSP_Pro安装方法①51CTO上线短视频功能了-大家可以关注下哦华为新版模拟器ENSP_Pro安装方法③华为新版模拟器ENSP_Pro安装方法②云原生讲师宽哥携手短视频,祝51CTO18周年生日快乐!软考施行机考,选择题如何高效备考呢?运维讲师徐亮伟刚发布一则短视频,祝51CTO18周年生日快乐!数据库讲师风哥入驻短视频,祝51CTO继续发展壮大,为IT人成长赋能软考备考的四阶段学习模型软考报名后,该如何准备?华为模拟器哪个好用?两种不同的Snort架构实战Snort Inline工作模式配置实战互联网架构发展趋势轻松理解并熟悉TCP三次握手系统集成项目管理工程师:信息技术基础心之所向: 从DBA到开源创业者的转型之路华为2023新版模拟器ENSP-Pro安装方法①基于Linux部署—肖哥WPS表格-Excel实用微技巧使用docker容器技术构建一套网页版AIGC技术平台轻松理解并熟悉TCP四次挥手状态转换23年软考信息系统项目管理师:系统集成Pandas对数据作简单浏览Oracle数据库日常巡检方法利用ChatGPT自动生成思维导图51CTO软考总监祝51CTO18周年生日快乐!什么是Power Pivot大数据克雷祝51CTO18周年生日快乐!按能源的支配能力划分人类还处于不完整的行星文明华为交换机堆叠技术如何配置网工讲师summer课堂,祝51CTO18周年生日快乐!华为2023新版模拟器ENSP-Pro安装方法③基于Windows部署—肖哥从开发工程师到架构师的角色转变运维讲师韩立刚,祝51CTO新的征途再谱新篇!shell脚本一天一练--day1【王佩丰】Excel2010基础视频第1讲:认识Excel 2010网络管理不能随便乱做,一定要注意规范和安全要求Oracle19c快速安装过程VBA视频教程:什么是VBA如何成长为高阶售前ChatGPT自动生成工作计划前端李游携手短视频,祝51CTO18周年生日快乐!看漫画学Python:Python的历史快速学习网络技术的小秘密!hybrid怎么就成华为或H3C私有技术了?Excel一个公式搞定所有数据的分类整理rac数据库如何识别存储磁盘并创建asm磁盘组数据分析之电商数据整体任务分析
该课程为PDU课程
请前往PDU官网查看
我知道了