数据质量分析的必要性
{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }}
{{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }}
{{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}
分享
适合人群
数据分析师、商业智能(BI)和企业数据仓库(EDW)的管理人员、建模人员、分析和开发人员、系统管理员等,想了解数据分析和数据挖掘的朋友。
你将会学到
了解数据探索的重要性,学习缺失值的识别及利用常用算法(线性回归插补、随机森林插补)等方法对缺失值进行还擦不,学习异常值的判定方法及R语言实现,对数据间的关系进行量化,并对相关系数进行可视化展示。
课程简介
本课程是谢老师在数据挖掘实战班培训的现场视频,通过通过理论与实践结合的方式,让学习者学习缺失值及异常值的常用识别方法及脏数据处理能力,并求出数据间的相关系数,并对其结果进行可视化展示:
1) 数据质量分析的基本原理
2) 缺失值产生的常见原因
3) 缺失值的识别
4) 利用科学的方法对缺失值进行插补
5) 异常值识别的常用方法
6) 利用聚类分析进行异常值检测
7) 计算变量间的相关系数
8) 对相关系数进行可视化还暂时
本课程配套课件和脚本均可下载,方便学员跟着视频自己动手操作。
展开更多
{{tips.text}}
{{ noteHeaderTitle }}
笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
{{ detail.username }}
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
公开笔记
保存提问
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交课程大纲
自动连播
22课时
R语言入门基础实战培训视频课程
63763人学习
谢佳标
4.8
¥19.00
16课时
R语言绘图基础培训视频课程
23558人学习
谢佳标
4.9
¥11.00
19课时
一:R语言快速上手
16065人学习
谢佳标
5.0
¥89.00
12课时
R语言基础与提升系列之新手上路视频课程
12184人学习
谢佳标
5.0
会员免费
36课时
数据分析之R语言实战视频教程
10701人学习
谢佳标
4.5
¥199.00
22课时
R语言可视化数据挖掘工具:Rattle基础与提升视频课程
9425人学习
谢佳标
4.2
¥79.00
21课时
数据挖掘模型篇之R语言实践视频课程
9091人学习
谢佳标
4.3
¥59.00
16课时
机器学习及模型评估篇之R语言实践视频课程
7276人学习
谢佳标
5.0
¥49.00