- 畅销套餐
- 精选套餐
- 人气套餐
- 尊享套餐
- 高薪套餐



















- 课程介绍
- 课程大纲试看
- 讲师好课47
- 学员评价
适合人群:
数据分析师、商业智能(BI)和企业数据仓库(EDW)的管理人员、建模人员、分析和开发人员、系统管理员等,想了解数据分析和数据挖掘的朋友。
你将会学到:
了解数据探索的重要性,学习缺失值的识别及利用常用算法(线性回归插补、随机森林插补)等方法对缺失值进行还擦不,学习异常值的判定方法及R语言实现,对数据间的关系进行量化,并对相关系数进行可视化展示。
课程简介:
本课程是谢老师在数据挖掘实战班培训的现场视频,通过通过理论与实践结合的方式,让学习者学习缺失值及异常值的常用识别方法及脏数据处理能力,并求出数据间的相关系数,并对其结果进行可视化展示:
1) 数据质量分析的基本原理
2) 缺失值产生的常见原因
3) 缺失值的识别
4) 利用科学的方法对缺失值进行插补
5) 异常值识别的常用方法
6) 利用聚类分析进行异常值检测
7) 计算变量间的相关系数
8) 对相关系数进行可视化还暂时
本课程配套课件和脚本均可下载,方便学员跟着视频自己动手操作。
课程大纲-R语言实战之数据探索视频课程
资料下载第1章数据质量分析的基本理论知识(38分钟2节)
第2章缺失值处理的高级方法(1小时52分钟6节)
第3章异常值检测(1小时43分钟7节)
3-5
异常值检测:boxplot.stats和boxplot函数异常值检测:利用boxplot.stats函数识别异常值,并利用boxplot函数绘制箱线图,直接从图形中识别异常值。
[15:44]开始学习3-7
异常值检测:使用kmeans聚类进行异常值检测异常值检测:使用kmeans聚类识别异常点,并通过可视化的手段对样本的类中心和异常点在散点图上进行展示。
「仅限付费用户」点击下载“异常值监测视频脚本.txt”
[17:36]开始学习第4章变量间的相关性分析(55分钟4节)
4-3
求变量间相关系数及显著性检验利用base包中的cor( )函数计算连续变量间的相关系数,并利用cor.test()函数对相关系数进行显著性检验;利用psych包中的corr.test( )函数计算连续变量间的相关系数及显著性检验。
[10:51]开始学习
“谢佳标”老师的其他课程更多+
5