大道至简:利用R语言玩转精准数据挖掘视频课程

本课程结合讲师的学习和工作经验,把R语言和数据挖掘的基本知识和重点难点很好的结合,注重学以致用,按照由深入浅的方式,层层推进使得学员拾阶而上的逐级学习相关内容。学习完课程可以学习:、聚类分析、关联规则算法、KNN近邻算法...

2277人学习

高级13课时2016/09/19更新

二维码下载学堂APP缓存视频离线看

谢佳标
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
  • 课程介绍
  • 课程大纲

适合人群:

对使用R语言进行数据挖掘感兴趣者,尤其是希望获得R语言和数据挖掘基础和思想,想在实际中快速使用R语言进行数据挖掘以解决问题的在校学生、在职工作者

你将会学到:

本课程结合讲师的学习和工作经验,把R语言和数据挖掘的基本知识和重点难点很好的结合,注重学以致用,按照由深入浅的方式,层层推进使得学员拾阶而上的逐级学习相关内容。学习完课程可以学习:、聚类分析、关联规则算法、KNN近邻算法、决策树算法、其他机器学习算法的基本原理及R语言实现。

课程简介:

1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,学习R语言数据挖掘的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中学习相关知识和技能;

3. 课程紧紧抓住R语言和数据挖掘的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。



展开更多

课程大纲-大道至简:利用R语言玩转精准数据挖掘视频课程

  • 第1章R语言精要(35分钟2节)

  • 1-1

    R语言数据对象概要通过创建不同的对象(数据对象、图形对象、模型对象、自定义方程)详细介绍了在R语言中万物皆对象的说法,通过实际案例演示了如何创建向量、矩阵、数组、数据框和列表等数据对象。学员学习完本小节的内容,懂得R语言中的常用数据对象创建、判断和转换的方法,为以后的数据分析和处理打下坚实的基础。

    [24:01]
  • 1-2

    R语言数据导入概要R语言没有提供图形化的数据导入界面,本小节利用RStuido导入外部的txt、csv文件;也介绍了利用read.table函数导入txt、csv文件数据;让学员对外部文本文件数据导入到R有基本的能力。

    [11:00]
  • 第2章聚类分析(1小时15分钟3节)

  • 2-1

    距离的计算及数据标准化处理本小节介绍了连续型变量间距离的计算方式;介绍了数据标准化处理的基本原理;并利用了caret扩展包中的preProcess函数快速实现数据的标准化处理,通过例子演示了利用preProcess函数和其他函数实现标准化和归一化处理的结果。

    [21:47]
  • 2-2

    常用聚类算法原理及R语言实现常用聚类算法介绍,并对K均值聚类及层次聚类算法原理的详细讲解;最后介绍了不同聚类算法在R语言中对应的函数实现。

    [16:31]
  • 2-3

    聚类分析案例演示利用K-Means聚类对Vehicle数据集进行聚类分群,并通过汽车类型指标查看聚类效果;利用cluster函数对洛杉矶街区数据进行层次聚类,并绘制聚类系谱树图,并利用聚类结果对街区进行分群标识,在经纬度图上把街区数据展现出来;最后利用cluster函数对mtcars数据集进行层次聚类,并对结果进行详细解读。

    [37:10]
  • 第3章关联规则(26分钟1节)

  • 3-1

    关联规则案例演示简单介绍了关联规则的基本原理,并详细介绍了R语言关联规则的实现及其他相关函数;介绍了关联规则可视化包arulesViz;最后通过超市购物数据进行事务型数据的探索,利用as函数进行数据格式转换,利用itemFrequency函数查看包含该商品的交易比例;通过arules函数构建关联规则模型,并对关联规则进行排序和筛选。

    [26:26]
  • 第4章KNN近邻算法(1小时25分钟2节)

  • 4-1

    KNN算法原理及R语言实现详细讲解了KNN近邻算法思想,KNN算法流程,如何对数据进行标准化以及呀变量处理;以及KNN算法的R语言实现。

    [24:26]
  • 4-2

    KNN算法案例详解利用KNN算法对鸢尾花数据集iris建立分类器,并利用混淆矩阵查看预测误差率,其中利用caret包的creatDataPartition函数对数据进行分区,并通过自定义函数ceshi让学员清楚KNN近邻算法的实现步骤。最后利用KNN算法对乳腺癌数据识别患者,对汽车类型进行识别等。

    [01:01:30]
  • 第5章决策树算法(1小时5分钟2节)

  • 5-1

    决策树算法基本原理及R语言实现介绍了决策树的基本思想以及其优缺点。我们从理论上概述决策树的构建过程,这一过程包括如下四个步骤。1、决策树的生成;2、生成树的剪枝;3、生成规则;4、模型性能和预测。详细介绍了C5.0、CART算法的R语言实现,并利用不同的决策树算法对汽车类型进行识别。

    [50:06]
  • 5-2

    条件推理算法决策树的案例演示R语言中的party包主要用于实现条件推理决策树,介绍了ctree函数的参数设置。通过运用条件推理决策树算法对汽车类型进行识别,并绘制决策树图进行直观展示。

    [15:33]
  • 第6章其他机器学习算法(29分钟2节)

  • 6-1

    五折交叉验证方法及其他机器学习算法R语言实现介绍了评估和选择合适的模型和算法:五折交叉验证的方法。并介绍了组合算法、随机森林、人工神经网络、支持向量机算法的R语言实现。

    [12:34]
  • 6-2

    利用其他机器学习算法对cars数据集进行预测利用数据集cars作为案例演示:介绍了构建五折交叉验证下标的代码,并通过for循环构建五折交叉验证,通过对训练集和测试集进行预测,利用平均误差率最小原则,选择最优模型对其他样本进行预测。

    [16:57]
  • 第7章Rattle工具介绍(22分钟1节)

  • 7-1

    Rattle工具介绍介绍了R语言数据挖掘可视化工具—Rattle的主要功能。包括:数据导入、数据探索、数据可视化、数据建模及模型评估等操作。让学员能利用rattle工具快速完成数据挖掘工作的目的。

    「仅限付费用户」点击下载“脚本和数据.rar”

    [22:46]
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部