《R语言数据分析与挖掘》(微课版)

深刻理解R语言的精髓,并能够灵活、高效地使用R语言进行数据管理、数据可视化以及数据分析和挖掘

1826人学习

中级131课时2022/04/09更新

二维码下载学堂APP缓存视频离线看

谢佳标
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
  • 课程介绍
  • 课程大纲

适合人群:

本序列视频可作为高等院校数学科学与大数据技术、数据应用与管理专业相关教材,亦可作为从业者进行数据分析相关工作的实战。

你将会学到:

深刻理解R语言的精髓,并能够灵活、高效地使用R语言进行数据管理、数据可视化以及数据分析和挖掘

课程简介:

【为什么要学习本门课程】

本序列视频由浅入深、内容丰富、全面系统地介绍了R语言基础知识和使用R语言进行数据可视化、数据分析与挖掘的方法。而且能学会从实际问题分析入手,应用R语言来解决商业数据分析的问题。

【课程特点】

1.        基于R语言

本系列视频之所以采用R语言,是因为它具有强大的图形展示和统计分析功能,可免费使用和更新并具有大量的可随时加载的有针对性的扩

2.        理论与应用结合

本系列视频详细地介绍了R语言在数据处理、数据可视化和数据分析与挖掘中的应用,侧重于理论与应用相结合,实例丰富且通俗易懂。本书以问题为导向,通过问题来介绍R语言的使用方法。

3.        案例丰富且实用性强

本系列视频案例丰富,有很强 的针对性。各章详细介绍了R语言下案例的具体操作过程,学者只需按照视频中步骤一步步操作,就能掌握数据分析能力,解决实际工作问题。

【主题大纲&设计思路】

第1章:R语言数据分析概述

第2章:R语言数据操作基础

第3章:R语言数据读写

第4章:数据基本管理

第5章:数据预处理

第6章:R语言重要绘图技术

第7章:高级绘图工具

第8章:聚类分析

第9章:理解线性回归

第10章:决策树

第11章:神经网络与支持向量机

第12章:模型性能评估

展开更多

课程大纲-《R语言数据分析与挖掘》(微课版)

  • 第1章R语言数据分析概述(29分钟4节)

  • 1-2

    数据分析流程讲解数据挖掘标准流程CRISP-DM方法论,是一种业界认可的用于指导数据挖掘工作的方法。按照CRISP-DM方法论,一个数据分析与挖掘的完整流程包括6个阶段,分别是业务理解、数据理解、数据准备、建立模型、模型评估和模型发布。

    [03:51]
  • 第2章R语言数据操作基础(3小时20分钟23节)

  • 2-1

    数据类型判断及转换R语言中用来存储数据的类型有多种,包括数值型(numeric)、整数型(integer)、逻辑型(logical)、日期型(Date)、字符型(character)、复数型(complex)。此外,也可能是缺省值(NA)和空值(NULL)。其中最经常用到的4种类型是数值型、逻辑型、日期型和字符型。R语言中提供了一系列用来判断某个对象的数据类型和将其转换为另一种数据类型的函数。

    [11:16]
  • 2-2

    日期类型数据处理函数介绍R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它存储的是天,不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。

    [07:26]
  • 2-3

    日期或时间格式处理函数format详解Sys.Date()、Sys.time()、Sys.timezone()、date()这几个函数不需传参,返回系统当前的日期、时间和时区。利用as.Date()函数可以将一个字符串转换为日期值,默认格式为yyyy-mm-dd。结果显示为字符串,但实际是用double存储的。format()函数将日期/时间输出为字符串。

    [10:49]
  • 2-4

    R语言数据对象概述R语言拥有许多用于存储数据的对象类型,常用数据对象包括向量(vector)、矩阵(matrix)和数组(array)、因子(factor)、列表(list)和数据框(data.frame)。它们在存储数据的类型、创建方式、结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同。多样化的数据对象赋予了R灵活处理数据的能力。

    [06:04]
  • 2-5

    向量的创建R语言最基本的数据对象是向量(vector),向量是以一维数组的方式管理数据。在大多数情况下都会使用长度大于1的向量,可以在R中使用c( )函数(代表合并combine)和相应的参数来创建一个向量。向量的数据类型可以是字符型、逻辑值型(TRUE/T、FALSE/F)、数值型和复数型。一个向量的长度是它含有元素的数量,可以用length( )函数来获取。

    [07:14]
  • 2-6

    向量化运算详解因为R语言是矢量化的语言。其强大的方面之一就是函数的向量化。这意味着操作自动地应用于向量的每一个元素,不需要遍历向量的每个元素。

    [11:24]
  • 2-7

    生成序列seq和rep函数详解冒号运算符(:)会生成增量为1或者-1的数列。对于增量不为1的数列,可以使用seq函数。rep( )是重复函数,它可以将某一向量重复若干次。

    [09:03]
  • 2-8

    向量索引当访问向量中的部分元素时,通常采用索引的方式,即使用[ ]实现索引。具体用法如下:根据元素在向量中的位置选出元素,它的初始位置是 1( 而不像其他某些语言一样是0);索引前加负号(-),排除向量中对应位置的元素,返回其他位置的元素;使用向量索引来选择多个元素值;使用逻辑向量根据条件来选择元素;使用表达式选择元素;使用元素对应的名称选择元素。

    [07:35]
  • 2-9

    矩阵和数组详解利用矩阵可以描述二维数据,和向量相似,其内部元素可以是实数、复数、字符、逻辑型数据。矩阵使用两个下标来访问元素,A[i,j]表示矩阵A第i行、第j列的元素。多维数组可以描述多维数据。数组有一个特征属性叫维数向量(dim属性),它的长度是多维数组的维数,dim内的元素则是对应维度的长度。矩阵是数组的特殊情况,它具有两个维度。

    [13:25]
  • 2-10

    因子详解因子是以一种简单而又紧凑的形式来处理分类(名义)数据的数据对象。因子用水平来表示所有可能的取值。如果数据集有取值个数固定的名义变量,因子特别有用。因子又分为有序因子和无序因子,比如说“客户等级”变量,里面的值有“高”、“中”、“低”,是有优先顺序关系的,可以进行大小比较,“高”>“中”>“低”,此为有序因子;“客户性别”变量,里面的值为“男性”、“女性”,此时无大小之分,此为无序因子。

    [10:17]
  • 2-11

    列表和数据框详解列表和数据框内每列元素的数据类型可以不同,列表内的长度也可以不同。一般地,在使用R语言进行数据分析和挖掘的过程中,向量和数据框使用频率,列表则用于存储较复杂的数据。

    [12:19]
  • 2-12

    基本文本处理函数概述基本文本处理包括字符串元素个数统计、字符串的合并及拆分、字符串的提取和替换以及字符编码转换等操作。

    [07:55]
  • 2-13

    基本字符操作函数讲解使用nchar()函数统计字符串中元素个数。tolower()函数是将所有字母转换成小写,toupper()函数是将所有字母转换成大写,casefold()函数默认是将所有字母转换成小写(等价于tolower),如将参数upper设置为TRUE,则实现将所有字母转换成大写(等价于toupper)

    [07:05]
  • 2-14

    字符串链接函数介绍字符串连接是较为常见的字符操作,在此R语言提供了paste()函数,它不仅可以实现字符串的连接,也可以实现字符向量的连接,无论是字符向量还是字符串,在连接前paste会把对象首先转换为字符后再进行连接,另外,当向量连接时,较短的向量会循环使用。

    [09:13]
  • 2-15

    字符串匹配函数讲解R语言有多种方法用于判断特定元素在另一个向量中是否存在,常用方法有match函数族和grep函数族。match函数族用于返回匹配或部分匹配的元素下标,匹配参数不支持正则表达式,与match函数不同,grep函数族可通过正则表达式在给定的对象中搜索文本。

    [13:47]
展开更多
在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部