数据清洗与数据分析
- 掌握Excel进行数据分析
- 掌握Excel进行决策树建模
- 掌握Excel进行线性回归建模
- 掌握Excel进行逻辑回归建模
- 掌握Excel进行ARIMA建模
- 掌握ExcelETL数据处理
- 掌握Excel IF函数的使用
- 掌握Excel TTEST函数的使用
- 掌握Excel Pvalue的含义
- 掌握Excel数据分析5W1H的打法
使用4个完整案例巩固学习数据分析、决策树建模、线性回归建模、逻辑回归建模、聚类建模、ARIMA建模、ETL数据处理。
1、决策树是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
2、线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。
3、逻辑回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归
4、“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。
5、ARIMA模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),也叫求和自回归移动平均模型,是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数
6、ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲
- 第一章 案例一(多元回归模型|决策树模型|逻辑回归模型|聚类模型)
- 1-1试看 数据清洗与数据分析0122:20
- 1-2试看 数据清洗与数据分析0209:53
- 1-3试看 分析关键影响因素05:25
- 1-4决策树模型|逻辑回归模型|聚类模型26:07
- 第二章 案例二(多元回归模型|聚类)
- 2-1数据清洗与数据分析30:25
- 2-2聚类模型16:11
- 第三章 案例三(聚类)
- 3-1数据清洗+聚类模型27:03
- 第四章 案例四(多元回归模型|ARIMA模型)
- 4-1数据清洗与数据分析37:14
- 4-2ARIMA模型14:02
- 第五章 数据挖掘环境与资料
- 5-1安装数据挖掘插件(Excel 2013)04:23