使用Excel做数据分析与数据挖掘

Excel进行数据分析、决策建模、线性回归建模、逻辑回归建模、ARIMA建模、ETL数据处理

44人学习

中级17课时2023/04/25更新

二维码下载学堂APP缓存视频离线看

成长中的老方
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
    • 高薪套餐
  • 课程介绍
  • 课程大纲

适合人群:

1、会使用Excel,但不想学编程语言python 2、提升数据清洗能力 3、升职加薪 4、提升工作效率,优化工作 5、数字化转型

你将会学到:

Excel进行数据分析、决策建模、线性回归建模、逻辑回归建模、ARIMA建模、ETL数据处理

  • 掌握Excel进行数据分析
  • 掌握Excel进行决策树建模
  • 掌握Excel进行线性回归建模
  • 掌握Excel进行逻辑回归建模
  • 掌握Excel进行ARIMA建模
  • 掌握ExcelETL数据处理
  • 掌握Excel IF函数的使用
  • 掌握Excel TTEST函数的使用
  • 掌握Excel Pvalue的含义
  • 掌握Excel数据分析5W1H的打法

课程简介:

使用4个完整案例巩固学习数据分析、决策树建模、线性回归建模、逻辑回归建模、聚类建模、ARIMA建模、ETL数据处理。

1、决策树是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

2、线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

3、逻辑回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归

4、“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。

5、ARIMA模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),也叫求和自回归移动平均模型,是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名时间序列预测方法,所以又称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数

6、ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节

展开更多

课程大纲-使用Excel做数据分析与数据挖掘

  • 第1章案例一(多元回归模型|决策树模型|逻辑回归模型|聚类模型)(1小时3分钟4节)

  • 1-1

    数据清洗与数据分析01案例背景介绍有一家日式连锁餐厅。你就职于运营公司的市场部。几乎所有门店工作日的夜间客流量都不理想,店铺整体的收益性难以提高是公司长年以来所面临的难题。刚好前几日,为了找出应对之策,公司进行了市场调查。你入职后,公司分配给你的第一个工作就是根据调查结果找出“怎样才能改善日夜间的收益性”。究竟该如何分析这些数据?又该提交怎样的报告呢?分析一,顾客的性别和婚姻情况,会对营业额产生影响吗?分析二,光顾次数已消费金额之间存在什么关系?分析三,多元回归分析要做的准备---虚拟变量分析四,梳理影响销售的多个要因报告,我们应该采取什么措施来提高营业额呢?

    [22:20]
  • 1-2

    数据清洗与数据分析02案例背景介绍有一家日式连锁餐厅。你就职于运营公司的市场部。几乎所有门店工作日的夜间客流量都不理想,店铺整体的收益性难以提高是公司长年以来所面临的难题。刚好前几日,为了找出应对之策,公司进行了市场调查。你入职后,公司分配给你的第一个工作就是根据调查结果找出“怎样才能改善日夜间的收益性”。究竟该如何分析这些数据?又该提交怎样的报告呢?分析一,顾客的性别和婚姻情况,会对营业额产生影响吗?分析二,光顾次数已消费金额之间存在什么关系?分析三,多元回归分析要做的准备---虚拟变量分析四,梳理影响销售的多个要因报告,我们应该采取什么措施来提高营业额呢?

    [09:53]
  • 1-3

    分析关键影响因素案例背景介绍有一家日式连锁餐厅。你就职于运营公司的市场部。几乎所有门店工作日的夜间客流量都不理想,店铺整体的收益性难以提高是公司长年以来所面临的难题。刚好前几日,为了找出应对之策,公司进行了市场调查。你入职后,公司分配给你的第一个工作就是根据调查结果找出“怎样才能改善日夜间的收益性”。究竟该如何分析这些数据?又该提交怎样的报告呢?分析一,顾客的性别和婚姻情况,会对营业额产生影响吗?分析二,光顾次数已消费金额之间存在什么关系?分析三,多元回归分析要做的准备---虚拟变量分析四,梳理影响销售的多个要因报告,我们应该采取什么措施来提高营业额呢?

    [05:25]
  • 1-4

    决策树模型|逻辑回归模型|聚类模型分析四,梳理影响销售的多个要因报告,我们应该采取什么措施来提高营业额呢?

    [26:07]
  • 第2章案例二(多元回归模型|聚类)(46分钟2节)

  • 2-1

    数据清洗与数据分析案例背景介绍鬼冢办公用品公司是面向当地企业销售各种办公用品的公司。公司有300名业务员,每天为了业绩不断奔波。你就职于营销企划部,上司交给你的任务是拟定更具效率的营销战略。上次提供了2013年3月(业务旺季)的销售数据。告知如果还需要其他数据,可以向公司系统的负责人追加申请。应该如何对这一个月的数据进行分析了?而且,如果需要追加,什么样的数据能够帮助你提出更有效率的营销战略。从销售金额、商品类型、员工的数据中可以发现什么1、分析一,将销售数据从新统计成以员工为单位的数步骤一,将“销售数据”中的数据以员工为单位重新统计。步骤二,利用“销售数据”中的数据重新统计各类型的商品销售额在员工总销售额中所占比例。步骤三,利用“销售数据”表中数据重新统计每位员工的订单处理时间。步骤四,将上述三个数据透视表相邻排列。条件IF函数公式上午虚拟变量=IF(AND(HOUR(C2)>8,HOUR(C2)<12),1,0) 9:00-11加班虚拟变量=IF(OR(HOUR(C2)<9,HOUR(C2)>17),1,0) 9:00前还是19:00后星期一虚拟变量=IF(WEEKDAY(B2)=1,1,0) 星期二虚拟变量=IF(WEEKDAY(B

    [30:25]
  • 2-2

    聚类模型3、分析三,明确每位员工身上影响销售的特征。4、报告,有良好的销售业绩的是怎样的员工。

    [16:11]
  • 第3章案例三(聚类)(27分钟1节)

  • 3-1

    数据清洗+聚类模型案例背景介绍你就职一家名为“佛罗瑞斯”的老牌邮购销售公司。佛罗瑞斯经营的产品主要是女性服装及杂货,主要销路是商品目录的发放所带来的纸媒订购。然而,近来出现了销售下滑的趋势,于是数年前,公司创建了购物网站。你被分配到了该网站的运营部门。上司交给你的任务,是分析网站的访问日志数据,提出改善网站的措施。但是,你并不怎么懂IT,就算是看到访问日志的数据,也根本不知道是什么意思。在这种情况下,该怎样找出改善措施呢?

    [27:03]
  • 第4章案例四(多元回归模型|ARIMA模型)(51分钟2节)

  • 4-1

    数据清洗与数据分析案例背景介绍你所在的公司是一家医用及工业用图像处理设备的制造商。主打产品为使用特殊相机和传感器对精密仪器或细胞结构进行无死角拍摄,并用电脑对数据进行简单化处理的设备。数年来,虽然销售额或多或少呈上升趋势,但是业界竞争日趋激烈,经营管理层感到了危机感。于是,提出了一个战略,那就是降低成本,以提高利润率,增强价格竞争力。就职于采购部的你接受的任务,即分析每个月的产品销量,制定次月的生产计划及部件的采购计划。分析一,将各月的特征和过去的销量用作解释变量。步骤一,准备1月到12月的虚拟变量。步骤二,将过去的销量错行复制。步骤三,利用透视图筛选出“普通”月份。分析二,对各月的虚拟变量和销售进行多元回归分析。步骤一,遵循变量选择法从各月虚拟变量,过去的销量中选出15个以内的解释变量。步骤二,不断排除,追加解释变量,重复做多元回归分析。分析三,预测今后的销量。步骤一,使用截至2012年的数据,编写预测销量的公式。步骤二,使用步骤一的公式计算2013年的预测值,计算其与实测值的差异。报告,准备多少库存丝数量才能有效抑制机会损失的风险呢

    [37:14]
  • 4-2

    ARIMA模型分析三,预测今后的销量。步骤一,使用截至2012年的数据,编写预测销量的公式。步骤二,使用步骤一的公式计算2013年的预测值,计算其与实测值的差异。报告,准备多少库存丝数量才能有效抑制机会损失的风险呢

    [14:02]
  • 第5章数据挖掘环境与资料(26分钟8节)

  • 5-1

    安装数据挖掘插件(Excel 2013)安装数据挖掘插件(Excel 2013)

    [04:23]
  • 5-2

    安装数据清洗插件PowerQuery(Excel 2013)安装数据清洗插件Power Query(Excel 2013)

    [01:00]
  • 5-3

    配置数据分析加载项(Excel 2013)配置数据分析加载项(Excel 2013)

    [01:02]
  • 5-4

    安装数据库(Sql Server 2019)安装数据库(Sql Server 2019)

    [13:08]
  • 5-5

    导入SQL挖掘数据(Sql Server 2019)导入SQL挖掘数据(Sql Server 2019)

    [03:49]
  • 5-6

    配置数据挖掘外接程序(Sql Server 2019)配置数据挖掘外接程序(Sql Server 2019)

    [01:29]
  • 5-7

    配置数据挖掘链接(Excel 2013 )配置数据挖掘链接(Excel 2013 )

    [01:11]
  • 5-8

    软件与资料软件与资料

    [说明]

“成长中的老方”老师的其他课程更多+

在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部