学习路径 > 人工智能 > 机器学习 > Python 3 数据分析与挖掘系列课程完整版

Python 3 数据分析与挖掘系列课程完整版

Python是数据驱动的AI时代相当重要的一门编程语言,但是,目前绝大多数的Python课程都是从IT工程师的角度出发进行讲解,过多强调编程技巧,较少涉及统计分析中所需要关心的问题。本系列课程将基于统计学和数据分析需求出发,讲解如何基于Python完成数据获取、数据管理、统计分析、数据挖掘等工作。

12

门课程

205812

人学习

139小时2分钟

课程总时长

张文彤

特级讲师

讲师评分:4.9

长久观看
 
系统化学习
 
24小时答疑
  资料一键下载
学习路径价 ¥1316.00
立省1360.00元

支持蚂蚁花呗分期

简单5步马上享受花呗分期:

1. 点击立即购买
2. 订单确认页, 点击 ”去支付“
3. 支付中心, 使用【支付宝】付款
4. 使用【支付宝】APP扫描付款二维码
5. 付款方式选择 花呗分期~ 搞定~

查看详情>>
总价 ¥2676.00

第一阶段:  Python数据分析基础

3门课程 31小时54分钟

玩转Pandas:数据管理平台Pandas的使用。 玩转数据可视化:数据可视化工具matplotlib+seaborn的使用。 玩转Python统计分析:常用统计描述与假设检验方法的Python实现。

  • Python数据分析系列视频课程--玩转Pandas

    67节 10小时4分钟
    课程目标:
    Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准,学习其使用方法,是使用Python进行数据分析和数据挖掘的必备条件。本课程将从中国高校综合排名和北京PM2.5实测数据两个实际案例出发,在实战中学习Pandas包的使用方法。学习完本课程后,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,学习如何使用统计图表工具进行数据信息呈现,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。本课程已全部连载完成,未来将根据Pandas功能的变化不定期更新内容。【更新历史】2020年9月,针对课程发布后Pandas至最新的 1.1.1 版增加的新功能对各章节做了增补和更新2020年3月,增加第13章:如何优化Pandas2020年3月,更新第2章:增加如何无缝读写SPSS数据文件,增加对读写命令的整体介绍【课程长度】总时长:9小时【学员基础】学员需要懂得Python语言的基本编程知识,可以先学习免费课程“Python语言轻松入门”。学员事前不要求学习统计分析的基本知识。学员事前不要求有任何统计软件的使用经验。

    课程大纲

    免费试看

  • Python数据分析系列视频课程--玩转数据可视化

    73节 11小时42分钟
    课程目标:
    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到了一个新的高度, pandas + matplotlib + searborn已经构成了数据管理与可视化的一套完整环境。本课程将从中国消费者信心指数项目这一实际案例数据的可视化需求出发,在实战中学习matplotlib+seaborn包的使用方法。学习完本课程后,学员将能够:    学习如何使用matplotlib+seaborn进行数据信息的精美呈现。    学习如何综合使用pandas + matplotlib + searborn环境完成数据可视化工作。    为后续进一步进行数据分析建模和数据挖掘打下坚实基础。【课程长度】总时长:约10小时【学员基础】学员需要懂得Python语言的基本编程知识。学员需要学习pandas的基本使用知识,建议提前或同步学习本系列课程中的pandas课程《玩转Pandas》。学员事前不要求学习统计分析的基本知识。

    课程大纲

    免费试看

  • Python数据分析系列视频课程--玩转Python统计分析

    64节 10小时7分钟
    课程目标:
    以真实商业案例为数据基础,课程内容围绕scipy.stats和statsmodels包的相关功能展开,从统计分析实战的角度出发详细介绍了如何在Python中完成数据描述、t检验、单因素方差分析、卡方检验、相关回归等统计分析操作。通过本课程的学习,学员将深入学习如何正确考察这些方法的适用条件,正确选择所需的方法加以应用,从而既满足了相关统计分析功能的需求,又为进一步学习statsmodels包中的复杂建模功能打下坚实的基础。【课程大纲】第1章:变量的统计描述第2章:连续变量的比较:t检验第3章:检验方法适用条件的考察第4章:多组均数的比较:单因素方差分析第5章:有序分类变量的比较:非参数统计分析方法第6章:无序分类变量的比较:卡方检验第7章:变量间的关联性分析第8章:线性回归模型入门第9章:样本量的计算【课程长度】总时长:10小时【学员基础】学员需要懂得Python语言的基本编程知识。学员事前不要求学习统计分析的基本知识,但建议完全没有统计基础的学员事先学习免费视频课程《统计分析轻松入门》。学员事前不要求有任何统计软件的使用经验。

    课程大纲

    免费试看

第二阶段:  Python统计建模与数据挖掘

3门课程 38小时17分钟

玩转统计模型:各种复杂统计分析模型在statsmodels+sklearn中的实现。 数据挖掘入门:从理论高度介绍数据挖掘方法体系。 玩转数据挖掘:数据挖掘完整流程在sklearn中的实现。

  • 数据挖掘入门视频课程

    40节 7小时8分钟
    课程目标:
    注意:本课程为分析理念入门课程,不提供课件PPT下载,对此介意的学员请勿购买。【课程简介】 数据挖掘来源于数据分析,但又完全不同于数据分析,那么他们之间究竟有怎样的联系与区别,数据挖掘和当下很热的大数据之间又有着怎样的联系? 数据挖掘在企业中的实际应用是怎样的?又出现过哪些让人哭笑不得的案例呢? CRISP-DM作为最成功的数据挖掘方法论,如何应用呢? 如何评估一个数据挖掘项目的实施效果,作为动辄数万数十万投入的项目,又有哪些原因可能导致数据挖掘项目最终失败呢? 本课程为数据挖掘的方法论和分析理念学习,可适用于依赖任何数据挖掘工具的人员。 【课程长度】 7小时

    课程大纲

    免费试看

  • Python数据分析系列视频课程--玩转统计模型

    92节 19小时40分钟
    课程目标:
    请至PC端网页下载本课程代码课件及数据。系统、多面的介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在sklearn和statsmodels中的具体实现方法。本课程为统计原理与操作并重,在详细阐明各种模型算法特点的基础上,再对这些方法的python实现进行学习。学习完本课程后,学员将能够独立使用sklearn和statsmodels拟合各种统计模型,满足实际研究工作或数据挖掘项目中的建模需求。【更新记录】2019.9:增加关联分析一章,1h+时长。【课程大纲】第1章:统计模型课程概述第2章:方差分析模型第3章:线性回归模型第4章:线性回归的衍生模型第5章:logitsic回归第6章:决策树模型第7章:神经网络第8章:支持向量机第9章:主成分分析与因子分析第10章:聚类分析第11章:最近邻分析第12章:生存分析第13章:关联分析【课程长度】总时长:20小时【学员基础】学员需要懂得Python语言的基本编程知识,有基本的程序查错能力。学员事前应当学习统计分析的基本知识,建议完全没有统计基础的学员事先学习免费视频课程《统计分析轻松入门》和《统计模型轻松入门》。本课程为python数据分析系列课程的高级内容,建议学员事先学习《玩转pandas》、《玩转统计分析》等基础课程。

    课程大纲

    免费试看

  • Python数据分析系列视频课程--学习数据挖掘

    64节 11小时27分钟
    课程目标:
    请至PC端网页下载本课程代码课件及数据。Sklearn是python用于数据挖掘以及机器学习的利器,但是其功能庞杂,初学者很难理清脉络,快速学习其应用精髓。本课程以以CRISP-DM为理论指导,系统介绍了sklearn在数据挖掘/机器学习各个环节的功能实现,从数据挖掘实战的角度出发详细介绍如何在sklearn中完成数据预处理、数据降维、数据建模、模型评估等各种操作,并突出特征选择、模型调参,模型集成等在数据挖掘实战环境中的重要课题。学习完本课程后,学员将能够独立使用sklearn完成数据挖掘或机器学习实际项目。【课程大纲】第1章:python机器学习/数据挖掘概述第2章:数据的预处理第3章:特征选择与信息浓缩第4章:回归类模型的训练第5章:类别预测模型的训练第6章:聚类模型的训练第7章:评估模型效果第8章:数据的拆分第9章:模型参数优化第10章:模型集成【课程长度】总时长:12小时【学员基础】学员需要懂得Python语言的基本编程知识,有基本的程序查错能力。学员事前应当学习统计分析的基本知识,建议完全没有统计基础的学员事先学习免费视频课程《统计分析轻松入门》和《统计模型轻松入门》。

    课程大纲

    免费试看

第三阶段:  Python文本挖掘与深度学习

2门课程 21小时42分钟

玩转文本挖掘:文本挖掘(自然语言处理)在word2vec,gensim中的实现。 玩转深度学习: CNN、RNN、LSTM等深度学习模型Keras+Tensorflow环境下的实现。

  • Python数据分析系列视频课程--玩转文本挖掘

    64节 10小时20分钟
    课程目标:
    请至PC端网页下载本课程代码课件及数据。文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,其所涉及的人机对话系统,推荐算法,文本分类等技术在BAT等企业中都得到广泛应用。本课程将使用经典武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学。本次课程将会从基本的分词、词袋模型、分布式表示等概念开始,多面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员直接升级至业界技术前沿。学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。本课程已全部更新完毕,未来将根据方法学的**进展做不定期更新。【课程长度】总时长:约11小时【学员基础】学员需要懂得Python语言的基本编程知识。建议学员事先学习本系列课程中的Pandas课程,本课程中的数据管理将会用到Pandas的相关知识和操作。【课程大纲】第1章:文本挖掘概述第2章:磨刀不误砍柴工第3章:分词第4章:词云展示第5章:文档信息的向量化第6章:关键词提取第7章:抽取文本主题第8章:文本相似度第9章:文档分类第10章:情感分析第10章:自动摘要第11章:自动写作

    课程大纲

    免费试看

  • Python数据分析系列视频课程--玩转深度学习

    64节 11小时22分钟
    课程目标:
    请至PC端网页下载本课程代码课件及数据。系统、多面的介绍卷积神经网络、循环神经网络、长短期记忆网络等深度学习算法的原理,优缺点,并学习这些模型在python( Keras+Tensorflow)环境下的实现方法。本课程为统计原理与操作并重,在详细阐明各种模型算法特点的基础上,再对这些方法的python实现进行学习。学习完本课程后,学员将能够独立使用Keras+Tensorflow拟合神经网络、CNN、RNN、LSTM等各种深度学习模型,并能够使用VGG、ResNet等已有模型进行迁移学习,以满足实际研究工作或数据挖掘项目中的建模需求。【课程大纲】第1章:深度学习概述第2章:准备软件环境第3章:神经网络模型入门第4章:Keras操作入门第5章:卷积神经网络第6章:图像预处理第7章:迁移学习第8章:循环神经网络第9章:长短期记忆网络【课程长度】总时长:11小时【学员基础】学员需要懂得Python语言的基本编程知识,有基本的程序查错能力。学员事前应当学习统计分析的基本知识,建议完全没有统计基础的学员事先学习免费视频课程《统计分析轻松入门》和《统计模型轻松入门》。学员应当熟悉数据挖掘的相关知识,建议学员事先学习《数据挖掘轻松入门》,或者《玩转数据挖掘》课程。

    课程大纲

    免费试看

第四阶段:  数据分析与挖掘行业案例

4门课程 47小时8分钟

基于真实案例,深入讲解数据挖掘与分析模型在各个行业中的具体应用,课程提供全部函数工具和源代码,可直接作为同类业务场景的分析模板加以使用。

  • Python数据分析行业案例课程--客户流失分析

    46节 11小时28分钟
    课程目标:
    注意:1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能。2. 本课程的核心目的是协助学员学习具体业务场景下的解决方案,为降低学员学习难度,课程中均尽量使用简明易懂的代码进行数据整理和模型实现,没有出现任何晦涩高深的代码,并尽量基于pandas、sklearn等标准包接口编程。故此希望看到笔者在课程中炫技的各位编程高手请勿购买本系列课程。请至PC端网页下载本课程代码课件及数据。【课程简介】本课程基于电信行业和银行业的实际流失分析案例,完整实现了流失问题从业务角度出发的评估、定位、数据整理、建模、效果评价、业务实施的完整流程,整个分析流程和相关代码可作为分析模板供学员在工作中直接套用。【课程特色】可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的业务分析模板加以使用。双案例课程结构:精选来自不同行业的真实业务案例,并充分考虑到案例代表性和分析需求上的差异化,更有利于拓展学员的分析能力。【课程长度】总时长:12小时

    课程大纲

    免费试看

  • Python数据分析行业案例课程--信用评分方法

    64节 13小时8分钟
    课程目标:
    注意:1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能。2. 本课程的核心目的是协助学员学习具体业务场景下的解决方案,为降低学员学习难度,课程中均尽量使用简明易懂的代码进行数据整理和模型实现,没有出现任何晦涩高深的代码,并尽量基于pandas、sklearn等标准包接口编程。故此希望看到笔者在课程中炫技的各位编程高手请勿购买本系列课程。请至PC端网页下载本课程代码课件及数据。【课程简介】信用评分是非常特殊且重要的领域,除银行业外,近年来在P2P,网络征信等新兴领域中也颇受重视。本课程使用银行征信和互联网金融征信两个真实案例数据,完整介绍了信用评分卡模型在相关业务领域中的构建和实施流程。整个案例可作为分析模板供学员在信用评分相关的分析项目中直接套用。除集中在解决实际业务问题外,课程还重点介绍了评分卡方法的建立步骤与注意事项,以及变量分箱方法、K-S方法等的实际应用等技术细节,以便学员深刻理解和学习评分卡模型的实际应用细节。【课程特色】可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的业务分析模板加以使用。双案例课程结构:银行案例用于详细阐述评分卡模型的构建细节,互联网金融案例则进一步拓展到自动化分析、大规模变量筛选等互联网金融领域的特殊需求方面,案例代表性和分析需求充分差异化,分析难度梯次上升,更有利于拓展学员的分析能力。【课程长度】总时长:12小时

    课程大纲

    免费试看

  • Python数据分析行业案例课程--推荐系统

    66节 12小时49分钟
    课程目标:
    注意:1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能。2. 本课程的核心目的是协助学员学习具体业务场景下的解决方案,为降低学员学习难度,课程中均尽量使用简明易懂的代码进行数据整理和模型实现,没有出现任何晦涩高深的代码,并尽量基于pandas、sklearn等标准包接口编程。故此希望看到笔者在课程中炫技的各位编程高手请勿购买本系列课程。请至PC端网页下载本课程代码课件及数据。【课程简介】推荐系统在当今的互联网行业中正在起到不可或缺的作用,本课程基于实际案例,由推荐系统的概念、框架、评估体系等入手,完整实现了推荐系统中应用的各类算法,包括协同过滤、矩阵分解、基于内容的推荐算法、结合文本挖掘(词频矩阵、TF-IDF、word2vec)的推荐算法、关联分析、聚类分析在推荐算法中的应用方式等,相关代码可作为分析模板供学员在工作中直接套用。【课程特色】可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的业务分析模板加以使用。双案例课程结构:充分考虑到案例代表性和分析需求上的差异化,精选电影评分和云音乐歌单数据这两个业务案例,分别代表rating和non-rating这两类推荐系统将会面对的典型数据类型,更有利于拓展学员的分析能力。【课程长度】总时长:12小时

    课程大纲

    免费试看

  • Python数据分析行业案例课程--欺诈检测

    47节 9小时42分钟
    课程目标:
    注意:1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能。2. 本课程的核心目的是协助学员学习具体业务场景下的解决方案,为降低学员学习难度,课程中均尽量使用简明易懂的代码进行数据整理和模型实现,没有出现任何晦涩高深的代码,并尽量基于pandas、sklearn等标准包接口编程。故此希望看到笔者在课程中炫技的各位编程高手请勿购买本系列课程。请至PC端网页下载本课程代码课件及数据。【课程简介】欺诈现象遍及商业社会的各个领域,欺诈检测(Fraud Detection,也称反欺诈)则是数据分析与挖掘的一个典型应用领域,同时又具有非常强的行业特征。本课程使用医疗保险欺诈和Kaggle的金融欺诈数据这两个案例数据,完整介绍了欺诈检测的基本思想,以及各类数据分析模型在欺诈检测领域中的构建和实施流程。整个案例可作为分析模板供学员在欺诈检测相关的分析项目中直接套用。本课程还在案例分析中很好的展示了如何基于业务理解,灵活的将聚类分析、Benford定律、关联规则等看似无关的模型用于欺诈检测,这非常有助于学员在实践中更好的拓展数据挖掘建模思路。【课程特色】可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的分析模板加以使用。双案例课程结构:医疗保险欺诈案例用于详细阐述欺诈检测应当如何结合行业特征构建分析模型框架,并最终完成各类模型的实施和应用;金融欺诈案例则多面展示了如何将预测类模型用于欺诈案例的甄别。两个案例结合,完整覆盖了欺诈检测领域中的方法体系。【课程长度】总时长:10小时

    课程大纲

    免费试看

资料下载

课程名称 操作
Python数据分析系列视频课程--玩转Pandas 付费用户专享
Python数据分析系列视频课程--玩转数据可视化 付费用户专享
Python数据分析系列视频课程--玩转Python统计分析 付费用户专享
数据挖掘入门视频课程 付费用户专享
Python数据分析系列视频课程--玩转统计模型 付费用户专享
Python数据分析系列视频课程--学习数据挖掘 付费用户专享
Python数据分析系列视频课程--玩转文本挖掘 付费用户专享
Python数据分析系列视频课程--玩转深度学习 付费用户专享
Python数据分析行业案例课程--客户流失分析 付费用户专享
Python数据分析行业案例课程--信用评分方法 付费用户专享
Python数据分析行业案例课程--推荐系统 付费用户专享
Python数据分析行业案例课程--欺诈检测 付费用户专享

Python 3 数据分析与挖掘系列课程完整版

¥2676.00 ¥1316.00
在线
客服
在线
客服

下载Android客户端

下载iphone 客户端

关注官方微信

返回
顶部