注释多行三个单引号

1.2万 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
想参加高考和信息学竞赛的人员的学员
你将会学到
学会基础,学会爬虫技术
课程简介


此课程与《编程高手.尹成.带你实战python入门》大体相同,只需购买其中的一门课程。


本课程由清华大学硕士尹成录制,课程的特色在于讲解原理的同时引入了每个程序员都热衷的黑科技术。python是一种跨平台的计算机程序设计语言,是一种面向对象的动态类型语言,最初被设计为编写自动脚本,四折版本的更新和语言功能的添加,越来越多被用于独立的、大型的项目的开发。本课程系python入门教程。

清华编程高手尹成带你实战python数据分析

 

数据分析三剑客numpy pandas Matplotlib

 

Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。

 

一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用Python便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。

 

Python被大量应用在数据挖掘和机器学习领域,其中使用极其广泛的是IPython、Numpy、pandas、Matplotlib等库。对于希望使用Python来完成数据分析工作的人来说,学习IPython、Numpy、pandas、Matplotlib这个组合是目前看来不错的方向。

 

IPython

 

IPython是Python的加强型交互式解释器。

 

IPython是使用Python进行数据分析、处理、呈现的重要选择之一。它是一个与Python科学计算包(主要包括Numpy、pandas、Matplotlib等)紧密联系的交互式开发环境,它同时也是Python科学计算包的一部分。

 

主要特点包括:

 

o 提供给用户一个强大的交互界面。

 

o Jupter Notebook的内核。

 

o 高效的交互式处理、呈现数据(特别是与Matplotlib一起使用)。

 

o 适合并行处理计算。

 

IPython加上一个文本编辑器是科学计算者使用Python进行数据分析、处理、呈现的most佳选择之一。

 

IPython主要包括:

 

o 一个强大的、交互式的Python壳

 

o Jupyter内核,支持用户在Jupyter Notebook以及其他终端与IPython的交互

 

IPyton壳

 

2017年most新发布的IPython壳以及内核具有以下这些重要的特性:

 

o 多面的对象检查。

 

o 记录输入历史。

 

o 缓存输出结果。

 

o 扩展的代码补全功能,可以补全变量、关键字、文件名、函数名等。

 

o 对系统“魔法”方法的扩展,可以处理与操作系统相关的任务。

 

o 丰富的配置系统支持不同状态的切换。

 

o 历史信息登录与重载。

 

o 支持不同语法。

 

o 轻松嵌入到其他Python程序中。

 

o 对pdb调试器和Python测试工具的集成。

 

Numpy

 

Numpy是Python科学计算库的基础。

 

主要包括:

 

o 强大的N维数组对象和向量运算

 

o 一些复杂的功能

 

o 与C/C++和Fortran代码的集成

 

o 实用的线形代数运算、傅立叶变换、随机数生产等

 

Numpy提供了一个简洁的C语言接口,可以非常方便地使用C语言编写的代码操作Numpy数组对象,反过来使用C语言生成的数组也可以轻松的转化成Numpy数组对象;这一特性使得Python轻松地与其他编程语言C/C++粘结在一起。Numpy除了用作科学计算,也可以用作多维度普通数据的容器;并且可以定义任何类型的数据,使得Numpy高效、无缝地与各种类型的数据分析库连接起来。

 

Numpy的主要对象是一个多维度的、均匀的多维数组。Numpy提供了各种函数方法可以非常方便灵活的操作数组,熟练学习数组的基本概念是使用数组这种数据结构的基本要求。

 

pandas

 

pandas是建立在Numpy基础上的高效数据分析处理库,是Python的重要数据分析库。

 

pandas提供了众多的高级函数,极大地简化了数据处理的流程,尤其是被广泛地应用于金融领域的数据分析。

 

pandas主要包括:

 

o 带有标签的数据结构,主要包括序列(Series)和数据框(DataFrame)等。

 

o 允许简单索引和多级索引。

 

o 整合了对数据集的集合和转换功能。

 

o 生成特定类型的数据。

 

o 支持从Excel、CSV等文本格式中文导入数据,以Pytables/HDF5格式高效地读/写数据。

 

o 能够高效地处理带有默认值的数据集。

 

o 能够直接进行常规的统计回归分析。

 

Matplotlib

 

 

 

Matplotlib是一个主要用于绘制二维图形的Python库。

 

数据可视化是数据分析的重要环节,借助图形能够帮助更加直观地表达出数据背后的”东西”。

 

Matplolibmost初主要模仿Matlab的画图命令,但是它是独立于Matlab的,可以自由、免费使用的绘图包。Matplotlib依赖于之前介绍的Numpy库来提供出色的绘图能力。Matplotlib项目是John Hunter在2002年发起的,目标是建立一个具备以下特点的Python绘图工具包:

 

o 能够绘制出高质量的图形,并且图形里面的镶嵌的文本必需足够美观。

 

o 能够和Tex文档一起输出。

 

o 能够嵌入到GUI(图形用户界面)应用程序中。

 

o 代码足够简洁并且可扩展性强。

 

o 绘图命令足够方便。

 

经过社区多年以来的努力,Matplotlib已经具备了上面列出的所有特点。现在Matplotlib被广泛地应用于各种生产、科学研究等环境中,比如在网络服务中动态生成图形、在IPython壳下交互使用Matplotlib绘图等。

 

Matplotlib从概念上可以分为三层:

 

matplotlib.pylab,这一层给主要给用户提供一些简单的命令来生成图形,语法风格和Matlab非常接近。Matplotlib的API,这一层主要给用户提供了直接创建图形、线条、文本等的功能。这是一个抽象层,它并不关心图形的输出。most后一层是后端,主要是管理图形的输出等其他一些功能。

常见问题
问:高考对python要求可以做到吗?
答:这里面有你想要的
展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交