★读取统计软件的数据文件
Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准,学习其使用方法,是使用Python进行数据分析和数据挖掘的必备条件。
本课程将从中国高校综合排名和北京PM2.5实测数据两个实际案例出发,在实战中学习Pandas包的使用方法。
学习完本课程后,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,学习如何使用统计图表工具进行数据信息呈现,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。
希望快速入门的学员可以先跳过课程中带★的章节进行速通,然后再全面学习剩余的内容。
说明:为更贴近实战需求,本课程中的思考练习题一律不提供标准答案(因为实际项目不可能存在标准答案),望知悉。
【更新历史】
2024年7月:针对pandas 3.0(dev)版,将课程更新升级为“玩转pandas 3(2024版)”。
2022年10月:针对Anaconda 10月最新版(python 3.9)和Pandas 1.4.4版完成兼容性测试,更新了对应的课程内容
2022年1月:针对Anaconda最新版(python 3.8)和Pandas 1.3.5版完成兼容性测试,更新了对应的课程内容
2021年11月:增加第14章:基于Pandas的图形化工具
2021年10月:针对课程内容进行了功能增补
2021年4月:针对最新的Pandas 1.2.3版进行了兼容性测试,更新了课程内容
2020年9月,针对课程发布后Pandas至最新的 1.1.1 版增加的新功能对各章节做了增补和更新
2020年3月,增加第13章:如何优化Pandas
2020年3月,更新第2章:增加如何无缝读写SPSS数据文件,增加对读写命令的整体介绍
【课程长度】
总时长:10小时
【学员基础】
学员需要懂得Python语言的基本编程知识,可以先学习免费课程“Python语言轻松入门”。
学员事前不要求学习统计分析的基本知识。
学员事前不要求有任何统计软件的使用经验。
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲