文本大数据抓取与挖掘专题
深入文本大数据技术,零基础到高级分析挖掘的成长之路
- 项目实战密集训练
- 从采集到挖掘全流程
- Python文本数据分析专精
- 最新技术应用与案例分析
第一阶段
网络爬虫设计与网络数据抓取
在实战中学习如何对新浪、淘宝、微博等网站数据进行抓取,学员将学习如何独立设计相应的网络爬虫,抓取所需的页面数据,满足自身工作和研究中的几乎所有数据抓取需求。
第二阶段
数据预处理
学习学习Pandas包的使用方法,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。
第三阶段
文本数据的挖掘分析
多面学习文本挖掘技术的各个方面,从词袋模型直至目前最热的word2vec,gensim 等均结合实际案例进行学习,学员最终将能够独立使用Python环境完成中文文本挖掘的各种工作。
资料名称 | 文件大小 |
---|---|
爬虫文件202105 | 6.03M |
资料名称 | 文件大小 |
---|---|
PythonPandasData202407 | 1.30M |
资料名称 | 文件大小 |
---|---|
PythonTMData202104 | 7.94M |
PythonTMData202407 | 28.68M |
{{ starInfo.score }}