如何用python做机器学习/数据挖掘?

5980未经授权,禁止转载
Python数据库数据分析大数据机器学习数据挖掘scikit-learn算法特征提取归一化降维模型评估深度学习
本课程集中讲解Python环境下的机器学习和数据挖掘技术,强调数据挖掘作为知识发现的体系和方法论,而不仅仅是算法问题。scikit-learn(简称sklearn或SKN)被广泛用于这一领域,因其与机器学习和数据挖掘的需求契合度高,尤其是对CRISP-DM方法论的支持。 课程内容包括预处理、特征提取、归一化、降维、特征选择、模型建立、交叉验证、模型选择与评估,覆盖了数据准备至模型评估的核心步骤。此外,指出了scikit-learn的局限性,如在复杂统计模型、时间序列模型及深度神经网络方面的不足。对于数据量大的情景,介绍了随机梯度下降(SGD)等策略,并提到Python其他库,如Pandas和TensorFlow等,在数据挖掘任务中的作用。课程非常适合希望深入理解机器学习和数据挖掘以及scikit-learn使用者的需求。
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
ad
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
讲师头像
张文彤
数据挖掘,市场研究,统计应用专业人士,国内知名的SPSS专业人士和培训师,多本软件教材、数据分析与挖掘专著的作者。 曾在复旦大学公共卫生学院任教数载,其教学以讲解深入浅出,重点突出,简明易懂为最大特色。 精通业内广泛使用的SAS、SPSS、Modeler、R、Python等数据分析/挖掘工具,拥有近20年的数据分析/统计软件商业培训经验。是国内知名的SPSS培训师,曾作为SPSS官方培训师,从2001年起一手协助SPSS中国建立其统计培训体系 。 主编SPSS、SAS等统计软件教材10本,其SPSS教材被教育部评为2003-2004年度教育部研究生推荐教材,后续版本被国内外三百多所高校选用为本科生/研究生教材。
TA的课程
接下来播放:
自动连播