收入预测案例与K近邻点分类算法【共3课时】

量化金融研究中心认证讲师讲师评分4.8学员2615课程5

量化金融研究中心为首都经济贸易大学教师和金融行业的从业人员自愿组成的学术团体，依托北京市金融发展促进中心

畅销套餐
精选套餐
人气套餐
尊享套餐
高薪套餐

Python数据分析与企业级应用深化系列

Python数据分析与机器学习实战集锦（纯实战版）

23058人学习

￥298.00

【2020新版更新】人工智能-机器学习实战视频课程（上篇）

中级Python数据分析师-数字化人才项目系列课程（含证书）

Python数据分析--玩转数据挖掘（2024版）

38948人学习

￥238.00

Python数据分析--玩转文本挖掘（2024版）

83329人学习

￥199.00

Python数据分析--玩转深度学习（20204版）

24540人学习

￥199.00

更多 13 门课程

Python 3 数据挖掘与深度学习系列课程-工具版

Python数据分析--玩转Pandas（2024版）

122474人学习

￥178.00

Python数据分析--玩转数据挖掘（2024版）

38948人学习

￥238.00

Python数据分析--玩转文本挖掘（2024版）

课程介绍
课程大纲

适合人群：

学习金融学、数据、计算机的高校生、在职的基金经理、投研总监、专业投资者、金融分析师、量化分析

你将会学到：

处理数据集；金融数据标准化；K近邻点分类模型的选择和应用；用K近邻点模型进行预测；K近邻点模型的评估

课程简介：

案例数据集来源于UCI网站。案例是基于美国统计局的人口普查资料数据。案例的目标是希望利用这些数据来预测年收入大于5万美元的家庭。该数据集内包含48842条记录和14个特征变量，包括1个分类变量。变量包括类别型，字母型，和数值型。

K近邻点分类算法是机器学习领域中的一个基础且非常重要的算法。K近邻点算法是一种基于实例的算法，就是把所有训练样本储存起来（形成记忆）。当我们对一个新纪录进行预测时，就将新记录与记忆中的记录进行比较，找到最接近（或最类似）新记录的K条记录，然后通过分类规则来确定该新记录所属的类别。Python的优势在于开源，基于Python的各类机器学习算法非常丰富而且方便使用。我们将以美国统计局的人口普查资料数据案例数据集为一个点的同时，讨论 K近邻点分类算法的原理，及其在Python中的算法，并用他们来解决案例的预测分类。

本案例的特点是将家庭收入预测问题的解决方案与机器学习中的K近邻点分类算法进行结合，并利用Python设计一个自动分类的预测算法来对案例数据集进行学习并辅助我们进行决策。这三者的结合就是智能金融在金融行业的一种经典应用。

通过案例学习后，如果学生能够独立完成作业，学生将能达到以下预期目标：