分类特征的处理思路
注意:
1. 本行业案例课程为Python 3 数据分析系列课程的行业案例部分,学员请务必先观看课程介绍免费视频,确认已学习本课程所需Python分析技能。
2. 本课程的核心目的是协助学员学习具体业务场景下的解决方案,为降低学员学习难度,课程中均尽量使用简明易懂的代码进行数据整理和模型实现,没有出现任何晦涩高深的代码,并尽量基于pandas、sklearn等标准包接口编程。故此希望看到笔者在课程中炫技的各位编程高手请勿购买本系列课程。
请至PC端网页下载本课程代码课件(即由原始.ipynb文件保存的html文档)及数据。
【课程简介】
欺诈现象遍及商业社会的各个领域,欺诈检测(Fraud Detection,也称反欺诈)则是数据分析与挖掘的一个典型应用领域,同时又具有非常强的行业特征。本课程使用医疗保险欺诈和Kaggle的金融欺诈数据这两个案例数据,完整介绍了欺诈检测的基本思想,以及各类数据分析模型在欺诈检测领域中的构建和实施流程。整个案例可作为分析模板供学员在欺诈检测相关的分析项目中直接套用。
本课程还在案例分析中很好的展示了如何基于业务理解,灵活的将聚类分析、Benford定律、关联规则等看似无关的模型用于欺诈检测,这非常有助于学员在实践中更好的拓展数据挖掘建模思路。
【课程特色】
可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的分析模板加以使用。
双案例课程结构:医疗保险欺诈案例用于详细阐述欺诈检测应当如何结合行业特征构建分析模型框架,并最终完成各类模型的实施和应用;金融欺诈案例则多面展示了如何将预测类模型用于欺诈案例的甄别。两个案例结合,完整覆盖了欺诈检测领域中的方法体系。
【课程长度】
总时长:10小时
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲