项目初始化与数据加载开发
《老钱------AI实战训练营的系列课程》= 多个案例学习《文本聚类》
文本聚类一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习文本聚类的项目实现流程,实现方法,实现过程。多面覆盖经典的场景,
课程特色:
1.案例驱动:专题技术,完整案例;
2.源码操作:内含完整程序源码和数据集;
3.实战指引:覆盖文本聚类四大过程模型;
4.系统学习:一套完整的文本聚类建设方法论,迅速学习文本分类的开发过程。包括SignlePaas,KMeans,文本相似度方法等
课程部分课件展示:
适合人群:
1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。
2.具备Python基础,熟悉机器学习的基础理论
3.具备自然语言处理的基础知识
具体课程大纲如下:
1.文本聚类分析概述
1.文本聚类定义与典型应用场景
1.文本聚类定义
2.文本聚类的应用场景
2.文本聚类分析的难点
3.文本聚类分析的意义
4.文本聚类分析技术实现的一般流程
5.文本聚类任务使用的技术有哪些
1.基于聚类算法的聚类
2.基于文本相似性的聚类
3.基于规则的方法
6.文本聚类项目的评价方法
2.长文本聚类实践-聚类算法方法-豆瓣电影TOP250榜单内的电影剧情聚类
1.电影剧情聚类项目背景介绍
2.电影剧情聚类项目设计
3.聚类算法用于文本聚类的过程
3.剧情数据处理
4.剧情分词
5.特征提取与向量化
6.基于KMeans完成电影剧情聚类
7.基于DBScan完成电影剧情聚类
8.效果对比
9.项目总结
3.短文本聚类实践-新浪微博话题发现
1.新浪微博话题发现项目背景介绍
2.新浪微博话题发现项目设计
3.短文本聚类的难点
3.微博数据处理
4.微博分词
5.微博特征提取与向量化
6.基于KMeans完成聚类
7.效果分析
8.项目总结
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲