文本特征提取的目的与意义
《老钱------AI实战训练营的系列课程
文本情感分析一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习
项目。多面覆盖经典的场景,
1.案例驱动:专题技术,完整案例;
2.源码操作:内含完整程序源码和数据集;
3.实战指引:覆盖《
》四大过程模型;4.系统学习:一套完整的《
》建设方法论,迅速学习 的开发过程。
1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。
2.具备Python基础,熟悉机器学习的基础理论
3.具备自然语言处理的基础知识
课程大纲:
文本相似度
1. 文本特征提取原理概述
1.1. 什么是特征提取:。
1.2. 为什么要进行特征提取:
1.3. 常见的特征提取思路及对比:布尔模型(0/1 ,,存在就是1,不存在就是0,举例。)、空间向量模型(通过一定的规则或者方法将文本映射到向量空间上,常见的有两种:1-基于布尔型,2-基于词频的)、主题模型(tf-idf,lsa,lda)、深度学习模型(word2vec、cnn)。
1.4. 特征提取方法之-布尔模型
1.5. 特征提取方法之-空间向量模型
1.6. 特征提取方法之-主题模型
1.7. 特征提取方法之-主题模型之tf-idf
1.7.1 tf-idf原理
1.7.2 tf-idf环境准备:
1.7.3 tf-idf代码实现
1.7.4 论文
1.8. 特征提取方法之-布尔模型之LSA
1.8.1 LSA原理详解
1.8.2 LSA环境搭建
python3.x
gensim
jieba (conda install -c conda-forge jieba)
1.8.3 LSA代码实现
1.8.4 参考论文
1.9. 特征提取方法之-布尔模型之LDA
1.9.1 LDA原理
1.9.2 LDA环境搭建
1.9.3 LDA代码实现
1.9.4 参考论文
1.10. 特征提取方法之-深度学习模型原理
1.11. 特征提取方法之-深度学习模型-word2vec
word2vec是google在2013年推出的一个NLP工具。它可以将所有的词向量化。
1.11.1 word2vec原理
1.11.2 word2vec环境搭建
1.11.3 word2vec代码实现
1.11.4 参考论文
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
课程大纲