文本特征提取的目的与意义-51CTO学堂

{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }} {{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }} {{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}

提问 {{ interaction.noteNum > 0 ? interaction.noteNum + '篇笔记' : '记笔记' }} 离线观看

下载学堂APP

缓存视频离线看

报告问题离线观看

下载学堂APP

缓存视频离线看

课程介绍

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

适合人群

具备自然语言处理导论基础；了解自然语言处理的基本概念；熟悉Python

你将会学到

自然语言处理进阶-文本向量化方法

课程简介

《老钱------AI实战训练营的系列课程》= 多个案例学习《文本向量化》

文本情感分析一直是NLP领域的热门应用，常用在舆情分析，文章分类，智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例，协助学习者迅速学习文本向量化项目。多面覆盖经典的场景，如地名提取，病例命名实体提取，覆盖多种算法，如LDA,LSA,Word2Vec,TFIDF, PLSA等

课程特色：

1.案例驱动：专题技术，完整案例；

2.源码操作：内含完整程序源码和数据集；

3.实战指引：覆盖《文本向量化》四大过程模型；

4.系统学习：一套完整的《文本向量化》建设方法论，迅速学习文本向量化的开发过程。

适合人群：

1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理，想要转型NLP的IT老兵。

2.具备Python基础，熟悉机器学习的基础理论

3.具备自然语言处理的基础知识

课程大纲：

文本相似度

1. 文本特征提取原理概述

1.1. 什么是特征提取：。

1.2. 为什么要进行特征提取：

1.3. 常见的特征提取思路及对比:布尔模型（0/1 ，，存在就是1，不存在就是0，举例。）、空间向量模型（通过一定的规则或者方法将文本映射到向量空间上，常见的有两种：1-基于布尔型，2-基于词频的）、主题模型（tf-idf，lsa，lda）、深度学习模型（word2vec、cnn）。

1.4. 特征提取方法之-布尔模型

1.5. 特征提取方法之-空间向量模型

1.6. 特征提取方法之-主题模型

1.7. 特征提取方法之-主题模型之tf-idf

1.7.1 tf-idf原理

1.7.2 tf-idf环境准备：

1.7.3 tf-idf代码实现

1.7.4 论文

1.8. 特征提取方法之-布尔模型之LSA

1.8.1 LSA原理详解

1.8.2 LSA环境搭建

python3.x

gensim

jieba （conda install -c conda-forge jieba）

1.8.3 LSA代码实现

1.8.4 参考论文

1.9. 特征提取方法之-布尔模型之LDA

1.9.1 LDA原理

1.9.2 LDA环境搭建

1.9.3 LDA代码实现

1.9.4 参考论文

1.10. 特征提取方法之-深度学习模型原理

1.11. 特征提取方法之-深度学习模型-word2vec

word2vec是google在2013年推出的一个NLP工具。它可以将所有的词向量化。

1.11.1 word2vec原理

1.11.2 word2vec环境搭建

1.11.3 word2vec代码实现

1.11.4 参考论文

展开更多

发布

置顶笔记

{{ item.create_time }}{{ Number(item.like_count) || '' }}回复

删除
是否确认删除?
确认
取消
{{ item.is_top == 1 ? '取消置顶' : '置顶'}}
已有置顶的讨论，是否替换已有的置顶？
确认
取消

{{ subitem.create_time }}{{ Number(subitem.like_count) || '' }}回复

删除

点击查看更多收起

发布

{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}

优质笔记

更新于：{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}

公开笔记对他人可见，有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记

保存

提问

讲师收到你的提问会尽快为你解答。若选择公开提问，可以获得更多学员的帮助。

记录时间点

记录提问时视频播放的时间点，便于后续查看

公开提问

提交