老钱《自然语言处理》实战训练营-文本相量化项目实践(附源码)

自然语言处理进阶-文本向量化方法

513人学习

中级9课时2019/08/20更新

二维码下载学堂APP缓存视频离线看

Jack Qian
    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
  • 课程介绍
  • 课程大纲

适合人群:

具备自然语言处理导论基础;了解自然语言处理的基本概念;熟悉Python

你将会学到:

自然语言处理进阶-文本向量化方法

课程简介:

《老钱------AI实战训练营的系列课程》= 多个案例学习《文本向量化》

       

     文本情感分析一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习文本向量化项目。多面覆盖经典的场景,如地名提取,病例命名实体提取,覆盖多种算法,如LDA,LSA,Word2Vec,TFIDF, PLSA等


  课程特色   

          1.案例驱动:专题技术,完整案例;

          2.源码操作:内含完整程序源码和数据集;

          3.实战指引:覆盖《文本向量化》四大过程模型;

          4.系统学习:一套完整的《文本向量化》建设方法论,迅速学习文本向量化的开发过程。

          

     适合人群


         1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。

         2.具备Python基础,熟悉机器学习的基础理论

         3.具备自然语言处理的基础知识


  课程大纲:

      

文本相似度

1. 文本特征提取原理概述

1.1.     什么是特征提取:。

1.2.     为什么要进行特征提取: 

1.3.     常见的特征提取思路及对比:布尔模型(0/1 ,,存在就是1,不存在就是0,举例。)、空间向量模型(通过一定的规则或者方法将文本映射到向量空间上,常见的有两种:1-基于布尔型,2-基于词频的)、主题模型(tf-idf,lsa,lda)、深度学习模型(word2vec、cnn)。

1.4.     特征提取方法之-布尔模型

1.5.     特征提取方法之-空间向量模型

1.6.     特征提取方法之-主题模型

1.7.     特征提取方法之-主题模型之tf-idf

1.7.1      tf-idf原理

1.7.2      tf-idf环境准备:

1.7.3      tf-idf代码实现

1.7.4      论文

1.8.     特征提取方法之-布尔模型之LSA

1.8.1 LSA原理详解

1.8.2 LSA环境搭建

python3.x 

gensim

jieba (conda install -c conda-forge jieba)

1.8.3 LSA代码实现

1.8.4 参考论文

1.9. 特征提取方法之-布尔模型之LDA

1.9.1 LDA原理

1.9.2 LDA环境搭建

1.9.3 LDA代码实现

1.9.4 参考论文

1.10.  特征提取方法之-深度学习模型原理

1.11.  特征提取方法之-深度学习模型-word2vec

word2vec是google在2013年推出的一个NLP工具。它可以将所有的词向量化。

1.11.1 word2vec原理

1.11.2 word2vec环境搭建

1.11.3 word2vec代码实现

1.11.4 参考论文


展开更多

课程大纲-老钱《自然语言处理》实战训练营-文本相量化项目实践(附源码)

在线
客服
APP
下载

下载Android客户端

下载iphone 客户端

官方
微信

关注官方微信

返回
顶部