文本特征提取的常用方法-Word2Vec实践

513 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
具备自然语言处理导论基础;了解自然语言处理的基本概念;熟悉Python
你将会学到
自然语言处理进阶-文本向量化方法
课程简介

《老钱------AI实战训练营的系列课程》= 多个案例学习《文本向量化》

       

     文本情感分析一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习文本向量化项目。多面覆盖经典的场景,如地名提取,病例命名实体提取,覆盖多种算法,如LDA,LSA,Word2Vec,TFIDF, PLSA等


  课程特色   

          1.案例驱动:专题技术,完整案例;

          2.源码操作:内含完整程序源码和数据集;

          3.实战指引:覆盖《文本向量化》四大过程模型;

          4.系统学习:一套完整的《文本向量化》建设方法论,迅速学习文本向量化的开发过程。

          

     适合人群


         1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。

         2.具备Python基础,熟悉机器学习的基础理论

         3.具备自然语言处理的基础知识


  课程大纲:

      

文本相似度

1. 文本特征提取原理概述

1.1.     什么是特征提取:。

1.2.     为什么要进行特征提取: 

1.3.     常见的特征提取思路及对比:布尔模型(0/1 ,,存在就是1,不存在就是0,举例。)、空间向量模型(通过一定的规则或者方法将文本映射到向量空间上,常见的有两种:1-基于布尔型,2-基于词频的)、主题模型(tf-idf,lsa,lda)、深度学习模型(word2vec、cnn)。

1.4.     特征提取方法之-布尔模型

1.5.     特征提取方法之-空间向量模型

1.6.     特征提取方法之-主题模型

1.7.     特征提取方法之-主题模型之tf-idf

1.7.1      tf-idf原理

1.7.2      tf-idf环境准备:

1.7.3      tf-idf代码实现

1.7.4      论文

1.8.     特征提取方法之-布尔模型之LSA

1.8.1 LSA原理详解

1.8.2 LSA环境搭建

python3.x 

gensim

jieba (conda install -c conda-forge jieba)

1.8.3 LSA代码实现

1.8.4 参考论文

1.9. 特征提取方法之-布尔模型之LDA

1.9.1 LDA原理

1.9.2 LDA环境搭建

1.9.3 LDA代码实现

1.9.4 参考论文

1.10.  特征提取方法之-深度学习模型原理

1.11.  特征提取方法之-深度学习模型-word2vec

word2vec是google在2013年推出的一个NLP工具。它可以将所有的词向量化。

1.11.1 word2vec原理

1.11.2 word2vec环境搭建

1.11.3 word2vec代码实现

1.11.4 参考论文


展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交