doc2vec-51CTO学堂

下载学堂APP

缓存视频离线看

下载学堂APP

缓存视频离线看

课程介绍

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

适合人群

对文本挖掘/自然语言处理有一定的了解，希望能够跟踪最新业内技术进展的人。

你将会学到

从基本的分布式表示等概念开始，针对Wrod2Ve和Doc2Ve，使用Gensim包，结合实际案例进行学习，帮助学员快速学习业界的**前沿技术。

课程简介

文本挖掘（TM），又称自然语言处理（NLP），是AI时代炙手可热的数据分析挖掘前沿领域，其所涉及的人机对话系统，推荐算法，文本分类等技术在BAT等企业中都得到广泛应用。

word2vec模型自提出以来，在文本挖掘领域中得到了广泛的应用，在很多方面都展现出了远远优于经典的词袋模型的优势。

本课程将使用经典武侠小说、大众点评抓取结果等多实际案例，从基本的分布式表示等概念开始，针对word2vec和doc2vec，使用gensim包，结合实际案例进行学习，帮助学员快速学习业界的**前沿技术。

学习完本课程后，学员将能够独立使用word2vec模型，基于Python环境完成中文文本挖掘的各种工作。

本课程的内容均选取自从零开始学习文本挖掘的课程：《Python数据分析系列视频课程--轻松玩转文本挖掘》，学员学习前需要懂得文本挖掘技术的基本知识，懂得如何在Python环境下使用词袋模型等经典方式进行文本挖掘工作。对这方面知识尚有欠缺的学员，建议直接学习原完整文本挖掘课程，以学习完整的知识体系。

【课程长度】

总时长：约3小时

【课程大纲】

第1章：文档信息的向量化

第2章：文本相似度

第3章：情感分析

第4章：自动写作

展开更多

发布

置顶笔记

{{ item.create_time }}{{ Number(item.like_count) || '' }}回复

{{ subitem.create_time }}{{ Number(subitem.like_count) || '' }}回复

删除

发布

{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}

优质笔记

更新于：{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}

公开笔记对他人可见，有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记

保存

提问

讲师收到你的提问会尽快为你解答。若选择公开提问，可以获得更多学员的帮助。

记录时间点

记录提问时视频播放的时间点，便于后续查看

公开提问

提交