搜狗新闻分类-分词与停用词库加载

813 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
具备自然语言处理的基础;例如分词;熟悉Python;熟悉基本的深度学习框架Keras
你将会学到
学习文本分类项目实践方法;学习TextCNN等深度学习文本分类项目实践方法;
课程简介

  《老钱------AI实战训练营的系列课程》= 多个案例学习《文本分类》

       文本分类一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速学习文本分类项目。


     课程特色   

          1.案例驱动:专题技术,完整案例;

          2.源码操作:内含完整程序源码和数据集;

          3.实战指引:覆盖文本分类四大过程模型;

          4.系统学习:一套完整的文本分类建设方法论,迅速学习文本分类的开发过程。包括深度学习方法,语料库方法等


     适合人群

         1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。

         2.具备Python基础,熟悉机器学习的基础理论

         3.具备自然语言处理的基础知识



     具体课程大纲如下:


                1.文本分类概述  

                  1.文本分类的定义与典型应用场景

                  2.文本分类的难点

                  3.文本分类的意义

                  4.文本分类技术实现的一般流程

                    1.文本预处理

                    2.文本表示与特征选择

                    3.构造分类器

                    4.分类

                  5.文本分类任务使用的技术有哪些

                  6.文本分类项目的评价方法

                

                2.基于经典方法的文本分类算法项目实践-贝叶斯搜狗新闻文本分类

                  1.文本数据载入及清洗

                  2.把数据集分为训练集和测试集

                  3.中文分词

                  4.引入停用词典

                  5.文本特征提取

                  6.机器学习建模-贝叶斯原理

                  7.使用贝叶斯进行建模

                  8.文本特征提取

                  9.N-gram模型

                  10.模型效果测试与总结

                

                3.大规模文本分类网络TextCNN概述  

                  1.什么是TextCNN

                  2.为什么使用TextCNN

                  3.TextCNN原理介绍

                    1.CNN模型回顾

                    2.TextCNN网络结构

                    3.TextCNN优缺点

                  4.如何使用TextCNN

                  5.TextCNN模型应用场景

                  6.TextCNN开源实现方案介绍

                


                4.TextCNN项目实践-基于TextCNN完成电影评论分类

                  1.项目背景

                  2.IMDB 电影影评数据集介绍

                  3.准备IMDB 电影影评数据与TextCNN环境

                  4.IMDB 电影影评数据预处理

                  5.TextCNN实现文本分类的原理

                  6.TextCNN模型搭建

                  7.TextCNN模型参数介绍

                  8.运行结果分析

                  9.TextCNN模型参数优化介绍

                  10.项目总结

                

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交