数据预处理-中文分词器进行词库创建
{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }}
{{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }}
{{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}
分享
适合人群
熟悉Java语言、熟悉Linux基本操作、有Hadoop使用经验者。
你将会学到
本课程属于大数据项目实战课程,本课程主要应用Hadoop结合朴素贝叶斯算法(多项式模型)以及中文分词器构建用户评论分类系统。学完本课程能够学习朴素贝叶斯分类算法的思想及应用,并且能够利用Hadoop构建中文文本分类系统(包括:垃圾邮件分类、文章类型分类等)。
课程简介
课程内容:
1、项目展示及介绍
2、开发工具、技术及功能分析
3、Linux环境准备
4、Hadoop2.x分布式安装
5、朴素贝叶斯算法
6、项目架构
7、京东商城数据抓取
8、MapReduce程序开发
9、总结分析
项目结构:
部分PPT截图:
展开更多
{{tips.text}}
{{ noteHeaderTitle }}
笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
{{ detail.username }}
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
公开笔记
保存提问
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交课程大纲
自动连播
15课时
基于MapReduce的用户评论分类器视频课程(实战京东商城)
11154人学习
李国迎
5.0
免费
37课时
大数据入门与核心技术项目实战视频课程(0基础学习)
217000人学习
柠檬
4.7
免费
129课时
Hadoop大数据基础与提升
178420人学习
任亮
4.9
¥599.00
56课时
【徐葳】Flink进阶及实战(下)
120274人学习
徐葳
4.9
¥359.00
36课时
大数据运维架构师培训(1):Hadoop集群(HDFS,MR,Yarn),Zookeeper集群
79040人学习
风哥
5.0
¥499.00
107课时
大数据Hadoop生态圈体系完整视频课程
77723人学习
陈建平
4.8
¥366.00
105课时
Spark大数据处理及机器学习【基于Python的Spark 2.3**版】
71545人学习
张敏
5.0
¥399.00
43课时
赵渝强老师:Hadoop 2.x(一) 大数据基础实战视频课程
67221人学习
赵渝强
4.8
¥279.00