02.docker简介

1031 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
对大数据有所了解,有一定编程基础
你将会学到
利用docker容器技术快速构建跨节点的独立模型的Spark大数据集群。
课程简介

本教程授课老师

徐培成老师先后在软件公司人软件工程师、系统分析师、项目经理、软件架构师,主持开发了大产权交易系统,异构数据库协同系统、电信资源管理系统、互联网综合性调查等系统,对java技术、大数据(hadoop、storm、spark)、Python、机器学习、数据库技术、互联网应用、远程通信、网络编程、分布式应用、高可用性计算机网络集群等技术有着丰富的实战经验和深厚的技术功底。


介绍
利用docker容器技术快速构建跨节点的独立模型的Spark大数据集群。Spark是时下非常热门的大数据计算引擎,现在apche官方网站已经更新至2.3.1的版本,而且热度居高不下。很多企业越来越多的倾向于使用spark进行海量数据处理,主要是源于其高效快速的架构设计。

docker也是非常热门的虚拟化技术,而且发展趋势也是越来越强大,源于其超轻量级的部署和低资源消耗著称,对于大数据从业人群,两者组合可以说是技术发展的利器。更是大数据运维人员的渴求的技术。

目标
本次课程的主要目标就是在docker容器上部署spark集群,实验环境使用win7操作系统,安装vmware虚拟机软件,在wmare中安装2两台centos7的客户机操作系统,在每个客户机操作系统中安装docker进行二次虚拟机化,并在每台客户机的centos7操作系统中启动docker容器,分别安装部署spark,组件独立模式下的spark集群,能够实现跨节点的容器间通信,网络模式使用macvlan方式,摒弃繁琐的端口映射方式,使集群更加容易管理和扩展。

本课程所用到的技术:
Spark
Docker
Centos 7

利用docker容器化技术快速构建Spark独立模式的集群课程经过多家企业的联合调研出品,可以解决市面上绝大多数的企业级的大数据容器化技术应用。

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
讨论区空空如也,你来讲两句~
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交