分布式监控系统开发-监控系统需求讨论3
{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }}
{{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }}
{{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}
分享
适合人群
对python开发,自动化开发感兴趣的人.
你将会学到
致力于打造高级的运维开发及系统架构师、CTO 精英人员。
课程简介
本节内容
为什么要做监控?
常用监控系统设计讨论
监控系统架构设计
监控表结构设计
为什么要做监控?
–熟悉IT监控系统的设计原理
–开发一个简版的类Zabbix监控系统
–学习自动化开发项目的程序设计思路及架构解藕原则
常用监控系统设计讨论
Zabbix
Nagios
监控系统需求讨论
1.可监控常用系统服务、应用、网络设备等
2.一台主机上可监控多个不同服务、不同服务的监控间隔可不同
3.同一个服务在不同主机上的监控间隔、报警阈值可不同
4.可以批量的给一批主机添加、删除、修改要监控的服务
5.告警级别:
不同的服务 因为业务重要程度不同,如果出了问题可以设置不同的报警级别
可以指定特定的服务或告警级别的事件通知给特定的用户
告警的升级设定
6.历史数据 的存储和优化
实现用最少的空间占用量存储最多的有效数据
如何做到1s中之内取出一台主机上所有服务的5年的监控数据?
7. 数据可视化,如何做出简洁美观的用户界面?
8.如何实现单机支持5000+机器监控需求?
9.采取何种通信方式?主动、被动?
10.如何实现监控服务器的水平扩展?
展开更多
{{tips.text}}
{{ noteHeaderTitle }}
笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
{{ detail.username }}
公开笔记对他人可见,有机会被管理员评为“优质笔记”
{{ noteEditor.content.length }}/2000
公开笔记
保存提问
讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。
记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交课程大纲
自动连播
108课时
Python入门视频课程
1664986人学习
Alex(李杰)
4.8
免费
177课时
Python开发21天学习系列视频课程
299699人学习
Alex(李杰)
4.7
¥9.00
13课时
用Python Django做出的BBS论坛网站
188324人学习
Alex(李杰)
4.6
免费
133课时
Python自动化开发实战视频课程-2.0版本
147194人学习
Alex(李杰)
4.9
¥99.00
62课时
跟Alex学Python之- 2周学习Django WEB开发实战视频课程
93036人学习
Alex(李杰)
4.3
¥299.00
200课时
新手起步,从零开始学Python
69232人学习
Alex(李杰)
4.9
免费
28课时
跟Alex学Python之- 如何写出分布式监控系统
53650人学习
Alex(李杰)
4.9
¥99.00
21课时
Python类Nagios监控软件开发实战视频课程
52001人学习
Alex(李杰)
5.0
免费