
下载学堂APP
缓存视频离线看
下载学堂APP
缓存视频离线看
报告问题
课程介绍
问答
学员评价
课程内容概述:
本套课程我将带领大家学习prometheus生态圈中涉及到的所有组件,包括prometheus、grafana、alertmanager、pushgateway,PromQL,联邦集群、异地备份、高可用等,通过prometheus+grafana+alertmanager这套监控告警系统实现对物理节点,容器,线上业务,kubernetes组件和资源等指标的监控,实现微信,qq,钉钉报警。
Prometheus简介
Prometheus是一个开源的系统监控和告警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF维护管理的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,prometheus支持多种exporter采集数据,还支持通过pushgateway进行数据上报,Prometheus再性能上可支撑上万台规模的集群。
Prometheus架构图
Prometheus组件介绍
1.Prometheus Server: 用于收集和存储时间序列数据。
2.Client Library: 客户端库,检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus server端。
3.Exporters: prometheus支持多种exporter,通过exporter可以采集metrics数据,然后发送到prometheus server端
4.Alertmanager: 从 Prometheus server 端接收到 alerts 后,会进行去重,分组,并路由到相应的接收方,发出报警,常见的接收方式有:电子邮件,微信,钉钉, slack等。
5.Grafana:监控仪表盘
6.pushgateway: 各个目标主机可上报数据到pushgatewy,然后prometheus server统一从pushgateway拉取数据。
效果图展示
讲师简介
容器云架构师、DevOps工程师,曾就职于世界500强上市公司。一直在使用和开发kubernetes容器编排工具,拥有多年一线运维经验,主导过上亿流量的pv项目的架构设计和研发工作;具有丰富的在线教育经验,对课程一直在改进和提高、开发更多的企业实战项目。所教学员遍布京东、阿里、百度、电网等大型企业和上市公司。
课程大纲
第一章 自我介绍+课程大纲
1-1.自我介绍
1-2.课程大纲介绍
1-3.课程大纲介绍-补充微信报警
1-4.对您的承诺
1-5.课程课件使用说明
第二章 安装kubernetes(简称k8s)
2-1.准备安装k8s的实验环境
2-2.初始化k8s机器
2-3.安装k8s1.16.4高可用集群
2-4.安装k8s1.17.3高可用集群
第三章 node-exporter和cadvisor组件介绍
3-1.cadvisor组件介绍-监控容器
3-2.node-exporter组件介绍-监控node节点
第四章 prometheus安装+核心组件+架构介绍
4-1.prometheus简介
4-2.prometheus特点
4-3.prometheus组件介绍
4-4.prometheus架构图
4-5.部署prometheus-在k8s中部署
4-6.部署prometheus-在物理节点部署
4-7.Prometheus metrics类型介绍
第五章 prometheus基于k8s的服务发现-kubernetes_sd_configs
5-1.prometheus服务发现简介
5-2.prometheus重写标签relabel_configs介绍
5-3.prometheus配置endpoints模式的服务发现-监控k8s的apiserver组件
5-4.prometheus监控apiserver组件的各监控指标介绍
5-5.prometheus配置endpoints模式的服务发现-监控k8s所有的service服务
5-6.prometheus基于k8s服务发现总结
第六章 prometheus基于k8s的服务发现-kubernetes_sd_configs
6-1. prometheus配置node模式的服务发现-通过node-exporter监控node节点的cpu/内存/磁盘/网络等
6-2. node-exporter监控指标说明
6-3. prometheus配置node模式的服务发现-通过cadvisor监控容器的cpu/内存/磁盘/网络等
6-4.cadvisor采集容器的监控指标介绍
6-5.总结
第七章 promethues静态服务发现static_configs-监控k8s组件
7-1. prometheus监控kube-schedule组件
7-2. prometheus监控kube-controller-manager组件
7-3. prometheus监控kube-proxy组件
7-6. prometheus监控etcd组件
第八章 grafana介绍
8-1.grafana安装和配置
8-2.配置grafana的web界面-接入prometheus数据源
8-3.grafana导入node的dashboard
8-4.grafana导入容器的dashboard
8-5.grafana导入k8s的dashboard
第九章 容器监控之kube-state-metrics组件介绍
9-1.kube-state-metrics介绍
9-2.安装kube-state-metrics
9-3.kube-state-metrics的监控指标类型介绍
第十章 alertmanager安装+配置详细介绍
10-1.alertmanager安装+配置邮件告警
10-2.alertmanager用于发送告警的邮箱配置
10-3.alertmanager配置自定义告警规则
10-4.创建钉钉机器人
10-5.alertmanager配置钉钉告警
10-6.alertmanager配置钉钉和邮件同时告警
10-7.alertmanager全局配置说明-global
10-8.alertmanager基于标签的告警处理路由-match_re
10-9.alertmanager告警分组group和告警一直inhabit
10-10.alertmanager告警静默-临时静默silence
第十一章 promethues基于k8s的服务发现-Kubernetes_sd_configs
11-1.prometheus配置pod模式的服务发现-监控pod组件
第十二章 prometheus监控扩展
12-1.prometheus监控tomcat
12-2.prometheus监控redis
12-3.prometheus监控mysql
12-4.prometheus监控zookeeper
12-5.prometheus监控mongodb
第十三章 pushgateway
13-1.pushgateway简介
13-2.pushgateway优缺点
13-3.安装pushgateway
13-4.为prometheus添加pushgateway
13-5.上报到pushgateway的数据
13-6.自定义node节点的监控指标数据上报到pushgateway
13-7.honor_labels true 参数介绍
第十四章 在物理节点安装prometheus
14-1.准备实验环境
14-2.在物理节点安装prometheus
第十五章 prometheus联邦集群
15-1.prometheus联邦集群-安装和配置
第十六章 prometheus基于consul的服务发现
16-1.课前须知
16-2.consul简介
16-3.安装consul集群
16-4.在consul中注册node-exporter服务
16-5.配置prometheus基于consul的服务发现
16-6.在consul中注册master2节点的node-exporter
16-7.总结
第十七章 prometheus发送微信报警
17-1.配置prometheus接入alertmanager
17-2.配置企业微信,创建接收告警群
17-3.登陆企业微信
17-4.在企业微信添加接收报警成员
17-5.配置prometheus发送微信报警
17-6.自定有prometheus发送报警的告警信息格式
17-7.总结
5
学员评分
1
非常糟
2
很差
3
一般
4
很好
5
非常好