Programa do Curso

Introdução ao Alerting Avançado

  • Princípios-chave do alerting em sistemas de TI
  • Visão geral do Prometheus Alertmanager
  • Capacidades de alerting no Grafana

Criando Regras de Alerta Avançadas

  • Definindo regras de alerta no Prometheus
  • Usando rótulos e anotações para alerts
  • Estratégias de agrupamento e silenciamento

Integrando o Alertmanager com Sistemas Externos

  • Configurando webhooks para integrações externas
  • Integrando-se a ferramentas como Slack, PagerDuty e sistemas de email
  • Personalizando templates do Alertmanager

Automatizando Respostas a Alerts

  • Implementando fluxos de trabalho de remediação automatizados
  • Integrando-se com ferramentas de orquestração (por exemplo, Ansible, Kubernetes)
  • Usando scripts para resolução automatizada de problemas

Visualizando Alerts no Grafana

  • Configurando painéis de alerta no Grafana
  • Personalizando notificações e limiares de alerta
  • Melhores práticas para monitoramento do status de alerta

Gerenciando Alerts em Alto Volume

  • Lidando efetivamente com tempestades de alerts
  • Otimizando o desempenho do Prometheus para alerting
  • Considerações de escalabilidade para o Alertmanager

Escalando e Técnicas Avançadas

  • Configurações de alerting distribuídas com Prometheus e Alertmanager
  • Integrando-se com soluções de alerting baseadas em nuvem
  • Explorando novos recursos nos ecossistemas do Grafana e Prometheus

Resumo e Próximos Passos

Requisitos

  • Experiência básica com Grafana e Prometheus
  • Compreensão dos conceitos de monitoramento de TI
  • Familiaridade com scripting ou programação para automação

Público-Alvo

  • Engenheiros DevOps
  • Engenheiros de site reliability (SREs)
 14 Horas

Testemunhos de Clientes (2)

Próximas Formações Provisórias

Categorias Relacionadas