Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução ao AIOps
- O que é AIOps e por que isso importa
- Monitoramento tradicional vs. observabilidade impulsionada pelo AIOps
- Arquitetura do AIOps e componentes-chave
Coleção e Normalização de Dados Operacionais
- Tipos de dados de observabilidade: métricas, logs e rastreamentos
- Ingestão de dados de múltiplas fontes (servidores, contêineres, nuvem)
- Usando agentes e exportadores (Prometheus, Beats, Fluentd)
Correlação de Dados e Detecção de Anomalias
- Correlação em séries temporais e métodos estatísticos
- Usando modelos de ML para detecção de anomalias
- Deteção de incidentes em sistemas distribuídos
Alertrações e Redução de Ruído
- Design de regras inteligentes de alerta e limiares
- Supressão, deduplicação e agrupamento de alertas
- Integração com Alertmanager, Slack, PagerDuty ou Opsgenie
Análise de Causa Raiz e Visualização
- Usando dashboards para visualizar métricas e detectar tendências
- Explorando eventos e cronogramas para análise de causa raiz (RCA)
- Rastreando problemas entre camadas com ferramentas de rastreamento distribuído
Automação e Remediação
- Criação de scripts ou fluxos de trabalho automatizados a partir de incidentes
- Integração com sistemas ITSM (ServiceNow, Jira)
- Casos de uso: autogestão, escalonamento e reencaminhamento de tráfego
Plataformas Abertas e Comerciais do AIOps
- Visão geral das ferramentas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Critérios de avaliação para selecionar uma plataforma de AIOps
- Demonstração e prática com um stack escolhido
Resumo e Próximos Passos
Requisitos
- Um entendimento dos conceitos de operações de TI e monitoramento de sistemas
- Experiência com ferramentas ou painéis de monitoramento
- Familiaridade com formatos básicos de logs e métricas
Público-Alvo
- Equipes de operações responsáveis por infraestrutura e aplicações
- Engenheiros de Confiabilidade do Site (SREs)
- Times de monitoramento e observabilidade de TI
14 Horas