Programa do Curso

Introdução ao AIOps com Ferramentas de Código Aberto

  • Visão geral dos conceitos e benefícios do AIOps
  • Prometheus e Grafana na pilha de observabilidade
  • Onde a IA se encaixa no AIOps: análises preditivas vs. reativas

Configurando Prometheus e Grafana

  • Instalando e configurando o Prometheus para coleta de séries temporais
  • Criando dashboards no Grafana usando métricas em tempo real
  • Explorando exportadores, relabeling e descoberta de serviços

Pré-processamento de Dados para IA

  • Extração e transformação de métricas do Prometheus
  • Preparando conjuntos de dados para detecção de anomalias e previsão
  • Usando transformações do Grafana ou pipelines do Python

Aplicando Machine Learning para Detecção de Anomalias

  • Modelos básicos de IA para detecção de outliers (por exemplo, Isolation Forest, One-Class SVM)
  • Treinamento e avaliação de modelos em dados de séries temporais
  • Visualização de anomalias nos dashboards do Grafana

Métricas com IA

  • Construindo modelos simples de previsão (ARIMA, Prophet, introdução ao LSTM)
  • Prever a carga do sistema ou o uso de recursos
  • Usando previsões para alertas antecipados e decisões de escalonamento

Integrando IA com Alertas e Automação

  • Definindo regras de alerta baseadas na saída da IA ou em limites
  • Usando Alertmanager e rotas de notificação
  • Acionar scripts ou fluxos de trabalho automatizados com detecção de anomalias

Escalabilidade e Operacionalização do AIOps

  • Integrando ferramentas de observabilidade externas (por exemplo, pilha ELK, Moogsoft, Dynatrace)
  • Operacionalizando modelos de IA em pipelines de observabilidade
  • Melhores práticas para operações do AIOps em escala

Resumo e Próximos Passos

Requisitos

  • Compreensão dos conceitos de monitoramento do sistema e observabilidade
  • Experiência usando Grafana ou Prometheus
  • Familiaridade com Python e princípios básicos de aprendizado de máquina

Público-Alvo

  • Engenheiros de observabilidade
  • Equipes de infraestrutura e DevOps
  • Arquitetos de plataformas de monitoramento e engenheiros de confiabilidade do site (SREs)
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas