Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução ao AIOps com Ferramentas de Código Aberto
- Visão geral dos conceitos e benefícios do AIOps
- Prometheus e Grafana na pilha de observabilidade
- Onde a IA se encaixa no AIOps: análises preditivas vs. reativas
Configurando Prometheus e Grafana
- Instalando e configurando o Prometheus para coleta de séries temporais
- Criando dashboards no Grafana usando métricas em tempo real
- Explorando exportadores, relabeling e descoberta de serviços
Pré-processamento de Dados para IA
- Extração e transformação de métricas do Prometheus
- Preparando conjuntos de dados para detecção de anomalias e previsão
- Usando transformações do Grafana ou pipelines do Python
Aplicando Machine Learning para Detecção de Anomalias
- Modelos básicos de IA para detecção de outliers (por exemplo, Isolation Forest, One-Class SVM)
- Treinamento e avaliação de modelos em dados de séries temporais
- Visualização de anomalias nos dashboards do Grafana
Métricas com IA
- Construindo modelos simples de previsão (ARIMA, Prophet, introdução ao LSTM)
- Prever a carga do sistema ou o uso de recursos
- Usando previsões para alertas antecipados e decisões de escalonamento
Integrando IA com Alertas e Automação
- Definindo regras de alerta baseadas na saída da IA ou em limites
- Usando Alertmanager e rotas de notificação
- Acionar scripts ou fluxos de trabalho automatizados com detecção de anomalias
Escalabilidade e Operacionalização do AIOps
- Integrando ferramentas de observabilidade externas (por exemplo, pilha ELK, Moogsoft, Dynatrace)
- Operacionalizando modelos de IA em pipelines de observabilidade
- Melhores práticas para operações do AIOps em escala
Resumo e Próximos Passos
Requisitos
- Compreensão dos conceitos de monitoramento do sistema e observabilidade
- Experiência usando Grafana ou Prometheus
- Familiaridade com Python e princípios básicos de aprendizado de máquina
Público-Alvo
- Engenheiros de observabilidade
- Equipes de infraestrutura e DevOps
- Arquitetos de plataformas de monitoramento e engenheiros de confiabilidade do site (SREs)
14 Horas