Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Construindo uma Arquitetura Aberta AIOps
- Visão geral dos componentes-chave em pipelines abertos AIOps
- Fluxo de dados da ingestão até o alerta
- Comparação e estratégia de integração de ferramentas
Colete e Agregue Dados
- Ingestão de dados de séries temporais com Prometheus
- Captura de logs com Logstash e Beats
- Normalização de dados para correlação entre fontes diferentes
Criando Painéis de Observabilidade
- Visualizando métricas com Grafana
- Criação de painéis Kibana para análise de logs
- Utilização de consultas Elasticsearch para extrair insights operacionais
Deteção de Anomalias e Previsão de Incidentes
- Exportação de dados de observabilidade para pipelines Python
- Treinamento de modelos ML para detecção de outliers e previsão
- Implementação de modelos em tempo real no pipeline de observabilidade
Alerta e Automação com Ferramentas Abertas
- Criação de regras de alerta Prometheus e roteamento do Alertmanager
- Ativação de scripts ou fluxos de trabalho da API para resposta automática
- Utilização de ferramentas de orquestração de código aberto (por exemplo, Ansible, Rundeck)
Considerações sobre Integração e Escalabilidade
- Gerenciamento de ingestão de alta demanda e retenção a longo prazo
- Segurança e controle de acesso em pilhas de código aberto
- Escalar cada camada independentemente: ingestão, processamento, alerta
Aplicações Reais e Extensões
- Casos práticos: otimização de desempenho, prevenção de tempo inativo e otimização de custos
- Extensão de pipelines com ferramentas de rastreamento ou gráficos de serviços
- Melhores práticas para executar e manter AIOps em produção
Resumo e Próximos Passos
Requisitos
- Experiência com ferramentas de observabilidade como Prometheus ou ELK
- Conhecimento prático de Python e fundamentos de aprendizado de máquina
- Compreensão das operações IT e fluxos de trabalho de alerta
Público-Alvo
- Engenheiros avançados de confiabilidade do site (SREs)
- Engenheiros de dados atuando em operações
- Líderes da plataforma DevOps e arquitetos de infraestrutura
14 Horas