Programa do Curso

Designando uma Arquitetura Aberta AIOps

  • Visão geral dos componentes-chave em pipelines abertos AIOps
  • Fluxo de dados do processo de coleta até o alerta
  • Comparação e estratégia de integração de ferramentas

Coleta e Agregação de Dados

  • Coletando dados em série temporal com Prometheus
  • Capturando logs com Logstash e Beats
  • Normalizando os dados para correlação interfonte

Construindo Painéis de Observabilidade

  • Visualizando métricas com Grafana
  • Criando painéis Kibana para análise de logs
  • Usando consultas Elasticsearch para extrair insights operacionais

Detecção de Anomalias e Previsão de Incidentes

  • Exportando dados de observabilidade para pipelines Python
  • Treinamento de modelos ML para detecção de outliers e previsão
  • Deploying models for live inference in the observability pipeline

Alerta Automatizado e Automação com Ferramentas Abertas

  • Criando regras de alerta Prometheus e roteamento do Alertmanager
  • Acionando scripts ou fluxos de trabalho da API para resposta automática
  • Usando ferramentas de orquestração open-source (por exemplo, Ansible, Rundeck)

Considerações sobre Integração e Escalabilidade

  • Lidando com alta ingestão de volume e retenção a longo prazo
  • Segurança e controle de acesso em pilhas open-source
  • Escalando cada camada independentemente: coleta, processamento, alerta

Aplicações no Mundo Real e Extensões

  • Estudos de caso: otimização de desempenho, prevenção de tempo inativo e otimização de custos
  • Extendendo pipelines com ferramentas de rastreamento ou gráficos de serviços
  • Práticas recomendadas para execução e manutenção do AIOps em produção

Resumo e Próximos Passos

Requisitos

  • Experiência com ferramentas de observabilidade como Prometheus ou ELK
  • Conhecimento prático de Python e fundamentos de aprendizado de máquina
  • Compreensão das operações de TI e fluxos de trabalho de alertas

Público-alvo

  • Engenheiros avançados de confiabilidade do site (SREs)
  • Engenheiros de dados atuando em operações
  • Líderes de plataforma DevOps e arquitetos de infraestrutura
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(78): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38