Programa do Curso

Introdução ao AIOps com Ferramentas de Código Aberto

  • Visão geral dos conceitos e benefícios do AIOps
  • Prometheus e Grafana na pilha de observabilidade
  • Onde a IA se encaixa no AIOps: análises preditivas vs. reativas

Configurando Prometheus e Grafana

  • Instalando e configurando o Prometheus para coleta de séries temporais
  • Criando dashboards no Grafana usando métricas em tempo real
  • Explorando exportadores, relabeling e descoberta de serviços

Pré-processamento de Dados para IA

  • Extração e transformação de métricas do Prometheus
  • Preparando conjuntos de dados para detecção de anomalias e previsão
  • Usando transformações do Grafana ou pipelines do Python

Aplicando Machine Learning para Detecção de Anomalias

  • Modelos básicos de IA para detecção de outliers (por exemplo, Isolation Forest, One-Class SVM)
  • Treinamento e avaliação de modelos em dados de séries temporais
  • Visualização de anomalias nos dashboards do Grafana

Métricas com IA

  • Construindo modelos simples de previsão (ARIMA, Prophet, introdução ao LSTM)
  • Prever a carga do sistema ou o uso de recursos
  • Usando previsões para alertas antecipados e decisões de escalonamento

Integrando IA com Alertas e Automação

  • Definindo regras de alerta baseadas na saída da IA ou em limites
  • Usando Alertmanager e rotas de notificação
  • Acionar scripts ou fluxos de trabalho automatizados com detecção de anomalias

Escalabilidade e Operacionalização do AIOps

  • Integrando ferramentas de observabilidade externas (por exemplo, pilha ELK, Moogsoft, Dynatrace)
  • Operacionalizando modelos de IA em pipelines de observabilidade
  • Melhores práticas para operações do AIOps em escala

Resumo e Próximos Passos

Requisitos

  • Compreensão dos conceitos de monitoramento do sistema e observabilidade
  • Experiência usando Grafana ou Prometheus
  • Familiaridade com Python e princípios básicos de aprendizado de máquina

Público-Alvo

  • Engenheiros de observabilidade
  • Equipes de infraestrutura e DevOps
  • Arquitetos de plataformas de monitoramento e engenheiros de confiabilidade do site (SREs)
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(78): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38