Programa do Curso

Introdução às Operações de Kubernetes Guiadas por IA

  • Por que a IA é importante para operações modernas de cluster
  • Limitações da lógica tradicional de escalonamento e agendamento
  • Conceitos-chave de ML para gerenciamento de recursos

Fundamentos do Gerenciamento de Recursos do Kubernetes

  • Fundamentos da alocação de CPU, GPU e memória
  • Entendendo quotas, limites e solicitações
  • Identificando gargalos e ineficiências

Abordagens de Aprendizado de Máquina para Agendamento

  • Modelos supervisionados e não supervisionados para alocação de carga de trabalho
  • Algoritmos preditivos para demanda de recursos
  • Usando recursos de ML em agendadores personalizados

Aprendizado por Reforço para Aut escalonamento Inteligente

  • Como os agentes de RL aprendem com o comportamento do cluster
  • Projetando funções de recompensa para eficiência
  • Construindo estratégias de autoescalonamento impulsionadas por RL

Aut escalonamento Preditivo com Métricas e Telemetria

  • Usando dados do Prometheus para previsão
  • Aplicando modelos de séries temporais ao autoescalonamento
  • Avaliando a precisão das previsões e ajustando os modelos

Implementação de Ferramentas de Otimização Guiadas por IA

  • Integrando frameworks de ML com controladores do Kubernetes
  • Implementando loops de controle inteligentes
  • Estendendo o KEDA para tomada de decisão assistida por IA

Estratégias de Otimização de Custo e Desempenho

  • Reduzindo custos computacionais através do escalonamento preditivo
  • Melhorando a utilização da GPU com alocação impulsionada por ML
  • Equilibrando latência, throughput e eficiência

Cenários Práticos e Casos de Uso do Mundo Real

  • Aut escalonamento de aplicativos de alta carga com IA
  • Otimizando pools de nós heterogêneos
  • Aplicando ML a ambientes multitenant

Resumo e Próximos Passos

Requisitos

  • Compreensão dos fundamentos do Kubernetes
  • Experiência com implantações de aplicativos contêinerizados
  • Familiaridade com operações de cluster e gerenciamento de recursos

Público-Alvo

  • SREs trabalhando com sistemas distribuídos em larga escala
  • Operadores de Kubernetes gerenciando cargas de trabalho de alta demanda
  • Engenheiros de plataforma otimizando a infraestrutura computacional
 21 Horas

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas