Programa do Curso
1. Introdução à Aprendizagem por Reforço Profunda
- O que é Aprendizagem por Reforço?
- Diferença entre Aprendizagem Supervisionada, Não Supervisionada e por Reforço
- Aplicações de DRL em 2025 (robótica, saúde, finanças, logística)
- Compreendendo o ciclo de interação agente-ambiente
2. Fundamentos da Aprendizagem por Reforço
- Processos de Decisão de Markov (MDP)
- Estado, Ação, Recompensa, Política e Funções de Valor
- Equilíbrio entre Exploração e Explotação
- Métodos Monte Carlo e Aprendizagem por Diferença Temporal (TD)
3. Implementando Algoritmos Básicos de RL
- Métodos tabulares: Programação Dinâmica, Avaliação de Política e Iteração
- Q-Learning e SARSA
- Exploração epsilon-greedy e estratégias decrescentes
- Implementando ambientes de RL com OpenAI Gymnasium
4. Transição para Aprendizagem por Reforço Profunda
- Limitações dos métodos tabulares
- Uso de redes neurais para aproximação de funções
- Arquitetura e fluxo do Deep Q-Network (DQN)
- Reprodução de experiência e redes alvo
5. Algoritmos Avançados de DRL
- Double DQN, Dueling DQN e Reprodução de Experiência Prioritária
- Métodos de Gradientes de Política: Algoritmo REINFORCE
- Arquiteturas Actor-Critic (A2C, A3C)
- Otimização de Política Proximal (PPO)
- Soft Actor-Critic (SAC)
6. Trabalhando com Espaços de Ação Contínuos
- Desafios no controle contínuo
- Uso do DDPG (Deep Deterministic Policy Gradient)
- Twin Delayed DDPG (TD3)
7. Ferramentas e Frameworks Práticos
- Usando Stable-Baselines3 e Ray RLlib
- Registro e monitoramento com TensorBoard
- Ajuste de hiperparâmetros para modelos de DRL
8. Engenharia de Recompensa e Design de Ambientes
- Modelagem de recompensas e equilíbrio de penalidades
- Conceitos de transferência de simulação para o mundo real
- Criação de ambientes personalizados no Gymnasium
9. Ambientes Parcialmente Observáveis e Generalização
- Lidando com informações de estado incompletas (POMDPs)
- Abordagens baseadas em memória usando LSTMs e RNNs
- Melhorando a robustez e generalização do agente
10. Teoria dos Jogos e Aprendizagem por Reforço Multi-Agente
- Introdução a ambientes multi-agente
- Cooperação vs. competição
- Aplicações em treinamento adversário e otimização de estratégia
11. Estudos de Caso e Aplicações do Mundo Real
- Simulações de direção autônoma
- Preços dinâmicos e estratégias de negociação financeira
- Robótica e automação industrial
12. Solução de Problemas e Otimização
- Diagnóstico de treinamento instável
- Gerenciando a escassez de recompensas e o overfitting
- Escalando modelos de DRL em GPUs e sistemas distribuídos
13. Resumo e Próximos Passos
- Revisão da arquitetura de DRL e algoritmos principais
- Tendências da indústria e direções de pesquisa (por exemplo, RLHF, modelos híbridos)
- Recursos adicionais e materiais de leitura
Requisitos
- Proficiência em programação Python
- Compreensão de Cálculo e Álgebra Linear
- Conhecimento básico de Probabilidade e Estatística
- Experiência na construção de modelos de aprendizagem de máquina usando Python e NumPy ou TensorFlow/PyTorch
Público-Alvo
- Desenvolvedores interessados em IA e sistemas inteligentes
- Cientistas de Dados explorando frameworks de aprendizagem por reforço
- Engenheiros de Aprendizagem de Máquina trabalhando com sistemas autônomos
Treinamento Corporativo Personalizado
Soluções de treinamento projetadas exclusivamente para empresas.
- Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
- Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
- Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.
Preço por grupo privado, treinamento online ao vivo, a partir de 3900 € + VAT*
Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes
Testemunhos de Clientes (3)
Gostei muito do final, quando tivemos tempo para brincar com o CHAT GPT. O ambiente não estava configurado da melhor maneira para isso - em vez de uma grande mesa, algumas mesas menores teriam ajudado a formar grupos pequenos e favorecido a brainstorming.
Nola - Laramie County Community College
Curso - Artificial Intelligence (AI) Overview
Máquina Traduzida
Trabalhando a partir de princípios fundamentais de forma focada e avançando para a aplicação de estudos de caso no mesmo dia
Maggie Webb - Department of Jobs, Regions, and Precincts
Curso - Artificial Neural Networks, Machine Learning, Deep Thinking
Máquina Traduzida
Que estava aplicando dados reais de uma empresa. O instrutor teve uma abordagem muito boa, fazendo com que os participantes se envolvessem e competissem.
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Curso - Applied AI from Scratch in Python
Máquina Traduzida