Programa do Curso
Introdução
- Aprendizagem através do reforço positivo
Elements de Reinforcement Learning
Termos importantes (Acções, Estados, Recompensas, Política, Valor, Valor-Q, etc.)
Visão geral dos métodos de soluções tabulares
Criar um agente de software
Compreender as abordagens baseadas no valor, na política e no modelo
Trabalhando com o Processo de Decisão Markov (MDP)
Como as políticas definem o modo de comportamento de um agente
Utilização de métodos de Monte Carlo
Aprendizagem por diferença temporal
n-passo Bootstrapping
Métodos de solução aproximada
Previsão na política com aproximação
Controlo em política com aproximação
Métodos extrapolíticos com aproximação
Compreender os traços de elegibilidade
Utilização de métodos de gradiente de política
Resumo e conclusão
Requisitos
- Experiência com aprendizagem automática
- Experiência Programming
Público
- Cientistas de dados
Treinamento Corporativo Personalizado
Soluções de treinamento projetadas exclusivamente para empresas.
- Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
- Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
- Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.
Preço por grupo privado, treinamento online ao vivo, a partir de 3900 € + VAT*
Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes