Curso de Fundamentos do Aprendizado por Reforço

Reinforcement Learning (RL) é uma técnica de aprendizagem automática em que um programa de computador (agente) aprende a comportar-se num ambiente, executando as acções e recebendo feedback sobre os resultados das acções. Por cada boa ação, o agente recebe um feedback positivo, e por cada má ação, o agente recebe um feedback negativo (penalização).

Este treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a cientistas de dados que desejam ir além das abordagens tradicionais de aprendizado de máquina para ensinar um programa de computador a descobrir coisas (resolver problemas) sem o uso de dados rotulados e grandes conjuntos de dados.

No final deste treinamento, os participantes serão capazes de:

Instalar e aplicar as bibliotecas e a linguagem de programação necessárias para implementar Reinforcement Learning.
Criar um agente de software que seja capaz de aprender através de feedback em vez de aprendizagem supervisionada.
Programar um agente para resolver problemas em que a tomada de decisão é sequencial e finita.
Aplicar conhecimentos para conceber software que possa aprender de uma forma semelhante à dos humanos.

Formato do curso

Palestra e discussão interactiva.
Muitos exercícios e prática.
Implementação prática num ambiente de laboratório ao vivo.

Opções de personalização do curso

Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Introdução

Aprendizagem através do reforço positivo

Elements de Reinforcement Learning

Termos importantes (Acções, Estados, Recompensas, Política, Valor, Valor-Q, etc.)

Visão geral dos métodos de soluções tabulares

Criar um agente de software

Compreender as abordagens baseadas no valor, na política e no modelo

Trabalhando com o Processo de Decisão Markov (MDP)

Como as políticas definem o modo de comportamento de um agente

Utilização de métodos de Monte Carlo

Aprendizagem por diferença temporal

n-passo Bootstrapping

Métodos de solução aproximada

Previsão na política com aproximação

Controlo em política com aproximação

Métodos extrapolíticos com aproximação

Compreender os traços de elegibilidade

Utilização de métodos de gradiente de política

Resumo e conclusão

Requisitos

Experiência com aprendizagem automática
Experiência Programming

Público

Cientistas de dados

21 Horas

Treinamento Corporativo Personalizado

Soluções de treinamento projetadas exclusivamente para empresas.

Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.

Investimento

Preço por grupo privado, treinamento online ao vivo, a partir de 3900 € + VAT*

Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes

(*O preço final pode variar dependendo da especialização técnica do curso, do nível de personalização, do método de entrega e do número de participantes)

Precisa de ajuda para escolher o curso certo?

Curso de Fundamentos do Aprendizado por Reforço

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Próximas Formações Provisórias

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de Fundamentos do Aprendizado por Reforço

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Próximas Formações Provisórias

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Fundamentos do Aprendizado por Reforço

Cursos Relacionados

Aprendizagem por Reforço Profunda com Python

Fine-Tuning com Reinforcement Learning do Feedback Humano (RLHF)

Modelos de Linguagem Grandes (LLMs) e Aprendizado por Reforço (RL)

Aprendizagem por reforço com o Google Colab

Categorias Relacionadas

Reinforcement Learning

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites