Programa do Curso

Introdução ao Retriever-Augmented Generation (RAG)

  • O que é RAG e por que isso importa para a IA corporativa
  • Componentes de um sistema RAG: retriever, generator, armazenamento de documentos
  • Comparação com LLMs independentes e busca vetorial

Configurando uma Pipeline RAG

  • Instalação e configuração do Haystack ou frameworks similares
  • Ingestão e pré-processamento de documentos
  • Conectando retrievers a bancos de dados vetoriais (e.g., FAISS, Pinecone)

Fine-Tuning o Retriever

  • Treinamento de retrievers densos usando dados específicos do domínio
  • Usando transformadores de sentenças e aprendizado contrastivo
  • Avaliando a qualidade do retriever com precisão top-k

Fine-Tuning o Generator

  • Seleção de modelos base (e.g., BART, T5, FLAN-T5)
  • Tuning instrucional vs. fine-tuning supervisionado
  • Métodos LoRA e PEFT para atualizações eficientes

Avaliação e Otimização

  • Métricas para avaliar o desempenho RAG (e.g., BLEU, EM, F1)
  • Latência, qualidade de recuperação e redução de alucinações
  • Rastreamento de experimentos e melhoria iterativa

Implantação e Integração no Mundo Real

  • Implantando RAG em motores de busca internos e chatbots
  • Considerações sobre segurança, acesso a dados e governança
  • Integração com APIs, painéis ou portais de conhecimento

Casos de Estudo e Melhores Práticas

  • Casos de uso empresarial em finanças, saúde e jurídico
  • Gerenciando o deslocamento do domínio e atualizações da base de conhecimento
  • Direções futuras para sistemas LLM com recuperação aumentada

Resumo e Próximos Passos

Requisitos

  • Compreensão dos conceitos de processamento de linguagem natural (PLN)
  • Experiência com modelos de linguagem baseados em transformers
  • Familiaridade com Python e fluxos de trabalho básicos de aprendizado de máquina

Público-alvo

  • Engenheiros de PLN
  • Equipes de gestão do conhecimento
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas