Programa do Curso

Introdução à Geração Aumentada por Recuperação (RAG)

  • O que é RAG e por que é importante para a IA empresarial
  • Componentes de um sistema RAG: recuperador, gerador, repositório de documentos
  • Comparação com LLMs autônomos e pesquisa vetorial

Configurando um Pipeline RAG

  • Instalando e configurando o Haystack ou frameworks similares
  • Ingestão e pré-processamento de documentos
  • Conectando recuperadores a bancos de dados vetoriais (por exemplo, FAISS, Pinecone)

Ajuste Fino do Recuperador

  • Treinando recuperadores densos usando dados específicos do domínio
  • Usando transformadores de sentenças e aprendizado contrastivo
  • Avaliando a qualidade do recuperador com precisão top-k

Ajuste Fino do Gerador

  • Selecionando modelos base (por exemplo, BART, T5, FLAN-T5)
  • Ajuste de instruções vs. ajuste supervisionado
  • Métodos LoRA e PEFT para atualizações eficientes

Avaliação e Otimização

  • Métricas para avaliar o desempenho do RAG (por exemplo, BLEU, EM, F1)
  • Latência, qualidade de recuperação e redução de alucinações
  • Rastreamento de experimentos e melhoria iterativa

Implantação e Integração no Mundo Real

  • Implementando RAG em motores de pesquisa internos e chatbots
  • Considerações de segurança, acesso a dados e governança
  • Integração com APIs, painéis ou portais de conhecimento

Estudos de Caso e Melhores Práticas

  • Casos de uso empresarial em finanças, saúde e direito
  • Gestão de deriva de domínio e atualizações da base de conhecimento
  • Direções futuras em sistemas LLMs aumentados por recuperação

Resumo e Próximos Passos

Requisitos

  • Um entendimento dos conceitos de processamento de linguagem natural (NLP)
  • Experiência com modelos de linguagem baseados em transformadores
  • Familiaridade com Python e fluxos de trabalho básicos de aprendizado de máquina

Público-Alvo

  • Engenheiros de NLP
  • Equipes de gerenciamento de conhecimento
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas