Programa do Curso

Introdução à Arquitetura Biren GPU

  • Visão geral do Biren e casos de uso
  • Layout de hardware: núcleos, memória, clusters computacionais
  • Comparação com NVIDIA e AMD GPU

Configurando o Ambiente Biren Programming

  • Instalando o SDK e o runtime do Biren
  • Entendendo a cadeia de ferramentas e modelo de compilador
  • Estrutura básica do projeto e processo de construção

GPU Programming com o Stack Biren

  • Modelos de thread e bloco
  • Gerenciamento de memória e transferências de dados
  • Desenvolvimento do kernel e padrões de lançamento

Portando do CUDA para Biren

  • Técnicas de tradução para código CUDA
  • Mapeamentos comuns da API e adaptações
  • Laboratórios e prática de conversão de código

Depuração e Perfis de Desempenho

  • Utilizando o depurador e o perfil do Biren
  • Identificando gargalos
  • Padrões de acesso à memória e otimização

Técnicas de Otimização

  • Agenda de threads e pipelining de instruções
  • Desenrolamento de loops e uso da memória compartilhada
  • Afinação avançada do kernel para throughput

Estudo de Caso e Exemplos de Aplicações

  • Treinando um modelo com aceleradores Biren
  • Portando e perfilhando um modelo de visão ou NLP
  • Comparação do desempenho vs CUDA/NVIDIA

Resumo e Próximos Passos

Requisitos

  • Uma compreensão da arquitetura e do processamento paralelo GPU
  • Experiência com CUDA, OpenCL, ou ambientes de programação similares GPU
  • Familiaridade com frameworks de deep learning como PyTorch ou TensorFlow

Público-Alvo

  • Desenvolvedores HPC
  • Engenheiros de infraestrutura AI
  • Especialistas em otimização de desempenho
 21 Horas

Declaração de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas