Curso de GPU Programming with CUDA

CUDA é um padrão aberto para GPU programação que permite que um código seja executado em NVIDIA GPU s, que são amplamente utilizados para computação de alto desempenho, inteligência artificial (IA), jogos e gráficos. A CUDA expõe o programador aos detalhes do hardware e dá-lhe controlo total sobre o processo de paralelização. No entanto, isso também requer uma boa compreensão da arquitetura do dispositivo, modelo de memória, modelo de execução e técnicas de otimização.

Este treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a desenvolvedores de nível iniciante a intermediário que desejam usar CUDA para programar NVIDIA GPU s e explorar seu paralelismo.

Ao final deste treinamento, os participantes serão capazes de:

Configurar um ambiente de desenvolvimento que inclua o CUDA Toolkit, um código NVIDIA GPU e Visual Studio.
Criar um programa CUDA básico que execute a adição de vetores no GPU e recupere os resultados da memória GPU.
Use a API CUDA para consultar informações do dispositivo, alocar e desalocar a memória do dispositivo, copiar dados entre o host e o dispositivo, iniciar kernels e sincronizar threads.
Use a linguagem CUDA C/C++ para escrever kernels que são executados no GPU e manipulam dados.
Usar funções, variáveis e bibliotecas internas da CUDA para executar tarefas e operações comuns.
Usar espaços de memória CUDA, como global, compartilhado, constante e local, para otimizar transferências de dados e acessos à memória.
Usar o modelo de execução CUDA para controlar os threads, blocos e grades que definem o paralelismo.
Depurar e testar programas CUDA usando ferramentas como CUDA-GDB, CUDA-MEMCHECK e NVIDIA Nsight.
Otimizar programas CUDA usando técnicas como coalescência, cache, pré-busca e criação de perfil.

Formato do curso

Palestra interativa e discussão.
Muitos exercícios e prática.
Implementação prática em um ambiente de laboratório ao vivo.

Opções de personalização do curso

Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.
96% de clientes satisfeitos

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Introdução

O que é CUDA?
CUDA vs OpenCL vs SYCL
Visão geral dos recursos e da arquitetura CUDA
Configurando o ambiente de desenvolvimento

Primeiros passos

Criando um novo projeto CUDA usando o código Visual Studio
Explorando a estrutura e os arquivos do projeto
Compilando e executando o programa
Exibindo a saída usando printf e fprintf

API CUDA

Entendendo a função da API CUDA no programa host
Usando a API CUDA para consultar informações e recursos do dispositivo
Usando a API CUDA para alocar e desalocar a memória do dispositivo
Usar a API CUDA para copiar dados entre o host e o dispositivo
Usar a API CUDA para iniciar kernels e sincronizar threads
Usando a API CUDA para tratar erros e exceções

CUDA C/C++

Entendendo o papel da CUDA C/C++ no programa do dispositivo
Usando CUDA C/C++ para escrever kernels que executam no GPU e manipulam dados
Usando tipos de dados, qualificadores, operadores e expressões CUDA C/C++
Utilizar funções incorporadas em CUDA C/C++, tais como math, atomic, warp, etc.
Usando variáveis incorporadas em CUDA C/C++, como threadIdx, blockIdx, blockDim, etc.
Uso de bibliotecas CUDA C/C++, como cuBLAS, cuFFT, cuRAND, etc.

Modelo de memória CUDA

Entendendo a diferença entre os modelos de memória do host e do dispositivo
Usando espaços de memória CUDA, como global, compartilhado, constante e local
Usando objetos de memória CUDA, como ponteiros, matrizes, texturas e superfícies
Usando modos de acesso à memória CUDA, como somente leitura, somente gravação, leitura-escrita, etc.
Usando o modelo de consistência de memória CUDA e mecanismos de sincronização

Modelo de execução CUDA

Entendendo a diferença entre os modelos de execução do host e do dispositivo
Uso de threads, blocos e grades CUDA para definir o paralelismo
Usando funções de thread CUDA, como threadIdx, blockIdx, blockDim, etc.
Usando funções de bloco CUDA, como __syncthreads, __threadfence_block, etc.
Utilização de funções de grelha CUDA, como gridDim, gridSync, grupos cooperativos, etc.

Depuração

Entendendo os erros e bugs comuns em programas CUDA
Usando o Visual Studio Depurador de código para inspecionar variáveis, pontos de interrupção, pilha de chamadas, etc.
Usando o CUDA-GDB para depurar programas CUDA em Linux
Usando o CUDA-MEMCHECK para detetar erros e vazamentos de memória
Usando o NVIDIA Nsight para depurar e analisar programas CUDA no Windows

Otimização

Entendendo os fatores que afetam o desempenho dos programas CUDA
Usar técnicas de coalescência CUDA para melhorar a taxa de transferência de memória
Uso de técnicas de cache e pré-busca da CUDA para reduzir a latência da memória
Usando a memória compartilhada CUDA e técnicas de memória local para otimizar os acessos à memória e a largura de banda
Usando ferramentas de criação de perfil e perfilamento CUDA para medir e melhorar o tempo de execução e a utilização de recursos

Resumo e próximas etapas

Requisitos

Conhecimento da linguagem C/C++ e dos conceitos de programação paralela
Conhecimentos básicos de arquitetura de computadores e hierarquia de memória
Experiência com ferramentas de linha de comando e editores de código

Público alvo

Desenvolvedores que desejam aprender a usar CUDA para programar NVIDIA GPUs e explorar seu paralelismo
Desenvolvedores que desejam escrever código de alto desempenho e escalável que possa ser executado em diferentes dispositivos CUDA
Programadores que desejam explorar os aspectos de baixo nível da programação GPU e otimizar o desempenho do código

28 Horas

Precisa de ajuda para escolher o curso certo?

Curso de GPU Programming with CUDA

Programa do Curso

Requisitos

Próximas Formações Provisórias

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de GPU Programming with CUDA

Programa do Curso

Requisitos

Próximas Formações Provisórias

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

GPU Programming with CUDA

Cursos Relacionados

Developing AI Applications with Huawei Ascend and CANN

Deploying AI Models with CANN and Ascend AI Processors

GPU Programming on Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Introduction to CANN for AI Framework Developers

CANN for Edge AI Deployment

Understanding Huawei’s AI Compute Stack: From CANN to MindSpore

Optimizing Neural Network Performance with CANN SDK

CANN SDK for Computer Vision and NLP Pipelines

Building Custom AI Operators with CANN TIK and TVM

Migrating CUDA Applications to Chinese GPU Architectures

Performance Optimization on Ascend, Biren, and Cambricon

Categorias Relacionadas

GPU

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites