Programa do Curso

Arquitetura do Greenplum

  • Processamento paralelo e multiprocessamento simétrico
  • Funções dos segmentos e configuração de cluster
  • Escalabilidade e movimentação de dados
  • Arquitetura do Greenplum Data Warehouse

Estruturas de Tabelas do Greenplum

  • Tabelas distribuídas versus tabelas com alocação aleatória
  • Tabelas heap versus tabelas de apenas adição (append-only)
  • Formatos de armazenamento por linha versus coluna
  • Tabelas particionadas e agrupadas

Distribuição de Dados e Hashing

  • Lógica de hashing e chaves de distribuição
  • Tratamento de desbalanceamento (skew) e impacto no desempenho
  • Mapas hash e estratégias de posicionamento de linhas

Índices e Otimização de Desempenho

  • Índices agrupados e não-agrupados
  • Casos de uso de índices B-tree e bitmap
  • Varredura de índice e comportamento de armazenamento

Design Físico do Banco de Dados

  • Normalização e design de modelo lógico
  • Estratégias de acesso do usuário e análise de distribuição
  • Demografia dos dados e decisões sobre índices

Técnicas de Denormalização

  • Dados derivados, tabelas resumidas e pré-joines (pre-joins)
  • Tabelas colunares como particionamento vertical
  • Data marts e views materializadas

SQL Avançado e Execução de Consultas

  • Estratégias de join e redistribuição
  • OLAP e funções de janela (window functions)
  • Tabelas temporárias, subconsultas e tabelas derivadas

Planos EXPLAIN e Otimização de Consultas

  • Leitura e interpretação da saída do EXPLAIN
  • Análise de custo e otimização do plano
  • Movimento de join e operações segmentadas locais

Utilitários e Melhores Práticas do Greenplum

  • ANALYZE e VACUUM
  • Carregamento e movimentação de dados com Nexus
  • Segurança, permissões e dicas de desempenho

Resumo e Próximos Passos

Requisitos

  • Compreensão de bancos de dados relacionais e SQL
  • Experiência com data warehousing ou sistemas analíticos
  • Familiaridade com operações no prompt de comando do Linux

Público-Alvo

  • Arquitetos e engenheiros de dados
  • Administradores de banco de dados e líderes técnicos
  • Desenvolvedores BI e especialistas em analytics que trabalham com Greenplum
 21 Horas

Declaração de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas