Programa do Curso

Introdução

  • Apache Arrow vs Parquet

Instalando e configurando Apache Arrow

Visão geral de Apache Arrow recursos e arquitetura

Explorando dados com Pandas e Apache Arrow

Explorando dados com Spark e Apache Arrow

Explorando dados com R e Apache Arrow

Explorando dados com MapD e Apache Arrow

Outras Data Analysis integrações

  • PySpark, arquivos Parquet em S3 e Oracle tabelas e Elasticsearch índices

Solução de problemas

Resumo e conclusão

Requisitos

  • Uma compreensão básica de SQL
  • Familiaridade com Python ou R
  • Alguma familiaridade com o Apache Spark
  14 horas
 

Declaração de Clientes (3)

Cursos Relacionados

Categorias Relacionadas