Programa do Curso
Introdução
Visão geral das abordagens de acesso a dados (Hive, bancos de dados, etc.)
Visão geral dos recursos e arquitetura do Spark
Instalação e configuração do Spark
Compreendendo DataFrames no Spark
Definindo tabelas e importando conjuntos de dados
Consultando DataFrames usando SQL
Realizando agregações, JOINs e consultas aninhadas
Fazendo upload e acessando dados
Consultando diferentes tipos de dados
- JSON, Parquet, etc.
Consultando Data Lakes com SQL
Troubleshooting
Resumo e Conclusão
Requisitos
- Experiência com consultas SQL
- Experiência de programação em qualquer linguagem
Público-Alvo
- Analistas de dados
- Cientistas de dados
- Engenheiros de dados
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida