Programa do Curso
Introdução
Visão geral dos dados Access Abordagens (Hive, bancos de dados, etc.)
Visão geral dos recursos e arquitetura do Spark
Instalando e configurando o Spark
Compreendendo dataframes no Spark
Definição de tabelas e importação de conjuntos de dados
Consultando quadros de dados usando SQL
Realizando agregações, JOINs e consultas aninhadas
Fazendo upload e Accessing de dados
Consultando diferentes tipos de dados
- JSON, Parquet, etc.
Consultando Data Lakes com SQL
Solução de problemas
Resumo e conclusão
Requisitos
- Experiência com SQL consultas
- Experiência de programação em qualquer linguagem
Público
- Analistas de dados
- Cientistas de dados
- Engenheiros de dados
Declaração de Clientes (5)
Muitos exemplos práticos, diferentes formas de abordar o mesmo problema e, por vezes, truques não tão óbvios para melhorar a solução atual
Rafal - Nordea
Curso - Apache Spark MLlib
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida