Programa do Curso
Introdução ao Google Colab e Apache Spark
- Visão geral do Google Colab
- Introdução ao Apache Spark
- Configurando o Spark no Google Colab
Processamento de Dados com o Apache Spark
- Trabalhando com RDDs e DataFrames
- Carregando e processando grandes conjuntos de dados
- Utilizando Spark SQL para consultar dados estruturados
Análise Avançada com o Spark
- Aprendizado de máquina com o Spark MLlib
- Realizando análise de dados em tempo real
- Computação distribuída com o Spark
Visualização e Collaboration no Google Colab
- Integração do Colab com bibliotecas populares de visualização
- Fluxos de trabalho colaborativos com os notebooks Colab
- Compartilhamento e exportação de resultados
Otimizando Workflows Big Data
- Ajustando o Spark para desempenho
- Otimização do uso da memória e armazenamento
- Escalonando workflows para grandes conjuntos de dados
Big Data na Nuvem
- Integração do Google Colab com ferramentas baseadas em nuvem
- Utilizando armazenamento em nuvem para dados grandes
- Trabalhando com Spark em ambientes distribuídos na nuvem
Estudos de Caso e Melhores Práticas
- Revisão de aplicações de big data no mundo real
- Estudos de caso utilizando Apache Spark e Colab
- Melhores práticas para análise de big data
Resumo e Próximos Passos
Requisitos
- Conhecimento básico de conceitos de ciência de dados
- Familiaridade com Apache Spark
- Habilidades de programação em Python
Público-alvo
- Cientistas de dados
- Engenheiros de dados
- Pesquisadores que trabalham com grandes volumes de dados
Declaração de Clientes (5)
Exemplos práticos nos permitiram ter uma verdadeira noção de como o programa funciona. Explicações detalhadas e integração de conceitos teóricos e sua relação com aplicações práticas.
Ian - Archeoworks Inc.
Curso - ArcGIS Fundamentals
Máquina Traduzida
Todos os tópicos que ele abordou, incluindo exemplos. E também explicou como eles são úteis no nosso trabalho diário.
madduri madduri - Boskalis Singapore Pte Ltd
Curso - QGIS for Geographic Information System
Máquina Traduzida
Gostei do estilo do Pablo, do facto de ter abordado muitos assuntos, desde a conceção de relatórios, personalização com html até à implementação de algoritmos ML simples. Good equilíbrio informação teórica / exercícios. O Pablo cobriu realmente todos os tópicos que me interessavam e deu respostas completas às minhas perguntas.
Cristian Tudose - SC Automobile Dacia SA
Curso - Advanced Data Analysis with TIBCO Spotfire
Máquina Traduzida
Aplicação prática do Spotfire e todas as funções básicas.
Michael Capili - STMicroelectronics, Inc.
Curso - Introduction to Spotfire
Máquina Traduzida
O que eu gostei mais do treinamento foi a organização e o local
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Curso - ArcGIS for Spatial Analysis
Máquina Traduzida