Programa do Curso

Introdução ao Google Colab e Apache Spark

  • Visão geral do Google Colab
  • Introdução ao Apache Spark
  • Configurando o Spark no Google Colab

Processamento de Dados com o Apache Spark

  • Trabalhando com RDDs e DataFrames
  • Carregando e processando grandes conjuntos de dados
  • Utilizando Spark SQL para consultar dados estruturados

Análise Avançada com o Spark

  • Aprendizado de máquina com o Spark MLlib
  • Realizando análise de dados em tempo real
  • Computação distribuída com o Spark

Visualização e Collaboration no Google Colab

  • Integração do Colab com bibliotecas populares de visualização
  • Fluxos de trabalho colaborativos com os notebooks Colab
  • Compartilhamento e exportação de resultados

Otimizando Workflows Big Data

  • Ajustando o Spark para desempenho
  • Otimização do uso da memória e armazenamento
  • Escalonando workflows para grandes conjuntos de dados

Big Data na Nuvem

  • Integração do Google Colab com ferramentas baseadas em nuvem
  • Utilizando armazenamento em nuvem para dados grandes
  • Trabalhando com Spark em ambientes distribuídos na nuvem

Estudos de Caso e Melhores Práticas

  • Revisão de aplicações de big data no mundo real
  • Estudos de caso utilizando Apache Spark e Colab
  • Melhores práticas para análise de big data

Resumo e Próximos Passos

Requisitos

  • Conhecimento básico de conceitos de ciência de dados
  • Familiaridade com Apache Spark
  • Habilidades de programação em Python

Público-alvo

  • Cientistas de dados
  • Engenheiros de dados
  • Pesquisadores que trabalham com grandes volumes de dados
 14 Horas

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas