Entrar em Contato

Programa do Curso

Introdução:

  • Apache Spark em Hadoop Ecossistema
  • Breve introdução para python, scala

Noções básicas (teoria):

  • Arquitetura
  • RDD
  • Transformação e Ações
  • Estágio, Tarefa, Dependências

Usando o ambiente Databricks, entenda o básico (workshop prático):

  • Exercícios usando API RDD
  • Funções básicas de ação e transformação
  • ParRDD
  • Juntar
  • Estratégias de cache
  • Exercícios usando API DataFrame
  • FaíscaSQL
  • DataFrame: selecionar, filtrar, agrupar, classificar
  • UDF (função definida pelo usuário)
  • Olhando para a API DataSet
  • Transmissão

Usando o ambiente AWS, entenda a implantação (workshop prático):

  • Noções básicas do AWS Glue
  • Entenda as diferenças entre AWS EMR e AWS Glue
  • Trabalhos de exemplo em ambos os ambientes
  • Entenda prós e contras

Extra:

  • Introdução à Apache Airflow orquestração

Requisitos

Conhecimentos de programação (de preferência python, scala)

SQL noções básicas

 21 Horas

Treinamento Corporativo Personalizado

Soluções de treinamento projetadas exclusivamente para empresas.

  • Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
  • Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
  • Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.
Investimento

Preço por grupo privado, treinamento online ao vivo, a partir de 3900 € + VAT*

Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes

Testemunhos de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas