Programa do Curso

Introdução

  • Visão geral do Databricks e do Apache Spark
  • Compreendendo a arquitetura do Databricks

Começando

  • Configurando o ambiente
  • Configurando e configurando o Databricks
  • Navegando na interface de usuário do Databricks
  • Criando um workspace no Databricks

Trabalhando com dados no Databricks

  • Conectando-se a uma fonte de dados do Apache Spark
  • Compreendendo os conceitos básicos de colunas e tipos de dados
  • Gestão do sistema de arquivos em Notebooks

Gestão de trabalhos e clusters

  • Criando e configurando clusters
  • Criando trabalhos usando Notebook
  • Executando trabalhos
  • Visualizando trabalhos e detalhes dos trabalhos

Usando o Delta Lake no Databricks

  • Carregando dados para o Delta Lake
  • Gestão de dados no Delta Lake

Protegendo o Databricks

  • Gestão da segurança do Databricks
  • Gestão de backup e recuperação

Solução de problemas

Resumo e próximos passos

Requisitos

  • Noções básicas de análise de dados
  • Conhecimento do Apache Spark

Público-alvo

  • Engenheiros de Dados
  • Cientistas de Dados
  • Desenvolvedores
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas