Programa do Curso

Introdução

  • Visão geral de Databricks e do Apache Spark
  • Compreender a arquitetura de Databricks

Começar a trabalhar

  • Configurar o ambiente
  • Instalação e configuração de Databricks
  • Navegar na interface de utilizador do Databricks
  • Criar um espaço de trabalho Databricks

Trabalhar com dados em Databricks

  • Ligar a uma fonte de dados Apache Spark
  • Compreender as colunas e os tipos de dados básicos
  • Gerir o sistema de ficheiros nos Notebooks

Gerir tarefas e clusters

  • Criação e configuração de clusters
  • Criando trabalhos usando o Notebook
  • Executar trabalhos
  • Visualização de trabalhos e detalhes de trabalhos

Utilizando Delta Lake em Databricks

  • Carregando dados no Delta Lake
  • Gerir dados no Delta Lake

Segurança Databricks

  • Gerir a segurança Databricks
  • Gerir a cópia de segurança e a recuperação

Resolução de problemas

Resumo e próximas etapas

Requisitos

  • Compreensão básica da análise de dados
  • Conhecimento de Apache Spark

Público

  • Engenheiros de dados
  • Cientistas de dados
  • Desenvolvedores
 14 horas

Declaração de Clientes (2)

Cursos Relacionados

Azure for Data Engineer

35 horas

Categorias Relacionadas