Programa do Curso

Introdução

Visão geral de Data Cleaning

  • Porque é que Data Cleaning é importante?

Estudo de caso: Quando Big Data está sujo

Desenvolver uma estratégia Data Cleaning completa

Ferramentas Data Cleaning comuns

  • Pipa
  • OpenRefine
  • Pandas (para Python)
  • Dplyr (para R)

Alcançar uma elevada integridade dos dados

  • Completo
  • Correto
  • Exato
  • Relevante
  • Consistente

Automatização do processo Data Cleaning

Monitorizar o seu sistema Data Cleaning

Resumo e conclusão

Requisitos

  • Compreensão dos conceitos de análise de dados.

Público

  • Cientistas de dados
  • Analistas de dados
  • Business Analistas
  7 horas
 

Declaração de Clientes (2)

Cursos Relacionados

Azure for Data Engineer

  35 horas

Categorias Relacionadas