Programa do Curso

Introdução

  • Compreender a importância da preparação de dados na análise e na aprendizagem automática
  • Pipeline de preparação de dados e o seu papel no ciclo de vida dos dados
  • Explorar os desafios comuns nos dados em bruto e o impacto na análise

Recolha e aquisição de dados

  • Fontes de dados: bases de dados, APIs, folhas de cálculo, ficheiros de texto, etc.
  • Técnicas de recolha de dados e garantia da qualidade dos dados durante a recolha
  • Recolha de dados de várias fontes

Data Cleaning Técnicas

  • Identificar e tratar os valores em falta, os valores anómalos e as inconsistências
  • Lidar com duplicados e erros no conjunto de dados
  • Limpar conjuntos de dados do mundo real

Transformação e normalização de dados

  • Técnicas de normalização e padronização de dados
  • Tratamento de dados categóricos: codificação, binning e engenharia de características
  • Transformação de dados em bruto em formatos utilizáveis

Data Integration e Agregação

  • Fusão e combinação de conjuntos de dados de diferentes fontes
  • Resolução de conflitos de dados e alinhamento de tipos de dados
  • Técnicas de agregação e consolidação de dados

Data Quality Assurance

  • Métodos para garantir a qualidade e a integridade dos dados ao longo de todo o processo
  • Implementação de controlos de qualidade e procedimentos de validação
  • Estudos de casos e aplicações práticas da garantia da qualidade dos dados

Redução da dimensionalidade e seleção de características

  • Compreender a necessidade de redução da dimensionalidade
  • Técnicas como PCA, seleção de características e estratégias de redução
  • Implementar técnicas de redução da dimensionalidade

Resumo e próximas etapas

 14 horas

Declaração de Clientes (2)

Cursos Relacionados

Categorias Relacionadas