Programa do Curso

Introdução

  • O Processo da Ciência de Dados
  • Papéis e responsabilidades de um Cientista de Dados

Preparação do Ambiente de Desenvolvimento

  • Bibliotecas, frameworks, linguagens e ferramentas
  • Desenvolvimento local
  • Desenvolvimento colaborativo baseado na web

Coleta de Dados

  • Tipos Diferentes de Dados
    • Estruturados
      • Bancos de dados locais
      • Conectores de banco de dados
      • Formatos comuns: xlxs, XML, Json, csv, ...
    • Não Estruturados
      • Cliques, sensores, smartphones
      • APIs
      • Internet das Coisas (IoT)
      • Documentos, imagens, vídeos, sons
  • Estudo de caso: Coletando grandes quantidades de dados não estruturados continuamente

Armazenamento de Dados

  • Bancos de dados relacionais
  • Bancos de dados não relacionais
  • Hadoop: Sistema de Arquivos Distribuído (HDFS)
  • Spark: Conjunto de Dados Distribuído Resiliente (RDD)
  • Armazenamento em nuvem

Preparação de Dados

  • Ingestão, seleção, limpeza e transformação
  • Garantia da qualidade dos dados - correção, significância e segurança
  • Relatórios de exceções

Linguagens Utilizadas para Preparação, Processamento e Análise

  • Linguagem R
    • Introdução ao R
    • Manipulação de dados, cálculo e exibição gráfica
  • Python
    • Introdução ao Python
    • Manipulação, processamento, limpeza e análise de dados

Análise de Dados

  • Análise exploratória
    • Estatísticas básicas
    • Visualizações preliminares
    • Compreensão dos dados
  • Causalidade
  • Características e transformações
  • Aprendizado de Máquina
    • Supervisionado vs não supervisionado
    • Quando usar qual modelo
  • Processamento de Linguagem Natural (NLP)

Visualização de Dados

  • Melhores Práticas
  • Selecionando o gráfico certo para os dados certos
  • Paletas de cores
  • Levando ao próximo nível
    • Painéis
    • Visualizações interativas
  • Contação de histórias com dados

Resumo e Conclusão

Requisitos

  • Compreensão geral dos conceitos de banco de dados
  • Entendimento básico de estatística
 35 Horas

Declaração de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas