Programa do Curso

Introdução

    As Data Science funções e responsabilidades do processo de um cientista de dados

Preparando o Ambiente de Desenvolvimento

    Bibliotecas, frameworks, linguagens e ferramentas Desenvolvimento local Desenvolvimento colaborativo baseado na web

Coleção de dados

    Diferentes tipos de dados Bancos de dados locais estruturados Conectores de banco de dados Formatos comuns: xlxs, XML, Json, csv, ...
Cliques não estruturados, censores, smartphones
  • APIs
  • Internet of Things (IoT)
  • Documentos, fotos, vídeos, sons
  • Estudo de caso: Coletando continuamente grandes quantidades de dados não estruturados
  • Armazenamento de dadosBancos de dados relacionais Bancos de dados não relacionais Hadoop: Sistema de arquivos distribuídos (HDFS) Spark: Conjunto de dados distribuídos resilientes (RDD) Armazenamento em nuvem
  • Preparação de dados
  • Ingestão, seleção, limpeza e transformação Garantindo a qualidade dos dados – correção, significância e segurança Relatórios de exceção

      Languages usado para preparação, processamento e análise

    Linguagem R Introdução ao R Manipulação de dados, cálculo e exibição gráfica

      Python Introdução a Python

    Manipulação, processamento, limpeza e processamento de dados

      Análise de dados
    Análise exploratória Estatísticas básicas Visualizações preliminares Compreender os dados
  • Causalidade
  • Recursos e transformações
  • Machine Learning Supervisionado vs não supervisionado

      Quando usar qual modelo
    Natural Language Processing (NLP)
  • Data Visualization
  • Melhores práticas Selecionando o gráfico certo para os dados certos Paletas de cores Levando para o próximo nível Painéis Visualizações interativas
  • Contação de histórias com dados
  • Resumo e conclusão
  • Requisitos

    • Uma compreensão geral dos conceitos de bases de dados
    • Um conhecimento básico de estatística
     35 horas

    Declaração de Clientes (2)

    Próximas Formações Provisórias

    Categorias Relacionadas