Programa do Curso

Introdução

Instalação e configuração do Dataiku Data Science Studio (DSS)

  • Requisitos de sistema para o Dataiku DSS
  • Configuração das integrações do Apache Hadoop e do Apache Spark
  • Configuração de Dataiku DSS com proxies web
  • Migração de outras plataformas para Dataiku DSS

Descrição geral das características e da arquitetura do Dataiku DSS

  • Objectos principais e gráficos fundamentais para o Dataiku DSS
  • O que é uma receita em Dataiku DSS?
  • Tipos de conjuntos de dados suportados por Dataiku DSS

Criar um projeto Dataiku DSS

Definição de conjuntos de dados para ligação a recursos de dados no Dataiku DSS

  • Trabalhar com conectores DSS e formatos de ficheiro
  • Formatos padrão de DSS v.s. formatos específicos de Hadoop
  • Carregamento de ficheiros para um projeto Dataiku DSS

Visão geral do sistema de arquivos do servidor no Dataiku DSS

Criar e utilizar pastas geridas

  • Receita Dataiku DSS para pasta de fusão
  • Pastas geridas locais e não locais

Construção de um conjunto de dados do sistema de arquivos usando conteúdo de pastas gerenciadas

  • Execução de limpezas com uma receita de código DSS

Trabalhar com o conjunto de dados de métricas e o conjunto de dados de estatísticas internas

Implementação da receita de download do DSS para o conjunto de dados HTTP

Realocação de conjuntos de dados SQL e conjuntos de dados HDFS usando DSS

Ordenação de conjuntos de dados no Dataiku DSS

  • Ordenação do escritor vs. ordenação do tempo de leitura

Exploração e preparação de imagens de dados para um projeto Dataiku DSS

Visão geral dos esquemas, tipos de armazenamento e significados do Dataiku

Execução de scripts de limpeza, normalização e enriquecimento de dados no Dataiku DSS

Trabalhar com a interface Dataiku DSS Charts e tipos de agregações visuais

Utilização da funcionalidade interactiva Statistics do DSS

  • Análise univariada versus análise bivariada
  • Utilização da ferramenta DSS de análise de componentes principais (PCA)

Visão geral de Machine Learning com o Dataiku DSS

  • ML supervisionado vs. ML não supervisionado
  • Referências para DSS ML Algoritmos e tratamento de características
  • Deep Learning com Dataiku DSS

Visão geral do fluxo derivado dos conjuntos de dados e receitas do DSS

Transformar conjuntos de dados existentes em DSS com receitas visuais

Utilização de receitas DSS baseadas em código definido pelo utilizador

Otimização da exploração e experimentação de código com os cadernos de código DSS

Escrever visualizações avançadas de DSS e funcionalidades de front-end personalizadas com Webapps

Trabalhar com a funcionalidade Dataiku DSS Code Reports

Partilha de dados do projeto Elements e familiarização com o painel de controlo do DSS

Conceber e empacotar um projeto Dataiku DSS como uma aplicação reutilizável

Síntese de métodos avançados no Dataiku DSS

  • Implementação de particionamento optimizado de conjuntos de dados utilizando DSS
  • Execução de partes específicas do processamento de DSS através de cálculos em contentores Kubernetes

Síntese de Collaboration e controlo de versões no Dataiku DSS

Implementação de cenários de automatização, métricas e verificações para testes de projectos DSS

Implantação e atualização de um projeto com o nó de automação DSS e pacotes

Trabalhar com APIs em tempo real no Dataiku DSS

  • APIs adicionais e APIs Rest em DSS

Analisar e Forecasting Dataiku DSS Séries temporais

Proteger um projeto no Dataiku DSS

  • Gerir as permissões do projeto e as autorizações do painel de controlo
  • Implementar opções de segurança avançadas

Integração do Dataiku DSS com a nuvem

Resolução de problemas

Resumo e conclusão

Requisitos

  • Experiência com as linguagens de programação Python, SQL e R
  • Conhecimento básico de processamento de dados com Apache Hadoop e Spark
  • Compreensão de conceitos de machine learning e modelos de dados
  • Antecedentes em análises estatísticas e conceitos de ciência de dados
  • Experiência com visualização e comunicação de dados

Público

  • Engenheiros
  • Cientistas de dados
  • Analistas de dados
  21 horas
 

Cursos Relacionados

Categorias Relacionadas