Programa do Curso

Introdução

Compreensão Big Data

Visão geral do Spark

Visão geral de Python

Visão geral de PySpark

  • Distribuindo dados usando estrutura de conjuntos de dados distribuídos resilientes
  • Distribuindo computação usando operadores de API Spark

Configurando Python com Spark

Configurando PySpark

Usando Amazon Web Services (AWS) instâncias EC2 para Spark

Configurando Databricks

Configurando o cluster AWS EMR

Aprendendo o básico de Python Programming

  • Primeiros passos com Python
  • Usando o notebook Jupyter
  • Usando variáveis e tipos de dados simples
  • Trabalhando com listas
  • Usando instruções if
  • Usando entradas do usuário
  • Trabalhando com loops while
  • Implementando Funções
  • Trabalhando com aulas
  • Trabalhando com arquivos e exceções
  • Trabalhando com projetos, dados e APIs

Aprendendo o básico do Spark DataFrame

  • Primeiros passos com Spark DataFrames
  • Implementando operações básicas com Spark
  • Usando operações Groupby e Aggregate
  • Trabalhando com carimbos de data e hora e datas

Trabalhando em um exercício de projeto Spark DataFrame

Compreendendo Machine Learning com MLlib

Trabalhando com MLlib, Spark e Python para Machine Learning

Compreendendo as regressões

  • Aprendendo a Teoria da Regressão Linear
  • Implementando um código de avaliação de regressão
  • Trabalhando em um exemplo de exercício de regressão linear
  • Aprendendo a Teoria da Regressão Logística
  • Implementando um Código de Regressão Logística
  • Trabalhando em um exemplo de exercício de regressão logística

Compreendendo Random Forests e árvores de decisão

  • Teoria dos Métodos da Árvore de Aprendizagem
  • Implementando Árvores de Decisão e Random Forest Códigos
  • Trabalhando em uma amostra Random Forest Exercício de classificação

Trabalhando com agrupamento K-means

  • Compreendendo a teoria de agrupamento K-means
  • Implementando um código de cluster K-means
  • Trabalhando em um exercício de agrupamento de amostra

Trabalhando com sistemas de recomendação

Implementando Processamento de Linguagem Natural

  • Compreensão Natural Language Processing (NLP)
  • Visão geral das ferramentas de PNL
  • Trabalhando em um exemplo de exercício de PNL

Streaming com Spark em Python

  • Visão geral do streaming com Spark
  • Amostra Spark Streaming Exercício

Observações finais

Requisitos

  • Competências gerais de programação

Público

  • Desenvolvedores
  • Profissionais de TI
  • Cientistas de dados
  21 horas
 

Declaração de Clientes (5)

Cursos Relacionados

Categorias Relacionadas