Programa do Curso

Introdução

  • Introdução ao Computação em Nuvem e soluções de Big Data
  • Visão geral das características e arquitetura do Apache Hadoop

Configurando o Hadoop

  • Planejamento de um cluster Hadoop (on-premise, nuvem, etc.)
  • Seleção do sistema operacional e distribuição do Hadoop
  • Aprovisionando recursos (hardware, rede, etc.)
  • Baixando e instalando o software
  • Determinando o tamanho do cluster para flexibilidade

Trabalhando com HDFS

  • Compreendendo o Hadoop Distributed File System (HDFS)
  • Visão geral da referência de comandos do HDFS
  • Acessando o HDFS
  • Realizando operações básicas de arquivo no HDFS
  • Usando o S3 como complemento ao HDFS

Visão geral do MapReduce

  • Compreendendo o fluxo de dados no framework MapReduce
  • Map, Shuffle, Sort e Reduce
  • Demonstração: Cálculo dos maiores salários

Trabalhando com YARN

  • Compreendendo o gerenciamento de recursos no Hadoop
  • Trabalhando com ResourceManager, NodeManager e Application Master
  • Agorendar tarefas sob o YARN
  • Agorandamento para grandes números de nós e clusters
  • Demonstração: Agendamento de tarefas

Integrando Hadoop com Spark

  • Configurando armazenamento para o Spark (HDFS, Amazon S3, NoSQL, etc.)
  • Compreendendo Resilient Distributed Datasets (RDDs)
  • Criando um RDD
  • Implementando transformações de RDD
  • Demonstração: Implementando um programa de pesquisa de texto para títulos de filmes

Gerenciando um cluster Hadoop

  • Monitorando o Hadoop
  • Segurança do cluster Hadoop
  • Adicionando e removendo nós
  • Rodando um benchmark de desempenho
  • Ajustando um cluster Hadoop para otimizar o desempenho
  • Fazendo backup, recuperação e planejamento de continuidade do negócio
  • Garantindo alta disponibilidade (HA)

Atualizando e migrando um cluster Hadoop

  • Avaliando os requisitos de carga de trabalho
  • Atualizando o Hadoop
  • Movendo do on-premise para a nuvem e vice-versa
  • Recuperando falhas

Solução de problemas

Resumo e conclusão

Requisitos

  • Experiência com administração de sistemas
  • Conhecimento da linha de comando do Linux
  • Compreensão dos conceitos de big data

Público-alvo

  • Administradores de sistemas
  • DBAs
 35 Horas

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas