Programa do Curso

1: HDFS (17%)

  • Descrever a função dos daemon do HDFS
  • Descrever o funcionamento normal de um cluster Apache Hadoop, tanto no armazenamento de dados quanto no processamento de dados.
  • Identificar as características atuais dos sistemas computacionais que motivam um sistema como o Apache Hadoop.
  • Classificar os principais objetivos do design HDFS
  • Dado um cenário, identificar o caso de uso apropriado para a Federação HDFS
  • Identificar os componentes e daemon de um cluster HDFS HA-Quorum
  • Analisar o papel da segurança do HDFS (Kerberos)
  • Determinar a melhor escolha de serialização de dados para um cenário dado
  • Descrever os caminhos de leitura e escrita de arquivos
  • Identificar os comandos para manipular arquivos no Shell do Sistema de Arquivos Hadoop

2: YARN e MapReduce versão 2 (MRv2) (17%)

  • Compreender como a atualização de um cluster do Hadoop 1 para o Hadoop 2 afeta as configurações do cluster
  • Compreender como implantar MapReduce v2 (MRv2 / YARN), incluindo todos os daemon YARN
  • Compreender a estratégia de design básica para o MapReduce v2 (MRv2)
  • Determinar como o YARN lida com alocações de recursos
  • Identificar o fluxo de trabalho de um trabalho do MapReduce executado no YARN
  • Determinar quais arquivos você deve alterar e como para migrar um cluster da versão 1 (MRv1) para a versão 2 (MRv2) do MapReduce rodando em YARN.

3: Planejamento de Cluster Apache Hadoop (16%)

  • Pontos principais a serem considerados na escolha do hardware e dos sistemas operacionais para hospedar um cluster Apache Hadoop.
  • Analisar as opções de seleção de sistema operacional
  • Compreender o ajuste do kernel e a troca de disco
  • Dado um cenário e padrão de carga, identificar uma configuração de hardware adequada ao cenário
  • Dado um cenário, determinar os componentes do ecossistema que o cluster precisa para rodar para cumprir a SLA
  • Tamanho do Cluster: dado um cenário e frequência de execução, identificar as especificidades da carga de trabalho, incluindo CPU, memória, armazenamento, I/O de disco
  • Dimensionamento e Configuração de Disco, incluindo JBOD versus RAID, SANs, virtualização e requisitos de dimensionamento de disco em um cluster
  • Topologias de Rede: compreender o uso da rede no Hadoop (tanto para HDFS quanto para MapReduce) e propor ou identificar os componentes-chave do design de rede para um cenário dado

4: Instalação e Administração do Cluster Apache Hadoop (25%)

  • Dado um cenário, identificar como o cluster lidará com falhas de disco e máquina
  • Analisar uma configuração de log e o formato do arquivo de configuração de log
  • Compreender os fundamentos das métricas do Apache Hadoop e monitoramento da saúde do cluster
  • Identificar a função e finalidade das ferramentas disponíveis para o monitoramento do cluster
  • Saber instalar todos os componentes do ecossistema no CDH 5, incluindo (mas não limitado a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive e Pig
  • Identificar a função e finalidade das ferramentas disponíveis para gerenciar o sistema de arquivos do Apache Hadoop

5: Recursos Management (10%)

  • Compreender os objetivos de design gerais de cada um dos schedulers do Hadoop
  • Dado um cenário, determinar como o Scheduler FIFO aloca recursos do cluster
  • Dado um cenário, determinar como o Fair Scheduler aloca recursos de cluster sob YARN
  • Dado um cenário, determinar como o Capacity Scheduler aloca recursos de cluster

6: Monitoramento e Logging (15%)

  • Compreender as funções e características das habilidades de coleta de métricas do Hadoop
  • Analisar as interfaces da Web NameNode e JobTracker
  • Compreender como monitorar os daemon do cluster
  • Identificar e monitorar o uso de CPU nos nós mestres
  • Descrever como monitorar a troca de memória e alocação de memória em todos os nós
  • Identificar como visualizar e gerenciar os arquivos de log do Hadoop
  • Interpretar um arquivo de log

Requisitos

  • Habilidades básicas de administração Linux
  • Habilidades básicas de programação
 35 Horas

Declaração de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas