Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
1: HDFS (17%)
- Descrever a função dos daemon do HDFS
- Descrever o funcionamento normal de um cluster Apache Hadoop, tanto no armazenamento de dados quanto no processamento de dados.
- Identificar as características atuais dos sistemas computacionais que motivam um sistema como o Apache Hadoop.
- Classificar os principais objetivos do design HDFS
- Dado um cenário, identificar o caso de uso apropriado para a Federação HDFS
- Identificar os componentes e daemon de um cluster HDFS HA-Quorum
- Analisar o papel da segurança do HDFS (Kerberos)
- Determinar a melhor escolha de serialização de dados para um cenário dado
- Descrever os caminhos de leitura e escrita de arquivos
- Identificar os comandos para manipular arquivos no Shell do Sistema de Arquivos Hadoop
2: YARN e MapReduce versão 2 (MRv2) (17%)
- Compreender como a atualização de um cluster do Hadoop 1 para o Hadoop 2 afeta as configurações do cluster
- Compreender como implantar MapReduce v2 (MRv2 / YARN), incluindo todos os daemon YARN
- Compreender a estratégia de design básica para o MapReduce v2 (MRv2)
- Determinar como o YARN lida com alocações de recursos
- Identificar o fluxo de trabalho de um trabalho do MapReduce executado no YARN
- Determinar quais arquivos você deve alterar e como para migrar um cluster da versão 1 (MRv1) para a versão 2 (MRv2) do MapReduce rodando em YARN.
3: Planejamento de Cluster Apache Hadoop (16%)
- Pontos principais a serem considerados na escolha do hardware e dos sistemas operacionais para hospedar um cluster Apache Hadoop.
- Analisar as opções de seleção de sistema operacional
- Compreender o ajuste do kernel e a troca de disco
- Dado um cenário e padrão de carga, identificar uma configuração de hardware adequada ao cenário
- Dado um cenário, determinar os componentes do ecossistema que o cluster precisa para rodar para cumprir a SLA
- Tamanho do Cluster: dado um cenário e frequência de execução, identificar as especificidades da carga de trabalho, incluindo CPU, memória, armazenamento, I/O de disco
- Dimensionamento e Configuração de Disco, incluindo JBOD versus RAID, SANs, virtualização e requisitos de dimensionamento de disco em um cluster
- Topologias de Rede: compreender o uso da rede no Hadoop (tanto para HDFS quanto para MapReduce) e propor ou identificar os componentes-chave do design de rede para um cenário dado
4: Instalação e Administração do Cluster Apache Hadoop (25%)
- Dado um cenário, identificar como o cluster lidará com falhas de disco e máquina
- Analisar uma configuração de log e o formato do arquivo de configuração de log
- Compreender os fundamentos das métricas do Apache Hadoop e monitoramento da saúde do cluster
- Identificar a função e finalidade das ferramentas disponíveis para o monitoramento do cluster
- Saber instalar todos os componentes do ecossistema no CDH 5, incluindo (mas não limitado a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive e Pig
- Identificar a função e finalidade das ferramentas disponíveis para gerenciar o sistema de arquivos do Apache Hadoop
5: Recursos Management (10%)
- Compreender os objetivos de design gerais de cada um dos schedulers do Hadoop
- Dado um cenário, determinar como o Scheduler FIFO aloca recursos do cluster
- Dado um cenário, determinar como o Fair Scheduler aloca recursos de cluster sob YARN
- Dado um cenário, determinar como o Capacity Scheduler aloca recursos de cluster
6: Monitoramento e Logging (15%)
- Compreender as funções e características das habilidades de coleta de métricas do Hadoop
- Analisar as interfaces da Web NameNode e JobTracker
- Compreender como monitorar os daemon do cluster
- Identificar e monitorar o uso de CPU nos nós mestres
- Descrever como monitorar a troca de memória e alocação de memória em todos os nós
- Identificar como visualizar e gerenciar os arquivos de log do Hadoop
- Interpretar um arquivo de log
Requisitos
- Habilidades básicas de administração Linux
- Habilidades básicas de programação
35 Horas
Declaração de Clientes (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Curso - Administrator Training for Apache Hadoop
Máquina Traduzida
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Curso - Administrator Training for Apache Hadoop
Máquina Traduzida
I mostly liked the trainer giving real live Examples.
Simon Hahn
Curso - Administrator Training for Apache Hadoop
Máquina Traduzida