Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Big Data Visão Geral:
- O que é Big Data
- Por que o Big Data está ganhando popularidade
- Estudos de Caso do Big Data
- Características do Big Data
- Soluções para trabalhar com o Big Data.
Hadoop e seus componentes:
- O que é Hadoop e quais são seus componentes.
- Arquitetura do Hadoop e suas características de dados que pode manipular/processar.
- Breve história sobre o Hadoop, empresas que o utilizam e por que começaram a usá-lo.
- Estrutura do Framework Hadoop e seus componentes - explicados em detalhes.
- O que é HDFS e operações de leitura-escrita no Sistema de Arquivos Distribuído Hadoop.
- Como configurar um cluster do Hadoop em diferentes modos - Independente/Pseudo-Distribuído/Cluster Multi-Nó.
(Isso inclui a configuração de um cluster Hadoop no VirtualBox/KVM/VMware, configurações de rede que precisam ser cuidadosamente revisadas, execução dos Serviços do Hadoop e teste do cluster).
- O que é o Framework MapReduce e como ele funciona.
- Executando trabalhos de MapReduce em um cluster Hadoop.
- Compreendendo replicação, espelhamento e consciência de racks no contexto dos clusters Hadoop.
Planejamento do Cluster Hadoop:
- Como planejar seu cluster Hadoop.
- Compreendendo hardware e software para planejar o seu cluster Hadoop.
- Compreendendo as cargas de trabalho e planejando o cluster para evitar falhas e realizar operações otimizadas.
O que é MapR e por que usar MapR:
- Visão geral do MapR e sua arquitetura.
- Compreendendo e trabalhando com o Sistema de Controle do MapR, volumes do MapR, instantâneos e espelhamentos.
- Planejamento de um cluster no contexto do MapR.
- Comparação entre MapR e outras distribuições com Apache Hadoop.
- Instalação e implantação do cluster do MapR.
Configuração e Administração de Cluster:
- Gerenciando serviços, nós, instantâneos, volumes espelhados e clusters remotos.
- Compreendendo e gerenciando os Nós.
- Compreendendo componentes do Hadoop, instalando componentes do Hadoop ao lado dos serviços do MapR.
- Armazenamento de dados no cluster incluindo via NFS Gerenciando serviços e nós.
- Gerenciando dados usando volumes, gerenciando usuários e grupos, gerenciando e atribuindo funções aos nós, comissionamento e decomissão de nós, administração do cluster e monitoramento de desempenho, configurando/analisando e monitorando métricas para monitorar o desempenho, configurando e administrando segurança do MapR.
- Compreendendo e trabalhando com M7 - armazenamento nativo para tabelas do MapR.
- Configuração e otimização de desempenho do cluster.
Atualização do Cluster e integração com outras configurações:
- Atualizando a versão do software do MapR e tipos de atualizações.
- Configurando o cluster do MapR para acessar o cluster HDFS.
- Configurando o cluster do MapR na Amazon Elastic MapReduce.
Todos os tópicos acima incluem demonstrações e sessões práticas para que os alunos tenham experiência prática com a tecnologia.
Requisitos
- Conhecimento básico de Linux FS
- Conhecimentos básicos de Java
- Conhecimento de Apache Hadoop (recomendado)
28 Horas
Declaração de Clientes (1)
coisas práticas de fazer, além da teoria que foi bem explicada pelo Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Máquina Traduzida