Programa do Curso

Big Data Visão Geral:

  • O que é Big Data
  • Por que o Big Data está ganhando popularidade
  • Estudos de Caso do Big Data
  • Características do Big Data
  • Soluções para trabalhar com o Big Data.

Hadoop e seus componentes:

  • O que é Hadoop e quais são seus componentes.
  • Arquitetura do Hadoop e suas características de dados que pode manipular/processar.
  • Breve história sobre o Hadoop, empresas que o utilizam e por que começaram a usá-lo.
  • Estrutura do Framework Hadoop e seus componentes - explicados em detalhes.
  • O que é HDFS e operações de leitura-escrita no Sistema de Arquivos Distribuído Hadoop.
  • Como configurar um cluster do Hadoop em diferentes modos - Independente/Pseudo-Distribuído/Cluster Multi-Nó.

(Isso inclui a configuração de um cluster Hadoop no VirtualBox/KVM/VMware, configurações de rede que precisam ser cuidadosamente revisadas, execução dos Serviços do Hadoop e teste do cluster).

  • O que é o Framework MapReduce e como ele funciona.
  • Executando trabalhos de MapReduce em um cluster Hadoop.
  • Compreendendo replicação, espelhamento e consciência de racks no contexto dos clusters Hadoop.

Planejamento do Cluster Hadoop:

  • Como planejar seu cluster Hadoop.
  • Compreendendo hardware e software para planejar o seu cluster Hadoop.
  • Compreendendo as cargas de trabalho e planejando o cluster para evitar falhas e realizar operações otimizadas.

O que é MapR e por que usar MapR:

  • Visão geral do MapR e sua arquitetura.
  • Compreendendo e trabalhando com o Sistema de Controle do MapR, volumes do MapR, instantâneos e espelhamentos.
  • Planejamento de um cluster no contexto do MapR.
  • Comparação entre MapR e outras distribuições com Apache Hadoop.
  • Instalação e implantação do cluster do MapR.

Configuração e Administração de Cluster:

  • Gerenciando serviços, nós, instantâneos, volumes espelhados e clusters remotos.
  • Compreendendo e gerenciando os Nós.
  • Compreendendo componentes do Hadoop, instalando componentes do Hadoop ao lado dos serviços do MapR.
  • Armazenamento de dados no cluster incluindo via NFS Gerenciando serviços e nós.
  • Gerenciando dados usando volumes, gerenciando usuários e grupos, gerenciando e atribuindo funções aos nós, comissionamento e decomissão de nós, administração do cluster e monitoramento de desempenho, configurando/analisando e monitorando métricas para monitorar o desempenho, configurando e administrando segurança do MapR.
  • Compreendendo e trabalhando com M7 - armazenamento nativo para tabelas do MapR.
  • Configuração e otimização de desempenho do cluster.

Atualização do Cluster e integração com outras configurações:

  • Atualizando a versão do software do MapR e tipos de atualizações.
  • Configurando o cluster do MapR para acessar o cluster HDFS.
  • Configurando o cluster do MapR na Amazon Elastic MapReduce.

Todos os tópicos acima incluem demonstrações e sessões práticas para que os alunos tenham experiência prática com a tecnologia.

Requisitos

  • Conhecimento básico de Linux FS
  • Conhecimentos básicos de Java
  • Conhecimento de Apache Hadoop (recomendado)
 28 Horas

Declaração de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas