Curso de Hadoop e Spark para Administradores

O Apache Hadoop é um framework de processamento de dados popular para processar grandes conjuntos de dados em vários computadores.

Este treinamento liderado por instrutor (online ou presencial) é direcionado a administradores de sistemas que desejam aprender como configurar, implantar e gerenciar clusters Hadoop dentro de sua organização.

Ao final deste treinamento, os participantes serão capazes de:

Instalar e configurar o Apache Hadoop.
Compreender as quatro principais componentes do ecossistema Hadoop: HDFS, MapReduce, YARN e Hadoop Common.
Usar o Hadoop Distributed File System (HDFS) para escalar um cluster para centenas ou milhares de nós.
Configurar o HDFS para operar como mecanismo de armazenamento para implantações de Spark on-premise.
Configurar o Spark para acessar soluções de armazenamento alternativas, como Amazon S3 e sistemas de banco de dados NoSQL, como Redis, Elasticsearch, Couchbase, Aerospike, etc.
Realizar tarefas administrativas, como provisionamento, gerenciamento, monitoramento e segurança de um cluster Apache Hadoop.

Formato do Curso

Aula interativa e discussão.
Muitos exercícios e prática.
Implementação prática em um ambiente de laboratório ao vivo.

Opções de Personalização do Curso

Para solicitar um treinamento personalizado para este curso, entre em contato conosco para agendar.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Introdução

Introdução ao Computação em Nuvem e soluções de Big Data
Visão geral das características e arquitetura do Apache Hadoop

Configurando o Hadoop

Planejamento de um cluster Hadoop (on-premise, nuvem, etc.)
Seleção do sistema operacional e distribuição do Hadoop
Aprovisionando recursos (hardware, rede, etc.)
Baixando e instalando o software
Determinando o tamanho do cluster para flexibilidade

Trabalhando com HDFS

Compreendendo o Hadoop Distributed File System (HDFS)
Visão geral da referência de comandos do HDFS
Acessando o HDFS
Realizando operações básicas de arquivo no HDFS
Usando o S3 como complemento ao HDFS

Visão geral do MapReduce

Compreendendo o fluxo de dados no framework MapReduce
Map, Shuffle, Sort e Reduce
Demonstração: Cálculo dos maiores salários

Trabalhando com YARN

Compreendendo o gerenciamento de recursos no Hadoop
Trabalhando com ResourceManager, NodeManager e Application Master
Agorendar tarefas sob o YARN
Agorandamento para grandes números de nós e clusters
Demonstração: Agendamento de tarefas

Integrando Hadoop com Spark

Configurando armazenamento para o Spark (HDFS, Amazon S3, NoSQL, etc.)
Compreendendo Resilient Distributed Datasets (RDDs)
Criando um RDD
Implementando transformações de RDD
Demonstração: Implementando um programa de pesquisa de texto para títulos de filmes

Gerenciando um cluster Hadoop

Monitorando o Hadoop
Segurança do cluster Hadoop
Adicionando e removendo nós
Rodando um benchmark de desempenho
Ajustando um cluster Hadoop para otimizar o desempenho
Fazendo backup, recuperação e planejamento de continuidade do negócio
Garantindo alta disponibilidade (HA)

Atualizando e migrando um cluster Hadoop

Avaliando os requisitos de carga de trabalho
Atualizando o Hadoop
Movendo do on-premise para a nuvem e vice-versa
Recuperando falhas

Solução de problemas

Resumo e conclusão

Requisitos

Experiência com administração de sistemas
Conhecimento da linha de comando do Linux
Compreensão dos conceitos de big data

Público-alvo

Administradores de sistemas
DBAs

35 Horas

Treinamento Corporativo Personalizado

Soluções de treinamento projetadas exclusivamente para empresas.

Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.

Investimento

Preço por grupo privado, treinamento online ao vivo, a partir de 6500 € + VAT*

Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes

(*O preço final pode variar dependendo da especialização técnica do curso, do nível de personalização, do método de entrega e do número de participantes)

Precisa de ajuda para escolher o curso certo?

Testemunhos de Clientes (3)

Gostei do fato de ser prático. Adorei aplicar o conhecimento teórico com exemplos práticos.

Aurelia-Adriana - Allianz Services Romania

Curso - Python and Spark for Big Data (PySpark)

Máquina Traduzida

O fato de podermos levar conosco a maior parte das informações/cursos/apresentações/exercícios realizados, para que possamos revisá-los e talvez refazê-los se não entendermos na primeira vez ou melhorar o que já fizemos.

Curso de Hadoop e Spark para Administradores

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Testemunhos de Clientes (3)

Aurelia-Adriana - Allianz Services Romania

Curso - Python and Spark for Big Data (PySpark)

Raul Mihail Rat - Accenture Industrial SS

Curso - Python, Spark, and Hadoop for Big Data

Richard Langford

Curso - SMACK Stack for Data Science

Próximas Formações Provisórias

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de Hadoop e Spark para Administradores

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Testemunhos de Clientes (3)

Aurelia-Adriana - Allianz Services Romania

Curso - Python and Spark for Big Data (PySpark)

Raul Mihail Rat - Accenture Industrial SS

Curso - Python, Spark, and Hadoop for Big Data

Richard Langford

Curso - SMACK Stack for Data Science

Próximas Formações Provisórias

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Hadoop e Spark para Administradores

Cursos Relacionados

Treinamento de Administrador para Apache Hadoop

Público-alvo:

Pré-requisitos:

Análise de Grandes Dados com Google Colab e Apache Spark

Análise de Big Data na Saúde

Uma Introdução Prática ao Processamento de Streams

PySpark e Machine Learning

SMACK Stack para Ciência de Dados

Fundamentos do Apache Spark

Administração do Apache Spark

Apache Spark na Nuvem

Spark para Desenvolvedores

OBJETIVO:

PÚBLICO ALVO :

Escalar Pipelines de Dados com o Spark NLP

Python e Spark para Big Data (PySpark)

Python, Spark e Hadoop para Big Data

Apache Spark SQL

Stratio: Módulos Rocket e Intelligence com PySpark

Categorias Relacionadas

Hadoop

Apache Spark

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites