Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução
- Introdução ao Computação em Nuvem e soluções de Big Data
- Visão geral das características e arquitetura do Apache Hadoop
Configurando o Hadoop
- Planejamento de um cluster Hadoop (on-premise, nuvem, etc.)
- Seleção do sistema operacional e distribuição do Hadoop
- Aprovisionando recursos (hardware, rede, etc.)
- Baixando e instalando o software
- Determinando o tamanho do cluster para flexibilidade
Trabalhando com HDFS
- Compreendendo o Hadoop Distributed File System (HDFS)
- Visão geral da referência de comandos do HDFS
- Acessando o HDFS
- Realizando operações básicas de arquivo no HDFS
- Usando o S3 como complemento ao HDFS
Visão geral do MapReduce
- Compreendendo o fluxo de dados no framework MapReduce
- Map, Shuffle, Sort e Reduce
- Demonstração: Cálculo dos maiores salários
Trabalhando com YARN
- Compreendendo o gerenciamento de recursos no Hadoop
- Trabalhando com ResourceManager, NodeManager e Application Master
- Agorendar tarefas sob o YARN
- Agorandamento para grandes números de nós e clusters
- Demonstração: Agendamento de tarefas
Integrando Hadoop com Spark
- Configurando armazenamento para o Spark (HDFS, Amazon S3, NoSQL, etc.)
- Compreendendo Resilient Distributed Datasets (RDDs)
- Criando um RDD
- Implementando transformações de RDD
- Demonstração: Implementando um programa de pesquisa de texto para títulos de filmes
Gerenciando um cluster Hadoop
- Monitorando o Hadoop
- Segurança do cluster Hadoop
- Adicionando e removendo nós
- Rodando um benchmark de desempenho
- Ajustando um cluster Hadoop para otimizar o desempenho
- Fazendo backup, recuperação e planejamento de continuidade do negócio
- Garantindo alta disponibilidade (HA)
Atualizando e migrando um cluster Hadoop
- Avaliando os requisitos de carga de trabalho
- Atualizando o Hadoop
- Movendo do on-premise para a nuvem e vice-versa
- Recuperando falhas
Solução de problemas
Resumo e conclusão
Requisitos
- Experiência com administração de sistemas
- Conhecimento da linha de comando do Linux
- Compreensão dos conceitos de big data
Público-alvo
- Administradores de sistemas
- DBAs
35 Horas
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida