Programa do Curso
Introdução
- Introdução ao Computação em Nuvem e soluções de Big Data
- Visão geral das características e arquitetura do Apache Hadoop
Configurando o Hadoop
- Planejamento de um cluster Hadoop (on-premise, nuvem, etc.)
- Seleção do sistema operacional e distribuição do Hadoop
- Aprovisionando recursos (hardware, rede, etc.)
- Baixando e instalando o software
- Determinando o tamanho do cluster para flexibilidade
Trabalhando com HDFS
- Compreendendo o Hadoop Distributed File System (HDFS)
- Visão geral da referência de comandos do HDFS
- Acessando o HDFS
- Realizando operações básicas de arquivo no HDFS
- Usando o S3 como complemento ao HDFS
Visão geral do MapReduce
- Compreendendo o fluxo de dados no framework MapReduce
- Map, Shuffle, Sort e Reduce
- Demonstração: Cálculo dos maiores salários
Trabalhando com YARN
- Compreendendo o gerenciamento de recursos no Hadoop
- Trabalhando com ResourceManager, NodeManager e Application Master
- Agorendar tarefas sob o YARN
- Agorandamento para grandes números de nós e clusters
- Demonstração: Agendamento de tarefas
Integrando Hadoop com Spark
- Configurando armazenamento para o Spark (HDFS, Amazon S3, NoSQL, etc.)
- Compreendendo Resilient Distributed Datasets (RDDs)
- Criando um RDD
- Implementando transformações de RDD
- Demonstração: Implementando um programa de pesquisa de texto para títulos de filmes
Gerenciando um cluster Hadoop
- Monitorando o Hadoop
- Segurança do cluster Hadoop
- Adicionando e removendo nós
- Rodando um benchmark de desempenho
- Ajustando um cluster Hadoop para otimizar o desempenho
- Fazendo backup, recuperação e planejamento de continuidade do negócio
- Garantindo alta disponibilidade (HA)
Atualizando e migrando um cluster Hadoop
- Avaliando os requisitos de carga de trabalho
- Atualizando o Hadoop
- Movendo do on-premise para a nuvem e vice-versa
- Recuperando falhas
Solução de problemas
Resumo e conclusão
Requisitos
- Experiência com administração de sistemas
- Conhecimento da linha de comando do Linux
- Compreensão dos conceitos de big data
Público-alvo
- Administradores de sistemas
- DBAs
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é conhecido
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
aspectos práticos de fazer, além disso a teoria foi bem apresentada por Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Máquina Traduzida