Programa do Curso
Introdução a Hortonworks Data Platform (HDP)
Visão geral de Big Data e Apache Hadoop
Instalação e configuração do HDP
Configurar, implementar e gerir o Hadoop Cluster
Entendendo e configurandoYARN e MapReduce
Visão geral do agendamento de tarefas
Garantir a integridade dos dados
Entendendo a movimentação de dados corporativos
Utilizar comandos e serviços HDFS
Transferência de dados usando Flume
Trabalhando com Hive
Agendamento de fluxo de trabalho usando Oozie
Explorando Hadoop 2.x
Entendendo a arquitetura do Hbase
Monitorando os serviços do HDP2 usando o Ambari
Novos recursos do HDP
Solução de problemas
Resumo e próximos passos
Requisitos
- Conhecimento de Hadoop e de grandes volumes de dados
- Conhecimento do Spark
- Familiaridade com a linha de comando
- Experiência em administração de sistemas
Público
- Administradores de Hadoop
Declaração de Clientes (5)
Muitos exemplos práticos, diferentes formas de abordar o mesmo problema e, por vezes, truques não tão óbvios para melhorar a solução atual
Rafal - Nordea
Curso - Apache Spark MLlib
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida