Programa do Curso
Introdução ao Apache Spark
- O papel do Spark no processamento de grandes volumes de dados
- A arquitetura do Spark e os seus componentes
Configuração Apache Spark
- Requisitos de hardware e software
- Procedimentos de instalação para os modos autónomo e de cluster
- Melhores práticas de configuração para administradores de sistemas
Administração de clusters do Spark
- Ferramentas e técnicas de gerenciamento de cluster
- Monitorização de aplicações Spark e recursos de cluster
- Configurações de segurança e gestão de utilizadores
Ajuste e otimização de desempenho
- Alocação e agendamento de recursos
- Ajustar o Spark para obter o melhor desempenho
- Identificação e resolução de gargalos comuns
Solução de problemas e resolução de problemas
- Desafios comuns de administração do Spark
- Ferramentas e técnicas de diagnóstico para a resolução de problemas
- Abordagem passo-a-passo para resolver problemas comuns
- Práticas recomendadas para manter um ambiente Spark saudável
Tópicos de administração avançada
- Integração com outras ferramentas de Big Data
- Garantia de alta disponibilidade e recuperação de desastres
- Atualização e escalonamento de clusters do Spark
Resumo e próximos passos
Requisitos
- Conhecimentos básicos de configuração e gestão de redes
- Familiaridade com o sistema operativo Linux e a interface de linha de comandos
- Interesse em aprender sobre sistemas de computação distribuída e gestão de grandes volumes de dados
Público-alvo
- Administradores de sistemas
Declaração de Clientes (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Muitos exemplos práticos, diferentes formas de abordar o mesmo problema e, por vezes, truques não tão óbvios para melhorar a solução atual
Rafał - Nordea
Curso - Apache Spark MLlib
Machine Translated
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Curso - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Curso - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Curso - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Curso - Apache Spark in the Cloud
very interactive...
Richard Langford
Curso - SMACK Stack for Data Science
Empenho e disponibilidade para esclarecer temas laterais.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Curso - Apache Spark Fundamentals
Machine Translated