
Big Data é um termo que se refere a soluções destinadas a armazenar e processar grandes conjuntos de dados. Desenvolvido inicialmente pelo Google, essas soluções Big Data evoluíram e inspiraram outros projetos similares, muitos dos quais estão disponíveis como opensource. Alguns exemplos incluem Apache Hadoop, Cassandra e Cloudera Impala. De acordo com os relatórios da Gartner, BigData é o próximo grande passo no TI logo após a Cloud Computing e será uma tendência líder nos próximos anos. Nossos curso de BigData começam com uma introdução aos conceitos elementares de Big Data, em seguida, progridem nas linguagens de programação e metodologias utilizadas para realizar análise de dados. As ferramentas e a infra-estrutura para permitir armazenamento de grandes dimensões, processamento distribuído e escalabilidade são discutidas, comparadas e implementadas em sessões de demonstração. O treinamento BigData está disponível em vários formatos, incluindo treinamento ao vivo no local e treinamento online ao vivo e interativo. O treinamento local BigData pode ser realizado nas instalações do cliente no Portugal ou nos centros de treinamento locais NobleProg no Portugal. O treinamento ao vivo remoto é realizado por meio de uma área de trabalho remota e interativa.
NobleProg -- Seu Provedor de Treinamento Local
Programa de curso Big Data
-
Crie o ambiente necessário para iniciar o processamento de grandes dados com o Spark, Hadoop, e Python.
Compreenda as características, os componentes essenciais e a arquitetura do Spark e Hadoop.
Aprenda a integrar Spark, Hadoop, e Python para o processamento de dados grandes.
Explore as ferramentas no ecossistema Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, e Flume).
Construa sistemas de recomendação de filtragem colaborativa semelhantes a Netflix, YouTube, Amazon, Spotify e Google.
Use o Apache Mahout para escalar algoritmos de aprendizagem de máquina.
-
Interação e discussão interativa.
Muitos exercícios e práticas.
Implementação de mão em um ambiente de laboratório ao vivo.
-
Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.
-
Instalar e configurar Weka
Compreender o ambiente Weka e o banco de trabalho.
Realizar tarefas de mineração de dados usando Weka.
-
Interação e discussão interativa.
Muitos exercícios e práticas.
Implementação de mão em um ambiente de laboratório ao vivo.
-
Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.
-
Conheça os fundamentos da mineração de dados.
Saiba como importar e avaliar a qualidade dos dados com o Modeler.
Desenvolver, implementar e avaliar modelos de dados de forma eficiente.
-
Interação e discussão interativa.
Muitos exercícios e práticas.
Implementação de mão em um ambiente de laboratório ao vivo.
-
Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.
-
Lição parcial, discussão parcial, prática e implementação, quizing ocasional para medir o progresso.
- Learn how to use Spark with Python to analyze Big Data.
- Work on exercises that mimic real world cases.
- Use different tools and techniques for big data analysis using PySpark.
-
Analistas de dados ou qualquer pessoa interessada em aprender como interpretar dados para resolver problemas
-
Após uma discussão teórica do KDD, o instrutor apresentará casos de vida real que exigem a aplicação do KDD para resolver um problema. Os participantes prepararão, selecionarão e limparão conjuntos de dados de amostra e usarão seus conhecimentos prévios sobre os dados para propor soluções com base nos resultados das suas observações.
-
Consumo de dados de streaming em tempo real usando Kylin
Utilize Apache Kylin's poderosas características, enriquecido SQL interface, cobertura de spark e latência de consulta subsequente
-
Usamos a versão mais recente de Kylin (segundo esta escrita, Apache Kylin v2.0)
-
Engenheiros de Big Data
Big Data Os analistas
-
Parte de palestras, parte de discussão, exercícios e prática pesada
- Explore dados com o Excel para realizar a mineração e análise de dados.
- Use algoritmos da Microsoft para mineração de dados.
- Entenda os conceitos na mineração de dados do Excel .
- Palestra e discussão interativa.
- Muitos exercícios e prática.
- Implementação prática em um ambiente de laboratório ao vivo.
- Para solicitar um treinamento personalizado para este curso, entre em contato conosco para agendar.
-
Instalar e configurar Dremio
Executar consultas contra várias fontes de dados, independentemente da localização, tamanho ou estrutura
Integra Dremio com BI e fontes de dados como Tableau e Elasticsearch
-
Cientistas de Dados
Business Os analistas
Engenheiros de dados
-
Parte de palestras, parte de discussão, exercícios e prática pesada
-
Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.
- Install and configure Apache Arrow in a distributed clustered environment
- Use Apache Arrow to access data from disparate data sources
- Use Apache Arrow to bypass the need for constructing and maintaining complex ETL pipelines
- Analyze data across disparate data sources without having to consolidate it into a centralized repository
- Data scientists
- Data engineers
- Part lecture, part discussion, exercises and heavy hands-on practice
- To request a customized training for this course, please contact us to arrange.
- Mobile devices and applications
- Cloud services
- Social business technologies and networking
- Big Data and analytics
- Combine a tecnologia Big Data com os processos tradicionais de coleta de dados para reunir uma história durante uma investigação
- Implementar soluções industriais de armazenamento e processamento de big data para análise de dados
- Preparar uma proposta para a adoção das ferramentas e processos mais adequados para permitir uma abordagem baseada em dados à investigação criminal
- Especialistas em aplicação da lei com formação técnica
- Parte palestra, parte discussão, exercícios e prática prática pesada
- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.
- Ingestão de big data com Sqoop e Flume.
- Ingestão de dados de múltiplas fontes de dados.
- Mova dados de bancos de dados relacionais para HDFS e Hive.
- Exportar dados do HDFS para um banco de dados relacional.
- Palestra interativa e discussão.
- Muitos exercícios e prática.
- Implementação prática em um ambiente de laboratório ao vivo.
- Para solicitar um treinamento personalizado para este curso, entre em contato conosco para organizar.
-
Instale e configure Talend Open Studio para Big Data.
Conecte-se com sistemas Big Data como Cloudera, HortonWorks, MapR, Amazon EMR e Apache.
Entender e configurar os grandes componentes de dados e conectores do Open Studio.
Configure parâmetros para gerar automaticamente o código MapReduce.
Use a interface do Open Studio's drag-and-drop para executar trabalhos.
Protótipos de grandes tubos de dados.
Projetos de integração automática de big data.
-
Interação e discussão interativa.
Muitos exercícios e práticas.
Implementação de mão em um ambiente de laboratório ao vivo.
-
Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.
Last Updated: