Cursos de Dataprep Fundamentals
O Dataprep é um serviço de dados inteligente que facilita a exploração visual, a limpeza e a organização de dados estruturados e não estruturados, preparando-os para análise, elaboração de relatórios e utilização em aplicações de aprendizagem automática.
Esta formação ao vivo orientada por um instrutor (no local ou remoto) destina-se a profissionais de TI de nível iniciante a intermédio que pretendam adquirir os conhecimentos e as competências práticas necessárias para preparar eficazmente os dados para análise, garantindo precisão, consistência e fiabilidade em diversos conjuntos de dados.
No final desta formação, os participantes serão capazes de
- Adquirir um conhecimento profundo da importância da preparação de dados para garantir dados fiáveis e de alta qualidade para fins de análise e modelação.
- Adquirir proficiência prática em técnicas de recolha, limpeza, transformação e integração de dados utilizando conjuntos de dados do mundo real.
- Desenvolver a capacidade de identificar e resolver eficazmente os desafios, discrepâncias e inconsistências relacionados com os dados.
Formato do curso
- Aula e debate interactivos.
- Muitos exercícios e práticas.
- Implementação prática num ambiente de laboratório ao vivo.
Opções de personalização do curso
- Para solicitar uma formação personalizada para este curso, contacte-nos para combinar.
Programa do Curso
Introdução
- Compreender a importância da preparação de dados na análise e na aprendizagem automática
- Pipeline de preparação de dados e o seu papel no ciclo de vida dos dados
- Explorar os desafios comuns nos dados em bruto e o impacto na análise
Recolha e aquisição de dados
- Fontes de dados: bases de dados, APIs, folhas de cálculo, ficheiros de texto, etc.
- Técnicas de recolha de dados e garantia da qualidade dos dados durante a recolha
- Recolha de dados de várias fontes
Data Cleaning Técnicas
- Identificar e tratar os valores em falta, os valores anómalos e as inconsistências
- Lidar com duplicados e erros no conjunto de dados
- Limpar conjuntos de dados do mundo real
Transformação e normalização de dados
- Técnicas de normalização e padronização de dados
- Tratamento de dados categóricos: codificação, binning e engenharia de características
- Transformação de dados em bruto em formatos utilizáveis
Data Integration e Agregação
- Fusão e combinação de conjuntos de dados de diferentes fontes
- Resolução de conflitos de dados e alinhamento de tipos de dados
- Técnicas de agregação e consolidação de dados
Data Quality Assurance
- Métodos para garantir a qualidade e a integridade dos dados ao longo de todo o processo
- Implementação de controlos de qualidade e procedimentos de validação
- Estudos de casos e aplicações práticas da garantia da qualidade dos dados
Redução da dimensionalidade e seleção de características
- Compreender a necessidade de redução da dimensionalidade
- Técnicas como PCA, seleção de características e estratégias de redução
- Implementar técnicas de redução da dimensionalidade
Resumo e próximas etapas
Requisitos
-
Conhecimento básico dos conceitos de dados
Público
-
Analistas de dados
[Administradores
profissionais de TI
Precisa de ajuda para escolher o curso certo?
Cursos de Dataprep Fundamentals - Enquiry
Dataprep Fundamentals - Solicitação de Consultoria
Solicitação de Consultoria
Declaração de Clientes (2)
É uma sessão prática.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Curso - Talend Open Studio for ESB
Máquina Traduzida
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Curso - GDPR Workshop
Máquina Traduzida
Próximas Formações Provisórias
Cursos Relacionados
NetApp DATAPROT9 – ONTAP Data Protection Administration
21 HorasEste treinamento ao vivo, ministrado por um instrutor em Portugal (online ou presencial), é direcionado a profissionais de TI intermediários que desejam configurar e gerenciar mecanismos de proteção de dados usando tecnologias NetApp ONTAP.
No final deste treinamento, os participantes serão capazes de:
- Compreender a arquitetura e conceitos de proteção de dados do ONTAP.
- Configurar e gerenciar cópias de Snapshot para recuperação rápida de dados.
- Implementar e monitorar o SnapMirror para replicação de dados.
- Utilizar o SnapVault e outras funcionalidades do ONTAP para estratégias de backup e arquivamento.
EBX5 for Developers
21 HorasEste treinamento ao vivo, conduzido por instrutor em Portugal (online ou no local) é destinado a desenvolvedores que desejam usar o EBX5 (TIBCO EBX) para habilitar uma solução de gerenciamento de dados mestre em sua organização.
No final desta formação, os participantes serão capazes de
- Interpretar os requisitos e arquitetar uma solução MDM.
- Permitir a gestão e integração de dados mestre.
- Integrar e transferir dados entre vários sistemas.
- Importar dados para o EBX5 utilizando a lógica de correspondência e fusão.
- Desenhe, crie e documente um modelo de dados que atenda aos requisitos de negócios de sua organização' .
- Integrar o EBX5 com serviços de terceiros.
GDPR Workshop
7 HorasEste curso é para pessoas que procuram um breve resumo do GDPR - General Data Protection Regulations, publicado em 25 de maio de 2018 Isso é ideal para gerentes, chefes de departamento e funcionários que precisam entender os fundamentos do GDPR .
How to Audit GDPR Compliance
14 HorasEste curso é desenvolvido principalmente com foco em auditores e outros papéis administrativos que são obrigação de assegurar o cumprimento dos seus sistemas de controlo e do seu ambiente informático com as leis prevalentes e Regulações. O curso começará dando compreensão dos conceitos chave GDPR bem como como como é que afeta o trabalho realizado pelos auditores. Os participantes também irão explorar os dados subjetivos direitos, controladores de dados e processadores obligações, e noções de execução e de conformidade no contexto do regulamento. A formação também cobrirá o programa de auditoria fornecido pela ISACA que permitir que os auditores revisem GDPR os mecanismos de governação e de resposta, bem como Processos que podem ajudar a gerenciar o risco associado ao incumprimento.
GDPR Advanced
21 HorasIsto é mais profundo e seria para aqueles que trabalham muito com o GDPR e que podem ser nomeados para a equipe do GDPR Isso seria ideal para funcionários de TI, recursos humanos e marketing e eles lidarão extensivamente com o GDPR .
NetApp ONTAP9ADM – ONTAP Cluster Administration
21 HorasEste treinamento ao vivo, ministrado por um instrutor em Portugal (online ou presencial), destina-se a profissionais de TI intermediários que desejam configurar, gerenciar e solucionar problemas de clusters NetApp ONTAP.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar clusters NetApp ONTAP.
- Gerenciar recursos de armazenamento e configurações de rede.
- Implementar políticas de segurança e controle de acesso.
- Monitorar e solucionar problemas em ambientes de cluster ONTAP.
Oracle GoldenGate
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (online ou no local) é destinado a administradores de sistemas e desenvolvedores que desejam configurar, implantar e gerenciar Oracle GoldenGate para transformação de dados.
No final desta formação, os participantes serão capazes de
- Instalar e configurar o Oracle GoldenGate.
- Compreender a replicação de bancos de dados Oracle usando a ferramenta Oracle GoldenGate.
- Compreender a arquitetura do Oracle GoldenGate.
- Configurar e executar uma replicação e migração de banco de dados.
- Otimizar o desempenho do Oracle GoldenGate e solucionar problemas.
Personal Data Protection Officer - Basic Level
21 HorasObjetivo da formação
- Familiarizar o público com questões sistematizadas e abrangentes do funcionamento da proteção de dados pessoais com base na legislação polaca e europeia
- Fornecer conhecimentos práticos sobre as novas regras para o tratamento de dados pessoais
- Apresentação das áreas de maior risco jurídico em relação à entrada em vigor da Diretiva GDPR
- Preparação prática para o desempenho autónomo das funções de um responsável pela proteção de dados Data Protection pessoais
Personal Data Protection Officer - Advanced Level
14 HorasObjetivo da formação
- Adquirir conhecimentos práticos sobre o desempenho das funções de inspetor
- Adquirir conhecimentos práticos sobre a forma de efetuar auditorias e de avaliar os riscos
- Fornecer conhecimentos práticos sobre as novas regras para o tratamento de dados pessoais
Algorítmo Sensor Fusion
14 HorasSensor Fusion é a combinação e integração de dados de múltiplos sensores para proporcionar uma visão mais precisa, fiável e contextual dos dados.
As implementações Sensor Fusion requerem algoritmos para filtrar e integrar diferentes fontes de dados.
Público
Este curso destina-se a engenheiros, programadores e arquitectos que lidam com implementações multi-sensor.
Talend Administration Center (TAC)
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a administradores de sistemas, cientistas de dados e analistas de negócios que desejam configurar o Talend Centro de Administração para implantar e gerenciar as funções e tarefas da organização'.
No final desta formação, os participantes serão capazes de
- Instalar e configurar o Talend Centro de administração.
- Compreender e implementar os fundamentos de gerenciamento do Talend.
- Criar, implantar e executar projetos ou tarefas de negócios em Talend.
- Monitorar a segurança de conjuntos de dados e desenvolver rotinas de negócios com base na estrutura do TAC.
- Obter uma compreensão mais ampla das aplicações de big data.
Talend Big Data Integration
28 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (online ou no local) é destinado a pessoas técnicas que desejam implantar o Talend Open Studio for Big Data para simplificar o processo de leitura e análise de Big Data.
No final desta formação, os participantes serão capazes de
- Instalar e configurar o Talend Open Studio para Big Data.
- Conectar-se com sistemas de Big Data, como Cloudera, HortonWorks, MapR, Amazon EMR e Apache.
- Compreender e configurar os componentes e conectores de big data do Open Studio's.
- Configurar parâmetros para gerar automaticamente o código MapReduce.
- Utilizar a interface de arrastar e soltar do Open Studio' para executar trabalhos do Hadoop.
- Prototipar pipelines de big data.
- Automatize projetos de integração de big data.
Talend Cloud
7 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (online ou no local) é destinado a administradores de dados e desenvolvedores que desejam gerenciar, monitorar e operar processos de integração de dados usando serviços Talend Cloud.
No final desta formação, os participantes serão capazes de
- Navegar na consola de gestão Talend para gerir utilizadores e funções na plataforma.
- Avaliar dados para encontrar e entender conjuntos de dados relevantes.
- Criar um pipeline para processar e monitorar dados em repouso ou em ação.
- Preparar dados para análise para gerar insights relevantes para o negócio.
Talend Data Stewardship
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a analistas de dados de nível iniciante a intermediário que desejam aprofundar seus conhecimentos e habilidades na gestão e melhoria da qualidade dos dados usando Talend Data Stewardship.
No final desta formação, os participantes serão capazes de
-
Obter uma compreensão abrangente do papel da gestão de dados na manutenção da qualidade dos dados.
Utilizar Talend Data Stewardship para gerir tarefas de qualidade dos dados.
Criar, atribuir e gerir tarefas no Talend Data Stewardship, incluindo a personalização do fluxo de trabalho.
Utilize as capacidades de relatório e monitorização da ferramenta para acompanhar a qualidade dos dados e os esforços de gestão.
Talend Open Studio for ESB
21 HorasNeste treinamento ao vivo conduzido por instrutor em Portugal, os participantes aprenderão como usar Talend Open Studio for ESB para criar, conectar, mediar e gerenciar serviços e suas interações.
No final desta formação, os participantes serão capazes de
- Integrar, aprimorar e fornecer tecnologias ESB como pacotes únicos em uma variedade de ambientes de implantação.
- Compreender e utilizar Talend os componentes mais usados do Open Studio' .
- Integre qualquer aplicativo, banco de dados, API ou serviços da Web.
- Integração perfeita de sistemas e aplicativos heterogêneos.
- Embutir bibliotecas de código Java existentes para estender projetos.
- Utilizar componentes e códigos da comunidade para estender projetos.
- Integre rapidamente sistemas, aplicativos e fontes de dados em um ambiente Eclipse de arrastar e soltar.
- Reduzir o tempo de desenvolvimento e os custos de manutenção, gerando código otimizado e reutilizável.