Cursos de Apache Airflow for Data Science: Automating Machine Learning Pipelines
Apache Airflow é uma plataforma de código aberto para orquestrar fluxos de trabalho e automatizar pipelines de dados complexos.
Este treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a participantes de nível intermediário que desejam automatizar e gerenciar fluxos de trabalho de aprendizado de máquina, incluindo treinamento de modelo, validação e implantação usando Apache Airflow.
No final deste treinamento, os participantes serão capazes de:
- Configurar Apache Airflow para orquestração de fluxo de trabalho de aprendizado de máquina.
- Automatizar tarefas de pré-processamento de dados, treinamento de modelos e validação.
- Integrar o Airflow com estruturas e ferramentas de aprendizado de máquina.
- Implantar modelos de aprendizado de máquina usando pipelines automatizados.
- Monitorar e otimizar fluxos de trabalho de aprendizado de máquina na produção.
Formato do curso
- Palestra interactiva e discussão.
- Muitos exercícios e prática.
- Implementação prática num ambiente de laboratório ao vivo.
Opções de personalização do curso
- Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.
Programa do Curso
Introdução a Apache Airflow para Machine Learning
- Visão geral de Apache Airflow e sua relevância para a ciência dos dados
- Principais caraterísticas para automatizar fluxos de trabalho de aprendizagem automática
- Configurar o Airflow para projectos de ciência de dados
Criação de pipelines Machine Learning com o Airflow
- Conceção de DAGs para fluxos de trabalho de aprendizagem automática de ponta a ponta
- Utilização de operadores para ingestão de dados, pré-processamento e engenharia de caraterísticas
- Agendamento e gestão de dependências de pipelines
Formação e validação de modelos
- Automatizar tarefas de formação de modelos com o Airflow
- Integração do Airflow com estruturas de ML (por exemplo, TensorFlow, PyTorch)
- Validação de modelos e armazenamento de métricas de avaliação
Implementação e monitorização de modelos
- Implantação de modelos de aprendizado de máquina usando pipelines automatizados
- Monitorização de modelos implementados com tarefas Airflow
- Tratamento de retreinamento e atualizações de modelos
Personalização e integração avançadas
- Desenvolvimento de operadores personalizados para tarefas específicas de ML
- Integrar o Airflow com plataformas de nuvem e serviços de ML
- Ampliação dos fluxos de trabalho do Airflow com plug-ins e sensores
Otimização e dimensionamento de pipelines de ML
- Melhorar o desempenho do fluxo de trabalho para dados em grande escala
- Dimensionar implantações do Airflow com Celery e Kubernetes
- Melhores práticas para fluxos de trabalho de ML de nível de produção
Estudos de caso e aplicações práticas
- Exemplos reais de automação de ML usando o Airflow
- Exercício prático: Construção de um pipeline de ML de ponta a ponta
- Discussão de desafios e soluções na gestão de fluxos de trabalho de ML
Resumo e próximos passos
Requisitos
- Familiaridade com conceitos e fluxos de trabalho de aprendizagem automática
- Conhecimentos básicos de Apache Airflow, incluindo DAGs e operadores
- Proficiência em programação Python
Público-alvo
- Cientistas de dados
- Engenheiros de aprendizagem automática
- Programadores de IA
Precisa de ajuda para escolher o curso certo?
Cursos de Apache Airflow for Data Science: Automating Machine Learning Pipelines - Enquiry
Próximas Formações Provisórias
Cursos Relacionados
AdaBoost Python for Machine Learning
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados e engenheiros de software que desejam usar AdaBoost para criar algoritmos de reforço para aprendizado de máquina com Python.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para começar a construir modelos de aprendizado de máquina com AdaBoost.
- Compreender a abordagem de aprendizagem de conjunto e como implementar o reforço adaptativo.
- Aprender a construir modelos AdaBoost para impulsionar algoritmos de aprendizado de máquina em Python.
- Utilizar a afinação de hiperparâmetros para aumentar a precisão e o desempenho dos modelos AdaBoost.
Anaconda Ecosystem for Data Scientists
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados que desejam usar o ecossistema Anaconda para capturar, gerenciar e implantar pacotes e fluxos de trabalho de análise de dados em uma única plataforma.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar componentes e bibliotecas Anaconda.
- Compreender os principais conceitos, recursos e benefícios do Anaconda.
- Gerenciar pacotes, ambientes e canais usando o Anaconda Navigator.
- Usar pacotes Conda, R e Python para ciência de dados e aprendizado de máquina.
- Conhecer alguns casos de uso práticos e técnicas para gerenciar vários ambientes de dados.
AutoML with Auto-Keras
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados, bem como a pessoas menos técnicas que desejam usar Auto-Keras para automatizar o processo de seleção e otimização de um modelo de aprendizado de máquina.
No final deste treinamento, os participantes serão capazes de:
- Automatizar o processo de treinamento de modelos de aprendizado de máquina altamente eficientes.
- Procurar automaticamente os melhores parâmetros para modelos de aprendizagem profunda.
- Crie modelos de aprendizado de máquina altamente precisos.
- Use o poder do aprendizado de máquina para resolver problemas de negócios do mundo real.
AutoML
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a pessoas técnicas com experiência em aprendizado de máquina que desejam otimizar os modelos de aprendizado de máquina usados para detetar padrões complexos em big data.
No final deste treinamento, os participantes serão capazes de:
- Instalar e avaliar várias ferramentas de código aberto AutoML (H2O AutoML, auto-sklearn, TPOT, TensorFlow, PyTorch, Auto-Keras, TPOT, Auto-WEKA, etc.)
- Treinar modelos de aprendizagem automática de alta qualidade.
- Resolver eficazmente diferentes tipos de problemas de aprendizagem automática supervisionada.
- Escrever apenas o código necessário para iniciar o processo de aprendizagem automática de máquinas.
Creating Custom Chatbots with Google AutoML
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a participantes com diferentes níveis de experiência que desejam aproveitar a plataforma Go ogle AutoML para criar chatbots personalizados para vários aplicativos.
No final deste treinamento, os participantes serão capazes de:
- Compreender os fundamentos do desenvolvimento do chatbot.
- Navegar na Google Cloud Platform e acessar AutoML.
- Prepare dados para treinar modelos de chatbot.
- Treinar e avaliar modelos de chatbot personalizados usando AutoML.
- Implementar e integrar chatbots em várias plataformas e canais.
- Monitorizar e otimizar o desempenho do chatbot ao longo do tempo.
DataRobot
7 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados e analistas de dados que desejam automatizar, avaliar e gerenciar modelos preditivos usando os recursos de aprendizado de máquina da DataRobot.
No final deste treinamento, os participantes serão capazes de:
- Carregar conjuntos de dados em DataRobot para analisar, avaliar e verificar a qualidade dos dados.
- Construir e treinar modelos para identificar variáveis importantes e atingir metas de previsão.
- Interpretar modelos para criar insights valiosos que são úteis na tomada de decisões de negócios.
- Monitorizar e gerir modelos para manter um desempenho de previsão optimizado.
Data Mining with Weka
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a analistas de dados de nível iniciante a intermediário e cientistas de dados que desejam usar Weka para executar tarefas de mineração de dados.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar Weka.
- Compreender o ambiente e o workbench do Weka.
- Executar tarefas de mineração de dados usando Weka.
Google Cloud AutoML
7 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados, analistas de dados e desenvolvedores que desejam explorar AutoML produtos e recursos para criar e implantar modelos de treinamento de ML personalizados com o mínimo de esforço.
No final deste treinamento, os participantes serão capazes de:
- Explorar a linha de produtos AutoML para implementar diferentes serviços para vários tipos de dados.
- Preparar e rotular conjuntos de dados para criar modelos ML personalizados.
- Treinar e gerenciar modelos para produzir modelos de aprendizado de máquina precisos e justos.
- Fazer previsões usando modelos treinados para atender aos objetivos e necessidades de negócios.
Kaggle
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam aprender e construir suas carreiras em Data Science usando Kaggle.
Ao final deste treinamento, os participantes serão capazes de:
- Aprender sobre ciência de dados e aprendizado de máquina.
- Explorar a análise de dados.
- Aprender sobre Kaggle e como ele funciona.
Machine Learning for Mobile Apps using Google’s ML Kit
14 HorasEste treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a desenvolvedores que desejam usar o Go ogle ML Kit para criar modelos de aprendizado de máquina otimizados para processamento em dispositivos móveis.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para começar a desenvolver recursos de aprendizado de máquina para aplicativos móveis.
- Integrar novas tecnologias de aprendizado de máquina em aplicativos Android e iOS usando as APIs ML Kit.
- Melhorar e otimizar as aplicações existentes utilizando o ML Kit SDK para processamento e implementação no dispositivo.
Accelerating Python Pandas Workflows with Modin
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas e desenvolvedores de dados que desejam usar Modin para criar e implementar cálculos paralelos com Pandas para uma análise de dados mais rápida.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente necessário para começar a desenvolver fluxos de trabalho Pandas em escala com Modin.
- Compreender os recursos, a arquitetura e as vantagens de Modin.
- Conhecer as diferenças entre Modin, Dask e Ray.
- Realizar operações Pandas mais rapidamente com Modin.
- Implementar toda a API Pandas e as funções.
Machine Learning with Random Forest
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados e engenheiros de software que desejam usar Random Forest para criar algoritmos de aprendizado de máquina para grandes conjuntos de dados.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para começar a construir modelos de aprendizado de máquina com Random forest.
- Compreender as vantagens de Random Forest e como implementá-lo para resolver problemas de classificação e regressão.
- Aprender a lidar com grandes conjuntos de dados e a interpretar múltiplas árvores de decisão em Random Forest.
- Avaliar e otimizar o desempenho do modelo de aprendizagem automática através da afinação dos hiperparâmetros.
Advanced Analytics with RapidMiner
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a analistas de dados de nível intermediário que desejam aprender como usar RapidMiner para estimar e projetar valores e utilizar ferramentas analíticas para previsão de séries temporais.
No final desta formação, os participantes serão capazes de:
- Aprender a aplicar a metodologia CRISP-DM, selecionar algoritmos de aprendizagem automática adequados e melhorar a construção e o desempenho do modelo.
- Utilizar RapidMiner para estimar e projetar valores, e utilizar ferramentas analíticas para a previsão de séries temporais.
RapidMiner for Machine Learning and Predictive Analytics
14 HorasRapidMiner é uma plataforma de software de ciência de dados de fonte aberta para prototipagem e desenvolvimento rápidos de aplicações. Ele inclui um ambiente integrado para preparação de dados, aprendizado de máquina, aprendizado profundo, mineração de texto e análise preditiva.
Neste treinamento ao vivo conduzido por instrutor, os participantes aprenderão como usar o RapidMiner Studio para preparação de dados, aprendizado de máquina e implantação de modelo preditivo.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar RapidMiner
- Preparar e visualizar dados com RapidMiner
- Validar modelos de aprendizado de máquina
- Mashup dados e criar modelos preditivos
- Operacionalizar a análise preditiva em um processo de negócios
- Resolver problemas e otimizar RapidMiner
Público-alvo
- Cientistas de dados
- Engenheiros
- Desenvolvedores
Formato do curso
- Parte palestra, parte discussão, exercícios e prática prática pesada
Nota
- Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.
GPU Data Science with NVIDIA RAPIDS
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam usar RAPIDS para construir pipelines de dados acelerados GPU, fluxos de trabalho e visualizações, aplicando algoritmos de aprendizado de máquina, como XGBoost, cuML, etc.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para construir modelos de dados com a NVIDIA RAPIDS.
- Compreender os recursos, componentes e vantagens de RAPIDS.
- Aproveite GPU para acelerar os pipelines de dados e análises de ponta a ponta.
- Implementar a preparação de dados acelerada por GPU e ETL com cuDF e Apache Arrow.
- Aprenda a executar tarefas de aprendizado de máquina com os algoritmos XGBoost e cuML.
- Crie visualizações de dados e execute análises de gráficos com cuXfilter e cuGraph.