Programa do Curso
Machine Learning Introdução
- Tipos de aprendizado de máquina – supervisionado vs não supervisionado
- Do aprendizado estatístico ao aprendizado de máquina
- O fluxo de trabalho da mineração de dados: compreensão do negócio, preparação dos dados, modelagem, implantação
- Escolhendo o algoritmo certo para a tarefa
- Sobreajuste e o trade-off entre viés e variância
Python e Visão Geral de Bibliotecas de ML
- Por que usar linguagens de programação para ML
- Escolhendo entre R e Python
- Breve introdução ao Python e Jupyter Notebooks
- Bibliotecas do Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testando e Avaliando Algoritmos de ML
- Generalização, sobreajuste e validação do modelo
- Estratégias de avaliação: holdout, cross-validation, bootstrapping
- Métricas para regressão: ME, MSE, RMSE, MAPE
- Métricas para classificação: acurácia, matriz de confusão, classes desbalanceadas
- Visualização do desempenho do modelo: curva de lucro, curva ROC, curva lift
- Seleção e busca em grade para ajuste do modelo
Preparação dos Dados
- Importação e armazenamento de dados no Python
- Análise exploratória e estatísticas descritivas
- Lidando com valores ausentes e outliers
- Padrão, normalização e transformação
- Codificação de dados qualitativos e manipulação de dados com pandas
Algoritmos de Classificação
- Classificação binária vs multiclasse
- Regressão logística e funções discriminantes
- Naïve Bayes, k-vizinhos mais próximos
- Árvores de decisão: CART, Random Forests, Bagging, Boosting, XGBoost
- Máquinas de vetores de suporte e kernels
- Técnicas de aprendizado em conjunto
Regressão e Previsão Numérica
- Mínimos quadrados e seleção de variáveis
- Métodos de regularização: L1, L2
- Regressão polinomial e modelos não lineares
- Árvores de regressão e splines
Neural Networks
- Introdução a redes neurais e aprendizado profundo
- Funções de ativação, camadas e retropropagação
- Multilayer perceptrons (MLP)
- Usando TensorFlow ou PyTorch para modelagem básica de redes neurais
- Redes neurais para classificação e regressão
Vendas Forecasting e Predictive Analytics
- Séries temporais vs previsão baseada em regressão
- Lidando com dados sazonais e tendenciais
- Criando um modelo de previsão de vendas usando técnicas de ML
- Avaliando a precisão e incerteza das previsões
- Business interpretação e comunicação dos resultados
Unsupervised Learning
- Técnicas de agrupamento: k-means, k-medoids, clusterização hierárquica, SOMs
- Redução de dimensionalidade: PCA, análise fatorial, SVD
- Escala multidimensional
Mining de Texto
- Pré-processamento e tokenização de texto
- Bolsa de palavras, stemming e lematização
- Análise de sentimento e frequência de palavras
- Visualizando dados de texto com nuvens de palavras
Sistemas de Recomendação
- Filtragem colaborativa baseada em usuários vs itens
- Deseñando e avaliando motores de recomendação
Mineração de Padrões Associativos
- Conjuntos frequentes e algoritmo Apriori
- Análise do cesto de compras e razão lift
Deteção de Outliers
- Análise de valores extremos
- Métodos baseados em distância e densidade
- Deteção de outliers em dados multidimensionais
Machine Learning Estudo de Caso
- Compreendendo o problema do negócio
- Pré-processamento dos dados e engenharia de características
- Seleção do modelo e ajuste de parâmetros
- Avaliação e apresentação das descobertas
- Implantação
Resumo e Próximos Passos
Requisitos
- Noções básicas de conceitos de aprendizado de máquina, como aprendizagem supervisionada e não supervisionada
- Familiaridade com programação em Python (variáveis, loops, funções)
- Alguma experiência com manipulação de dados usando bibliotecas como pandas ou NumPy é útil, mas não obrigatória
- Não se espera experiência prévia com modelagem avançada ou redes neurais
Público-alvo
- Cientistas de dados
- Analistas Business
- Engenheiros de software e profissionais técnicos que trabalham com dados
Declaração de Clientes (2)
o ecossistema de ML não se limita ao MLFlow, mas também inclui o Optuna, hyperopt, Docker e docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curso - MLflow
Máquina Traduzida
Aproveitei a participação no treinamento Kubeflow, que foi realizado remotamente. Esse treinamento me permitiu consolidar meu conhecimento sobre serviços AWS, K8s e todas as ferramentas DevOps relacionadas ao Kubeflow, que são as bases necessárias para abordar o assunto de forma adequada. Gostaria de agradecer Malawski Marcin por sua paciência e profissionalismo no treinamento e nas dicas sobre práticas recomendadas. Malawski aborda o tema sob diferentes ângulos, com diferentes ferramentas de implantação Ansible, EKS kubectl, Terraform. Agora estou definitivamente convencido de que estou entrando na área correta de aplicação.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curso - Kubeflow
Máquina Traduzida