Programa do Curso

spark.mllib: tipos de dados, algoritmos e utilitários

    Tipos de dados Estatísticas básicas, resumo de estatísticas, correlações, amostragem estratificada, teste de hipótese, streaming, teste de significância, geração aleatória de dados
Modelos lineares de classificação e regressão (SVMs, regressão logística, regressão linear)
  • Baías ingénuas
  • Árvores de decisão
  • conjuntos de árvores (Random Forests e árvores com gradiente aumentado)
  • regressão isotônica
  • Filtragem colaborativa com mínimos quadrados alternados (ALS)
  • Agrupando k-médias
  • Mistura gaussiana
  • cluster de iteração de energia (PIC)
  • alocação latente de Dirichlet (LDA)
  • dividindo k-médias
  • streaming k-meios
  • Decomposição de valor singular de redução de dimensionalidade (SVD)
  • análise de componentes principais (PCA)
  • Extração e transformação de recursos
  • Crescimento FP de mineração de padrões frequente
  • regras de associação
  • PrefixSpan
  • Métricas de avaliação
  • Exportação de modelo PMML
  • Otimização (desenvolvedor) descida gradiente estocástica
  • BFGS de memória limitada (L-BFGS)
  • spark.ml: APIs de alto nível para pipelines de ML
  • Visão geral: estimadores, transformadores e pipelines Extração, transformação e seleção de recursos Classificação e regressão Clustering Tópicos avançados

    Requisitos

    Conhecimentos de um dos seguintes domínios:

    • Java
    • Scala
    • Python
    • SparkR
      35 horas

    Declaração de Clientes (8)

    Cursos Relacionados

    Categorias Relacionadas