Programa do Curso

Esboço detalhado do treinamento

    Introdução à PNL Compreendendo PNL Frameworks de PNL Aplicações comerciais de PNL Extração de dados da web Trabalhando com várias APIs para recuperar dados de texto Trabalhando e armazenando corpora de texto salvando conteúdo e metadados relevantes Vantagens de usar curso intensivo de Python e NLTK Compreensão prática de um corpus e conjunto de dados Por que precisamos de um corpus? Análise de Corpus Tipos de atributos de dados Diferentes formatos de arquivo para corpora Preparando um conjunto de dados para aplicações de PNL Compreendendo a estrutura de uma frase Componentes da PNL Compreensão de linguagem natural Análise morfológica - radical, palavra, token, tags de fala Análise sintática Análise semântica Tratamento de ambiguidade Pré-processamento de dados de texto Corpus - texto bruto Tokenização de sentenças Stemming para texto bruto Lemização de texto bruto Remoção de palavras de interrupção Frases brutas de Corpus Word tokenização Word lematização Trabalhando com matrizes Termo-Documento/Documento-Termo Tokenização de texto em n-gramas e sentenças Pré-processamento prático e personalizado Analisando dados de texto Recurso básico de analisadores de PNL e análise de tags e taggers de POS Reconhecimento de entidade de nome N-gramas Saco de palavras Recursos estatísticos de PNL Conceitos de álgebra linear para PNL Teoria probabilística para PNL Codificadores e decodificadores de vetorização TF-IDF Normalização Modelos probabilísticos Engenharia avançada de recursos e PNL Noções básicas de word2vec Componentes do modelo word2vec Lógica do modelo word2vec Extensão do conceito word2vec Aplicação do modelo word2vec Estudo de caso: Aplicação de saco de palavras: resumo automático de texto usando algoritmos de Luhn simplificados e verdadeiros Agrupamento de documentos, classificação e modelagem de tópicos Agrupamento de documentos e mineração de padrões (agrupamento hierárquico, k-means, clustering, etc.) Comparação e classificação de documentos usando TFIDF, Jaccard e medidas de distância cosseno Classificação de documentos usando Naïve Bayes e Entropia Máxima Identificação de Elementos de Texto Importantes Redução de dimensionalidade: Análise de Componentes Principais, Decomposição de Valores Singulares fatoração de matriz não negativa Modelagem de tópicos e recuperação de informações usando análise semântica latente, extração de entidades, análise de sentimento e modelagem avançada de tópicos Positivo vs. negativo: grau de sentimento Teoria de resposta ao item Marcação de partes do discurso e sua aplicação: encontrar pessoas, lugares e organizações mencionadas em texto Modelagem avançada de tópicos: Alocação de Dirichlet Latente Estudos de caso Mineração de análises de usuários não estruturadas Classificação de sentimento e visualização de revisão de produto Logs de pesquisa de mineração de dados para padrões de uso Classificação de texto Modelagem de tópico

Requisitos

Conhecimento e sensibilização para os princípios da PNL  e apreciação da aplicação da IA na atividade empresarial

  21 horas
 

Declaração de Clientes (2)

Cursos Relacionados

Smart Robots for Developers

  84 horas

Categorias Relacionadas