Curso de Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

O Ollama é uma ferramenta de código aberto para executar modelos de linguagem de grande escala localmente em hardware para consumo e empresas. Ele abstrai a quantização de modelos, a alocação de GPUs e o fornecimento de APIs em uma única interface de linha de comando, permitindo que as organizações auto-hospedem LLMs como Llama, Mistral e Qwen sem enviar prompts ou dados para a OpenAI, Anthropic ou Google.

Esta formação presencial e em tempo real (online ou no local) visa engenheiros de IA de nível intermediário e operadores de plataforma que desejam usar o Ollama para substituir as APIs de LLM em nuvem por inferência de modelos de linguagem auto-hospedados e soberanos.

No final desta formação, os participantes serão capazes de:

Instalar o Ollama no Linux, macOS e Windows com suporte a GPU.
Obter, quantizar e servir modelos do registo do Ollama e do HuggingFace.
Construir Modelfiles personalizados com prompts de sistema e ajuste de parâmetros.
Integrar LLMs locais com aplicações através da API compatível com a OpenAI.
Otimizar o desempenho da inferência para configurações apenas de CPU e multi-GPU.

Formato do Curso

Aula interativa e discussão.
Muitos exercícios e prática.
Implementação prática num ambiente de laboratório em tempo real.

Opções de Personalização do Curso

Para solicitar uma formação personalizada para este curso, entre em contato connosco para organizar.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Soberania da IA e Implantação Local de LLM

Riscos dos LLMs em nuvem: retenção de dados, treinamento nas entradas, jurisdição estrangeira.
Arquitetura do Ollama: servidor de modelos, registo e API compatível com a OpenAI.
Comparação com vLLM, llama.cpp e Text Generation Inference.
Licenciamento de modelos: termos do Llama, Mistral, Qwen e Gemma.

Instalação e Configuração de Hardware

Instalando o Ollama no Linux com suporte a CUDA e ROCm.
Fallback apenas de CPU e otimização AVX/AVX2.
Implantação no Docker e mapeamento de volumes persistentes.
Configuração de multi-GPU e estratégias de alocação de VRAM.

Gestão de Modelos

Obtendo modelos do registo do Ollama: ollama pull llama3.
Importação de modelos GGUF do HuggingFace e TheBloke.
Níveis de quantização: compensações entre Q4_K_M, Q5_K_M e Q8_0.
Troca de modelos e limites de carregamento simultâneo de modelos.

Modelfiles Personalizados

Escrevendo a sintaxe do Modelfile: FROM, PARAMETER, SYSTEM, TEMPLATE.
Ajuste de temperatura, top_p e repeat_penalty.
Engenharia de prompts de sistema para comportamento específico de função.
Criação e publicação de modelos personalizados no registo local.

Integração de API

Endpoint /v1/chat/completions compatível com a OpenAI.
Respostas em streaming e modo JSON.
Integração com LangChain, LlamaIndex e aplicações personalizadas.
Autenticação e limitação de taxa com proxy reverso.

Otimização de Desempenho

Dimensionamento da janela de contexto e gestão de cache KV.
Inferência em lote e tratamento de solicitações paralelas.
Alocação de threads da CPU e consciência NUMA.
Monitoramento da utilização da GPU e pressão da memória.

Segurança e Conformidade

Isolamento de rede para endpoints de fornecimento de modelos.
Filtro de entrada e pipelines de moderação de saída.
Registo de auditoria de prompts e conclusões.
Proveniência do modelo e verificação de hash.

Requisitos

Administração intermédia de Linux e contentores.
Compreensão dos modelos de aprendizado de máquina e transformadores ao alto nível.
Familiaridade com APIs REST e JSON.

Público-Alvo

Engenheiros de IA e programadores que substituem APIs de LLM em nuvem.
Organizações com sensibilidade de dados que impedem o uso de modelos em nuvem.
Equipas de governo e defesa que requerem modelos de linguagem isolados fisicamente.

14 Horas

Treinamento Corporativo Personalizado

Soluções de treinamento projetadas exclusivamente para empresas.

Conteúdo Personalizado: Adaptamos o programa e os exercícios práticos aos objetivos e necessidades reais do seu projeto.
Horário Flexível: Datas e horários adaptados à agenda da sua equipe.
Formato: Online (ao vivo), In-Company (em suas instalações) ou Híbrido.

Investimento

Preço por grupo privado, treinamento online ao vivo, a partir de 2600 € + VAT*

Entre em contato conosco para obter um orçamento preciso e conhecer nossas promoções mais recentes

(*O preço final pode variar dependendo da especialização técnica do curso, do nível de personalização, do método de entrega e do número de participantes)

Precisa de ajuda para escolher o curso certo?

Curso de Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Próximas Formações Provisórias

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Programa do Curso

Requisitos

Treinamento Corporativo Personalizado

Próximas Formações Provisórias

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Ollama: Modelos de Linguagem de Grande Escala Auto-Hospedados que Substituem as APIs da OpenAI e Claude

Cursos Relacionados

Avançado de Depuração e Avaliação do Modelo Ollama

Construindo Fluxos de Trabalho Privados de IA com Ollama

Implantando e Otimizando LLMs com o Ollama

Ajuste Fino e Personalização de Modelos de IA no Ollama

Aplicações Multimodais com Ollama

Introdução ao Ollama: Executando Modelos de IA Localmente

Ollama & Privacidade de Dados: Padrões de Implantação Segura

Aplicações da Ollama no Setor Financeiro

Aplicações do Ollama na Saúde

Ollama para IA Responsável e Governança

Escalabilidade do Ollama e Otimização de Infraestrutura

Mastery em Engenharia de Prompt com Ollama

Categorias Relacionadas

Ollama

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites