Ir para o conteúdo principal

Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece benefícios importantes:

  • Seguro por natureza - Seus dados permanecem no seu próprio computador e nunca são enviados para servidores externos
  • Sem custos adicionais - Modelos locais não possuem custos de API por uso
  • Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite executar modelos de IA localmente de forma simples. Ele é instalado em cada computador separadamente, o que não impõe limitações quanto ao número de usuários - nenhum servidor compartilhado necessário.

Instalar Ollama

  1. Vá para a página de download do Ollama
  2. Baixe a versão para o seu sistema operacional (Windows, macOS ou Linux)
  3. Instale o Ollama seguindo o instalador
  4. Após a instalação, o Ollama roda automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama, você precisa baixar pelo menos um modelo de linguagem:

  1. Abra a interface do Ollama (via o ícone na bandeja do sistema ou terminal)
  2. Baixe um modelo de linguagem à sua escolha

Modelo recomendado

Prefira um modelo que tenha capacidades de ferramentas e visão:

  • Capacidades de Ferramentas - O modelo pode acessar todas as ferramentas disponíveis na aplicação, como busca na internet e geração de imagens
  • Capacidades de Visão - O modelo pode analisar e descrever imagens
Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de ferramenta/visão. Instale este modelo via terminal:

ollama pull qwen3-vl:4b

Escolha do modelo com base no hardware

O desempenho de um modelo depende muito do hardware do seu computador:

HardwareRecomendação
Limitado (8GB RAM, sem GPU)Escolha modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderno)Modelos maiores podem funcionar (13B+)
Velocidade vs. qualidade

Um modelo menor tende a ter melhor velocidade, mas pode gerar respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação de desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação de desktop detecta isso automaticamente. Você pode então selecionar o modelo local no chat como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a ferramentas/visão

Veja a lista completa em ollama.com/library. Filtre por modelos com:

  • tag Tools para capacidades de ferramenta
  • tag Vision para reconhecimento de imagens

Opções populares:

  • qwen3-vl:4b - Compacto, rápido, ferramenta + visão
  • llama3.2-vision - Capacidades de visão
  • mistral - Tarefas gerais rápidas