Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece benefícios importantes:

Seguro por natureza - Seus dados permanecem no seu próprio computador e nunca são enviados para servidores externos
Sem custos adicionais - Modelos locais não possuem custos de API por uso
Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite executar modelos de IA localmente de forma simples. Ele é instalado em cada computador separadamente, o que não impõe limitações quanto ao número de usuários - nenhum servidor compartilhado necessário.

Instalar Ollama

Vá para a página de download do Ollama
Baixe a versão para o seu sistema operacional (Windows, macOS ou Linux)
Instale o Ollama seguindo o instalador
Após a instalação, o Ollama roda automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama, você precisa baixar pelo menos um modelo de linguagem:

Abra a interface do Ollama (via o ícone na bandeja do sistema ou terminal)
Baixe um modelo de linguagem à sua escolha

Modelo recomendado

Prefira um modelo que tenha capacidades de ferramentas e visão:

Capacidades de Ferramentas - O modelo pode acessar todas as ferramentas disponíveis na aplicação, como busca na internet e geração de imagens
Capacidades de Visão - O modelo pode analisar e descrever imagens

Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de ferramenta/visão. Instale este modelo via terminal:

ollama pull qwen3-vl:4b

Escolha do modelo com base no hardware

O desempenho de um modelo depende muito do hardware do seu computador:

Hardware	Recomendação
Limitado (8GB RAM, sem GPU)	Escolha modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)	Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderno)	Modelos maiores podem funcionar (13B+)

Velocidade vs. qualidade

Um modelo menor tende a ter melhor velocidade, mas pode gerar respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação de desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação de desktop detecta isso automaticamente. Você pode então selecionar o modelo local no chat como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a ferramentas/visão

Veja a lista completa em ollama.com/library. Filtre por modelos com:

tag Tools para capacidades de ferramenta
tag Vision para reconhecimento de imagens

Opções populares:

qwen3-vl:4b - Compacto, rápido, ferramenta + visão
llama3.2-vision - Capacidades de visão
mistral - Tarefas gerais rápidas

Por que modelos de IA locais?​

Por que Ollama?​

Instalar Ollama​

Instalar um modelo de linguagem​

Modelo recomendado​

Escolha do modelo com base no hardware​

Configuração na aplicação de desktop​

Modelos disponíveis com suporte a ferramentas/visão​

Por que modelos de IA locais?

Por que Ollama?

Instalar Ollama

Instalar um modelo de linguagem

Modelo recomendado

Escolha do modelo com base no hardware

Configuração na aplicação de desktop

Modelos disponíveis com suporte a ferramentas/visão