Ir para o conteúdo principal

Modelos de texto-para-fala

AI-Public suporta modelos de texto-para-fala que convertem texto em áudio. Esses modelos são usados em Texto para áudio no painel e em funções que geram áudio a partir de uma conversa.

Catálogo atual

ProvedorModeloObservação
OpenAIGPT-4o mini TTSFala naturalmente com bom controle de tom e estilo.
GoogleGemini 3.1 Flash TTS PreviewNovo modelo de fala Gemini com controle preciso de estilo, tempo e tom.
European AIVoxtral Mini TTSSíntese de voz europeia baseada no Mistral Voxtral Mini.

Claude não possui um modelo de texto-para-fala próprio no catálogo. Se Claude estiver ativo como provedor, os modelos de fala permanecem dependentes dos demais provedores configurados.

O que determina um modelo de fala

Um modelo de fala determina como o texto é pronunciado e quais possibilidades estão disponíveis. Pense em:

  • as vozes disponíveis;
  • os idiomas que uma voz suporta;
  • a qualidade e naturalidade da pronúncia;
  • a forma como instruções sobre velocidade, tom, sotaque e pronúncia são seguidas.

Vozes e idiomas

As vozes disponíveis variam conforme o provedor. AI-Public exibe apenas vozes que correspondem ao idioma escolhido ao fazer texto para áudio, ou vozes adequadas para vários idiomas. Se uma voz for destinada apenas a determinados idiomas, esse idioma é informado junto à voz.

OpenAI e Google suportam a maioria dos idiomas no catálogo. Voxtral Mini TTS suporta um conjunto menor de idiomas, incluindo neerlandês, inglês, francês, espanhol, português, italiano, alemão, hindi e árabe.

Systeemprompt

No texto para áudio, o systeemprompt pode ser usado para guiar a pronúncia e o estilo. Você pode, por exemplo, indicar que o neerlandês deve soar natural, que termos como AI, AI-Public, ChatGPT e OpenAI devem ser pronunciados em inglês, ou que Claude deve soar como um nome francês.

Preferências

Os usuários podem salvar suas configurações de texto-para-áudio como preferências pessoais. Assim, não é necessário escolher modelo, idioma, voz e instruções de pronúncia a cada vez.