Ir al contenido principal

Modelos de Text-to-Speech

AI-Public admite modelos de texto a voz que convierten texto en audio. Estos modelos se utilizan en Texto a audio en el panel y en funciones que generan audio a partir de un chat.

Catálogo actual

ProveedorModeloObservación
OpenAIGPT-4o mini TTSHabla natural con buen control de tono y estilo.
GoogleGemini 3.1 Flash TTS PreviewNuevo modelo de voz Gemini con control preciso de estilo, tempo y tono.
European AIVoxtral Mini TTSTexto a voz europeo basado en Mistral Voxtral Mini.

Claude no tiene un modelo de texto a voz propio en el catálogo. Si Claude está habilitado como proveedor, los modelos de voz quedan sujetos a los demás proveedores configurados.

Qué determina un modelo de voz

Un modelo de voz determina cómo se pronuncia el texto y qué opciones están disponibles. Pense en:

  • las voces disponibles;
  • los idiomas que admite una voz;
  • la calidad y naturalidad de la pronunciación;
  • la forma en que se siguen las instrucciones sobre tempo, tono, acento y pronunciación.

Voces e idiomas

Las voces disponibles varían según el proveedor. AI-Public muestra en texto a audio solo voces que coinciden con el idioma elegido, o voces adecuadas para varios idiomas. Si una voz está destinada solo a ciertos idiomas, ese idioma se indica junto a la voz.

OpenAI y Google soportan la mayoría de idiomas en el catálogo. Voxtral Mini TTS soporta un conjunto menor de idiomas, incluyendo neerlandés, inglés, francés, español, portugués, italiano, alemán, hindi y árabe.

Systeemprompt

En texto a audio, el systeemprompt puede usarse para dirigir la pronunciación y el estilo. Por ejemplo, puedes indicar que el neerlandés debe sonar natural, que términos como AI, AI-Public, ChatGPT y OpenAI se pronuncien en inglés, o que Claude suene como un nombre francés.

Preferencias

Los usuarios pueden guardar sus configuraciones de texto a audio como preferencias personales. De este modo, no hace falta seleccionar modelo, idioma, voz y directrices de pronunciación cada vez.