Modelos de Text-to-Speech

AI-Public admite modelos de texto a voz que convierten texto en audio. Estos modelos se utilizan en Texto a audio en el panel y en funciones que generan audio a partir de un chat.

Catálogo actual

Proveedor	Modelo	Observación
OpenAI	GPT-4o mini TTS	Habla natural con buen control de tono y estilo.
Google	Gemini 3.1 Flash TTS Preview	Nuevo modelo de voz Gemini con control preciso de estilo, tempo y tono.
European AI	Voxtral Mini TTS	Texto a voz europeo basado en Mistral Voxtral Mini.

Claude no tiene un modelo de texto a voz propio en el catálogo. Si Claude está habilitado como proveedor, los modelos de voz quedan sujetos a los demás proveedores configurados.

Qué determina un modelo de voz

Un modelo de voz determina cómo se pronuncia el texto y qué opciones están disponibles. Pense en:

las voces disponibles;
los idiomas que admite una voz;
la calidad y naturalidad de la pronunciación;
la forma en que se siguen las instrucciones sobre tempo, tono, acento y pronunciación.

Voces e idiomas

Las voces disponibles varían según el proveedor. AI-Public muestra en texto a audio solo voces que coinciden con el idioma elegido, o voces adecuadas para varios idiomas. Si una voz está destinada solo a ciertos idiomas, ese idioma se indica junto a la voz.

OpenAI y Google soportan la mayoría de idiomas en el catálogo. Voxtral Mini TTS soporta un conjunto menor de idiomas, incluyendo neerlandés, inglés, francés, español, portugués, italiano, alemán, hindi y árabe.

Systeemprompt

En texto a audio, el systeemprompt puede usarse para dirigir la pronunciación y el estilo. Por ejemplo, puedes indicar que el neerlandés debe sonar natural, que términos como AI, AI-Public, ChatGPT y OpenAI se pronuncien en inglés, o que Claude suene como un nombre francés.

Preferencias

Los usuarios pueden guardar sus configuraciones de texto a audio como preferencias personales. De este modo, no hace falta seleccionar modelo, idioma, voz y directrices de pronunciación cada vez.

Catálogo actual​

Qué determina un modelo de voz​

Voces e idiomas​

Systeemprompt​

Preferencias​

Catálogo actual

Qué determina un modelo de voz

Voces e idiomas

Systeemprompt

Preferencias