Texto a audio
Con Texto a audio conviertes texto en un archivo de audio. Esto es útil para locuciones, comunicación al público, videos instructivos, material de entrenamiento y guiones.
Empezar desde el panel
En el panel, selecciona debajo del campo de entrada Texto a audio. El campo de entrada se agranda para que puedas introducir guiones más largos cómodamente. Después puedes rellenar el texto y generar el audio.
Configuración
A través del botón de configuración junto al campo de entrada puedes ajustar las configuraciones de voz.
| Configuración | Explicación |
|---|---|
| Modelo | Elige el modelo de texto a voz. |
| Idioma | Elige el idioma en el que debe pronunciarse el texto. |
| Voz | Elige una voz adecuada para el idioma seleccionado. |
| Systeemprompt | Indica instrucciones para pronunciación, tono, tempo, acento y términos especiales. |
| Referencia de estilo | Añade indicaciones adicionales sobre el estilo de habla deseado. |
La lista de voces se filtrará por el idioma elegido. Si una voz está destinada solo a ciertos idiomas, verás ese idioma en la voz.
Pronunciación y estilo
El systeemprompt indica cómo debe sonar la voz. Por ejemplo, puedes indicar:
- que el hablante suene como nativo en neerlandés;
- que palabras como AI, AI-Public, ChatGPT, OpenAI y Gemini se pronuncien en inglés;
- que Claude se pronuncie como nombre francés;
- o que el tono sea tranquilo, cálido, profesional, informal, bajo o enérgico.
Cuando eliges otro idioma, AI-Public ajusta las instrucciones estándar a ese idioma.
Guardar y restaurar
Puedes guardar tus configuraciones en tu cuenta. AI-Public recordará entonces, entre otras, el modelo, el idioma, la voz y el systeemprompt. Con Restaurar predeterminados eliminas estas preferencias guardadas.
Resultado
Después de generar, el archivo de audio aparece directamente en el chat. Puedes reproducirlo allí con el reproductor de audio y descargarlo con el botón de descarga.
Durante la generación, el formulario de entrada se desactiva temporalmente. Así evitas que múltiples generaciones de audio se superpongan.