Ir al contenido principal

Texto a audio

Con Texto a audio conviertes texto en un archivo de audio. Esto es útil para locuciones, comunicación al público, videos instructivos, material de entrenamiento y guiones.

Empezar desde el panel

En el panel, selecciona debajo del campo de entrada Texto a audio. El campo de entrada se agranda para que puedas introducir guiones más largos cómodamente. Después puedes rellenar el texto y generar el audio.

Configuración

A través del botón de configuración junto al campo de entrada puedes ajustar las configuraciones de voz.

ConfiguraciónExplicación
ModeloElige el modelo de texto a voz.
IdiomaElige el idioma en el que debe pronunciarse el texto.
VozElige una voz adecuada para el idioma seleccionado.
SysteempromptIndica instrucciones para pronunciación, tono, tempo, acento y términos especiales.
Referencia de estiloAñade indicaciones adicionales sobre el estilo de habla deseado.

La lista de voces se filtrará por el idioma elegido. Si una voz está destinada solo a ciertos idiomas, verás ese idioma en la voz.

Pronunciación y estilo

El systeemprompt indica cómo debe sonar la voz. Por ejemplo, puedes indicar:

  • que el hablante suene como nativo en neerlandés;
  • que palabras como AI, AI-Public, ChatGPT, OpenAI y Gemini se pronuncien en inglés;
  • que Claude se pronuncie como nombre francés;
  • o que el tono sea tranquilo, cálido, profesional, informal, bajo o enérgico.

Cuando eliges otro idioma, AI-Public ajusta las instrucciones estándar a ese idioma.

Guardar y restaurar

Puedes guardar tus configuraciones en tu cuenta. AI-Public recordará entonces, entre otras, el modelo, el idioma, la voz y el systeemprompt. Con Restaurar predeterminados eliminas estas preferencias guardadas.

Resultado

Después de generar, el archivo de audio aparece directamente en el chat. Puedes reproducirlo allí con el reproductor de audio y descargarlo con el botón de descarga.

Durante la generación, el formulario de entrada se desactiva temporalmente. Así evitas que múltiples generaciones de audio se superpongan.