Vai al contenuto principale

Text to Audio

Con Text to Audio converti il testo in un file audio. Questo è utile per voice-over, comunicazioni al pubblico, video istruttivi, materiale di formazione e script.

Avvio dal dashboard

Dal dashboard seleziona sotto il campo di input Text to Audio. Il campo di input aumenta di dimensione, così da poter inserire anche script più lunghi comodamente. Puoi poi inserire il testo e generare l’audio.

Impostazioni

Attraverso il pulsante delle impostazioni accanto al campo di input puoi modificare le impostazioni vocali.

ImpostazioneSpiegazione
ModelloScegli il modello testo-audio.
LinguaScegli la lingua in cui il testo deve essere pronunciato.
VoceScegli una voce adatta alla lingua selezionata.
Istruzioni di sistemaFornisci istruzioni su pronuncia, tono, tempo, accento e termini speciali.
Riferimento di stileAggiungi ulteriori indicazioni sullo stile di parlato desiderato.

L’elenco delle voci vocali viene filtrato in base alla lingua scelta. Se una voce è destinata solo a determinate lingue, vedrai quella lingua indicata accanto alla voce.

Pronuncia e stile

Le istruzioni di sistema definiscono come deve suonare la voce. È possibile indicare, ad esempio:

  • che il relatore debba suonare come madrelingua olandese;
  • che parole quali AI, AI-Public, ChatGPT, OpenAI e Gemini debbano avere pronuncia inglese;
  • che Claude debba essere pronunciato come nome francese;
  • o che il tono debba essere tranquillo, caldo, professionale, informale, basso o energico.

Quando selezioni un'altra lingua, AI-Public adatta le istruzioni standard a quella lingua.

Salvataggio e ripristino

Puoi salvare le impostazioni sul tuo account. AI-Public ricorderà tra le altre cose modello, lingua, voce e istruzioni di sistema. Con Ripristina impostazioni di default elimini queste preferenze salvate.

Risultato

Dopo la generazione, il file audio appare direttamente nella chat. Puoi riprodurlo lì con il lettore audio e scaricarlo con il pulsante di download.

Durante la generazione, il modulo di input viene temporaneamente disabilitato. In questo modo eviti che più generazioni audio si intreccino.