Zum Hauptinhalt springen

Text-zu-Sprache

Mit Text-zu-Sprache wandelst du Text in eine Audiodatei um. Das ist nützlich für Voiceovers, Öffentlichkeitskommunikation, Erklärvideos, Schulungsmaterialien und Skripte.

Starten vom Dashboard

Im Dashboard wählst du unter dem Eingabefeld Text-zu-Sprache. Das Eingabefeld wird größer, sodass du auch längere Skripte bequem eingeben kannst. Danach kannst du den Text eingeben und Audio generieren.

Einstellungen

Über die Einstellungs-Schaltfläche neben dem Eingabefeld kannst du die Sprachanzeigen anpassen.

EinstellungErklärung
ModellWähle das Text-zu-Sprachmodell.
SpracheWähle die Sprache, in der der Text gesprochen werden soll.
StimmeWähle eine Stimme, die für die gewählte Sprache geeignet ist.
SystempromptGib Anweisungen zur Aussprache, Tonfall, Tempo, Akzent und speziellen Begriffen.
StilreferenzFüge zusätzliche Hinweise zur gewünschten Sprechweise hinzu.

Die Stimmendliste wird nach der gewählten Sprache gefiltert. Wenn eine Stimme nur für bestimmte Sprachen vorgesehen ist, siehst du diese Sprache bei der Stimme angegeben.

Aussprache und Stil

Der Systemprompt steuert, wie die Stimme klingen soll. Du kannst hier zum Beispiel angeben:

  • dass der Sprecher Niederländisch als Muttersprache klingen soll;
  • dass Wörter wie AI, AI-Public, ChatGPT, OpenAI und Gemini mit englischer Aussprache gesprochen werden dürfen;
  • dass Claude als französischer Name ausgesprochen werden soll;
  • oder der Ton ruhig, warm, geschäftlich, informell, niedrig oder energetisch sein soll.

Wenn du eine andere Sprache wählst, passen sich die Standardanweisungen von AI-Public an diese Sprache an.

Speichern und Wiederherstellen

Du kannst deine Einstellungen in deinem Konto speichern. AI-Public merkt sich dann unter anderem Modell, Sprache, Stimme und Systemprompt. Bei Standard wiederherstellen entfernst du diese gespeicherten Präferenzen.

Ergebnis

Nach der Generierung erscheint die Audiodatei direkt im Chat. Du kannst sie dort mit dem Audioplayer abspielen und mit dem Downloadknopf herunterladen.

Während der Generierung wird das Eingabeformular vorübergehend deaktiviert. So verhinderst du, dass mehrere Audio-Generierungen durcheinanderlaufen.