Text-zu-Sprache

Mit Text-zu-Sprache wandelst du Text in eine Audiodatei um. Das ist nützlich für Voiceovers, Öffentlichkeitskommunikation, Erklärvideos, Schulungsmaterialien und Skripte.

Starten vom Dashboard

Im Dashboard wählst du unter dem Eingabefeld Text-zu-Sprache. Das Eingabefeld wird größer, sodass du auch längere Skripte bequem eingeben kannst. Danach kannst du den Text eingeben und Audio generieren.

Einstellungen

Über die Einstellungs-Schaltfläche neben dem Eingabefeld kannst du die Sprachanzeigen anpassen.

Einstellung	Erklärung
Modell	Wähle das Text-zu-Sprachmodell.
Sprache	Wähle die Sprache, in der der Text gesprochen werden soll.
Stimme	Wähle eine Stimme, die für die gewählte Sprache geeignet ist.
Systemprompt	Gib Anweisungen zur Aussprache, Tonfall, Tempo, Akzent und speziellen Begriffen.
Stilreferenz	Füge zusätzliche Hinweise zur gewünschten Sprechweise hinzu.

Die Stimmendliste wird nach der gewählten Sprache gefiltert. Wenn eine Stimme nur für bestimmte Sprachen vorgesehen ist, siehst du diese Sprache bei der Stimme angegeben.

Aussprache und Stil

Der Systemprompt steuert, wie die Stimme klingen soll. Du kannst hier zum Beispiel angeben:

dass der Sprecher Niederländisch als Muttersprache klingen soll;
dass Wörter wie AI, AI-Public, ChatGPT, OpenAI und Gemini mit englischer Aussprache gesprochen werden dürfen;
dass Claude als französischer Name ausgesprochen werden soll;
oder der Ton ruhig, warm, geschäftlich, informell, niedrig oder energetisch sein soll.

Wenn du eine andere Sprache wählst, passen sich die Standardanweisungen von AI-Public an diese Sprache an.

Speichern und Wiederherstellen

Du kannst deine Einstellungen in deinem Konto speichern. AI-Public merkt sich dann unter anderem Modell, Sprache, Stimme und Systemprompt. Bei Standard wiederherstellen entfernst du diese gespeicherten Präferenzen.

Ergebnis

Nach der Generierung erscheint die Audiodatei direkt im Chat. Du kannst sie dort mit dem Audioplayer abspielen und mit dem Downloadknopf herunterladen.

Während der Generierung wird das Eingabeformular vorübergehend deaktiviert. So verhinderst du, dass mehrere Audio-Generierungen durcheinanderlaufen.

Starten vom Dashboard​

Einstellungen​

Aussprache und Stil​

Speichern und Wiederherstellen​

Ergebnis​

Starten vom Dashboard

Einstellungen

Aussprache und Stil

Speichern und Wiederherstellen

Ergebnis