Text-to-Speech моделі

AI-Public підтримує моделі тексту в мову, які перетворюють текст на аудіо. Ці моделі використовуються у розділі Текст у аудіо на панелі керування та у функціях, що генерують аудіо з чату.

Поточний каталог

Постачальник	Модель	Примітка
OpenAI	GPT-4o mini TTS	Природньо звучна вимова з хорошим контролем темпу та стилю.
Google	Gemini 3.1 Flash TTS Preview	Новий голосовий модель Gemini з точним контролем стилю, темпу та тону.
Європейський ОAI	Voxtral Mini TTS	Європейська текст-у-мову на основі Mistral Voxtral Mini.

Claude не має власної моделі тексту у мову в каталозі. Якщо Claude увімкнено як постачальник, голосові моделі залежать від інших сконфігурованих постачальників.

Що визначає модель голосу

Модель голосу визначає, як вимовляється текст і які можливості доступні. Зокрема:

доступні голоси;
мови, що підтримує голос;
якість та природність вимови;
спосіб дотримання інструкцій щодо темпу, тону, акценту та вимови.

Голоси та мови

Доступні голоси відрізняються залежно від постачальника. AI-Public показує у тексті до аудіо лише ті голоси, які відповідають обраній мові, або голоси, придатні для кількох мов. Якщо голос призначено лише для певних мов, ця мова вказана біля голосу.

OpenAI та Google підтримують більшість мов у каталозі. Voxtral Mini TTS підтримує менший набір мов, серед яких нідерландська, англійська, французька, іспанська, португальська, італійська, німецька, хінді та арабська.

Системна підказка

У тексті до аудіо системна підказка може використовуватися для керування вимовою та стилем. Наприклад, ви можете вказати, що нідерландська має звучати природно, що терміни як AI, AI-Public, ChatGPT та OpenAI вимовляються англійською, або що Claude має звучати як французьке ім’я.

Налаштування

Користувачі можуть зберігати свої налаштування тексту у мову як персональні вподобання. Так не потрібно обирати модель, мову, голос та інструкції вимови щоразу знову.

Поточний каталог​

Що визначає модель голосу​

Голоси та мови​

Системна підказка​

Налаштування​

Поточний каталог

Що визначає модель голосу

Голоси та мови

Системна підказка

Налаштування