Перейти до основного змісту

Text-to-Speech моделі

AI-Public підтримує моделі тексту в мову, які перетворюють текст на аудіо. Ці моделі використовуються у розділі Текст у аудіо на панелі керування та у функціях, що генерують аудіо з чату.

Поточний каталог

ПостачальникМодельПримітка
OpenAIGPT-4o mini TTSПриродньо звучна вимова з хорошим контролем темпу та стилю.
GoogleGemini 3.1 Flash TTS PreviewНовий голосовий модель Gemini з точним контролем стилю, темпу та тону.
Європейський ОAIVoxtral Mini TTSЄвропейська текст-у-мову на основі Mistral Voxtral Mini.

Claude не має власної моделі тексту у мову в каталозі. Якщо Claude увімкнено як постачальник, голосові моделі залежать від інших сконфігурованих постачальників.

Що визначає модель голосу

Модель голосу визначає, як вимовляється текст і які можливості доступні. Зокрема:

  • доступні голоси;
  • мови, що підтримує голос;
  • якість та природність вимови;
  • спосіб дотримання інструкцій щодо темпу, тону, акценту та вимови.

Голоси та мови

Доступні голоси відрізняються залежно від постачальника. AI-Public показує у тексті до аудіо лише ті голоси, які відповідають обраній мові, або голоси, придатні для кількох мов. Якщо голос призначено лише для певних мов, ця мова вказана біля голосу.

OpenAI та Google підтримують більшість мов у каталозі. Voxtral Mini TTS підтримує менший набір мов, серед яких нідерландська, англійська, французька, іспанська, португальська, італійська, німецька, хінді та арабська.

Системна підказка

У тексті до аудіо системна підказка може використовуватися для керування вимовою та стилем. Наприклад, ви можете вказати, що нідерландська має звучати природно, що терміни як AI, AI-Public, ChatGPT та OpenAI вимовляються англійською, або що Claude має звучати як французьке ім’я.

Налаштування

Користувачі можуть зберігати свої налаштування тексту у мову як персональні вподобання. Так не потрібно обирати модель, мову, голос та інструкції вимови щоразу знову.