Текстово-голосовые модели
AI-Public поддерживает текстово-голосовые модели, которые позволяют преобразовать текст в аудиофайл. Эти модели используются в разделе Текст в аудио на панели управления и в функциях, которые генерируют аудио из чата.
Текущий каталог
| Поставщик | Модель | Примечание |
|---|---|---|
| OpenAI | GPT-4o мини TTS | Естественно звучащая речь с хорошим управл ением тоном и стилем. |
| Gemini 3.1 Flash TTS Preview | Новый Gemini-голосовой модель с точным управлением стилем, темпом и тоном. | |
| Европейский ИИ | Voxtral Mini TTS | Европейский text-to-speech на базе Mistral Voxtral Mini. |
Claude не имеет собственной модели текст-до-речи в каталоге. Если Claude включен как поставщик, голосовые модели зависят от остальных сконфигурированных поставщиков.
Что определяет голосовая модель
Голосовая модель определяет, как произносится текст и какие возможности доступны. Например:
- доступные голоса;
- языки, которые поддерживает голос;
- качество и естественность произношения;
- способ, которым выполняются инструкции по темпу, тону, акценту и произношению.