مدلهای تبدیل متن به گفتار
AI-Public از مدلهای تبدیل متن به گفتار پشتیبانی میکند که متن را به صوت تبدیل میکنند. این مدلها در داشبورد و در قابلیتهایی که از چت صدا ایجاد میکنند استفاده میشوند، در بخش متن به صدا.
فهرست فعلی
| ارائهدهنده | مدل | یادداشت |
|---|---|---|
| OpenAI | GPT-4o mini TTS | گفتار طبیعی با کنترل خوب روی لحن و سبک |
| Gemini 3.1 Flash TTS Preview | مدل گفتار جدید Gemini با کنترل دقیق روی سبک، سرعت و لحن | |
| Europese AI | Voxtral Mini TTS | گفتار متن-به-سرا با استفاده از Mistral Voxtral Mini |
Claude در کاتالوگ، مدل متن-به-گفتار خودش ندارد. اگر Claude به عنوان ارائهدهنده فعال شده باشد، مدلهای گفتاری بر اساس سا یر ارائهدهندگان پیکربندیشده باقی میمانند.
اینکه یک مدل گفتار چه تعیین میکند
یک مدل گفتار تعیین میکند چگونه متن بیان میشود و چه امکاناتی در دسترس هستند. به موارد زیر فکر کنید:
- صداهای موجود;
- زبانهایی که یک صدا از آنها پشتیبانی میکند;
- کیفیت و طبیعی بودن تلفظ;
- روشی که دستورالعملها درباره سرعت، لحن، لهجه و تلفظ دنبال میشود.
صداها و زبانها
صداهای در دسترس بسته به ارائهدهنده متفاوت است. AI-Public در متن به گفتار تنها صداهایی را نشان میدهد که با زبان انتخابشده مطابقت دارند یا صداهایی که برای چند زبان مناسباند. اگر صدایی تنها برای زبانهای خاصی در نظر گرفته شده باشد، آن زبان در کنار صدا ذکر میشود.
OpenAI و Google بیشتر زبانهای کاتالوگ را پشتیبانی میکنند. Voxtral Mini TTS مجموعه کمتری از زبانها را پشتیبانی میکند، از جمله Dutch Dutch, English, French, Spanish, Portuguese, Italian, German, Hindi و Arabic.
سوژه سیستم (سیتِم-پرومپت)
در متن به صدا میتوانید از سوژه سیستم استفاده کنید تا تلفظ و سبک را هدایت کنید. به عنوان مثال میتوانید مشخص کنید که Dutch باید بهطور طبیعی صدا شود، یا عباراتی مانند AI، AI-Public، ChatGPT و OpenAI با تلفظ انگلیسی ادا شوند، یا اینکه Claude بهعنوان یک نام فرانسوی تلفظ شود.
ترجیحها
کاربران میتوانند تنظیمات متن-به-صدا را به عنوان ترجیح شخصی ذخیره کنند. به این ترتیب لازم نیست دوباره مدل، زبان، صدا و دستورات تلفظ را انتخاب کنند.