برو به محتوای اصلی

مدل‌های تبدیل متن به گفتار

AI-Public از مدل‌های تبدیل متن به گفتار پشتیبانی می‌کند که متن را به صوت تبدیل می‌کنند. این مدل‌ها در داشبورد و در قابلیت‌هایی که از چت صدا ایجاد می‌کنند استفاده می‌شوند، در بخش متن به صدا.

فهرست فعلی

ارائه‌دهندهمدلیادداشت
OpenAIGPT-4o mini TTSگفتار طبیعی با کنترل خوب روی لحن و سبک
GoogleGemini 3.1 Flash TTS Previewمدل گفتار جدید Gemini با کنترل دقیق روی سبک، سرعت و لحن
Europese AIVoxtral Mini TTSگفتار متن-به-سرا با استفاده از Mistral Voxtral Mini

Claude در کاتالوگ، مدل متن-به-گفتار خودش ندارد. اگر Claude به عنوان ارائه‌دهنده فعال شده باشد، مدل‌های گفتاری بر اساس سایر ارائه‌دهندگان پیکربندی‌شده باقی می‌مانند.

اینکه یک مدل گفتار چه تعیین می‌کند

یک مدل گفتار تعیین می‌کند چگونه متن بیان می‌شود و چه امکاناتی در دسترس هستند. به موارد زیر فکر کنید:

  • صداهای موجود;
  • زبان‌هایی که یک صدا از آنها پشتیبانی می‌کند;
  • کیفیت و طبیعی بودن تلفظ;
  • روشی که دستورالعمل‌ها درباره سرعت، لحن، لهجه و تلفظ دنبال می‌شود.

صداها و زبان‌ها

صداهای در دسترس بسته به ارائه‌دهنده متفاوت است. AI-Public در متن به گفتار تنها صداهایی را نشان می‌دهد که با زبان انتخاب‌شده مطابقت دارند یا صداهایی که برای چند زبان مناسب‌اند. اگر صدایی تنها برای زبان‌های خاصی در نظر گرفته شده باشد، آن زبان در کنار صدا ذکر می‌شود.

OpenAI و Google بیشتر زبان‌های کاتالوگ را پشتیبانی می‌کنند. Voxtral Mini TTS مجموعه کمتری از زبان‌ها را پشتیبانی می‌کند، از جمله Dutch Dutch, English, French, Spanish, Portuguese, Italian, German, Hindi و Arabic.

سوژه سیستم (سیتِم-پرومپت)

در متن به صدا می‌توانید از سوژه سیستم استفاده کنید تا تلفظ و سبک را هدایت کنید. به عنوان مثال می‌توانید مشخص کنید که Dutch باید به‌طور طبیعی صدا شود، یا عباراتی مانند AI، AI-Public، ChatGPT و OpenAI با تلفظ انگلیسی ادا شوند، یا اینکه Claude به‌عنوان یک نام فرانسوی تلفظ شود.

ترجیح‌ها

کاربران می‌توانند تنظیمات متن-به-صدا را به عنوان ترجیح شخصی ذخیره کنند. به این ترتیب لازم نیست دوباره مدل، زبان، صدا و دستورات تلفظ را انتخاب کنند.