انتقل إلى المحتوى الرئيسي

نماذج تحويل النص إلى كلام

يدعم AI-Public نماذج تحويل النص إلى كلام التي يمكنها تحويل النص إلى صوت. تُستخدم هذه النماذج في قسم النص إلى صوت في لوحة القيادة وفي الميزات التي تولّد صوتًا من محادثة.

الكتالوج الحالي

مزوّدالنموذجملاحظة
OpenAIGPT-4o mini TTSكلام يبدو طبيعياً مع تحكم جيد في النغمة والأسلوب.
GoogleGemini 3.1 Flash TTS Previewنموذج كلام Gemini جديد مع تحكم دقيق في الأسلوب والسرعة والنغمة.
European AIVoxtral Mini TTSتحويل نص إلى صوت أوروبي يعتمد على Mistral Voxtral Mini.

Claude ليس لديه نموذج نص إلى كلام خاص به في الكتالوج. إذا تم تمكين Claude كمزوّد، ستبقى نماذج الكلام تعتمد على المزودين الآخرين المُكوّنين.

ما الذي يحدده نموذج الكلام

يحدد نموذج الكلام كيف يُنطق النص وأي الإمكانيات متاحة. فكر في:

  • الأصوات المتاحة؛
  • اللغات التي تدعمها كل صوت؛
  • جودة وطبيعية النطق؛
  • الطريقة التي يتم بها اتباع التعليمات حول السرعة، النغمة، اللهجة والنطق.

الأصوات واللغات

الأصوات المتاحة تختلف حسب المزود. يعرض AI-Public في النص إلى الصوت فقط الأصوات التي تتناسب مع اللغة المختارة، أو الأصوات المناسبة لعدة لغات. إذا كان الصوت مخصصًا فقط لبعض اللغات، فاللغة مذكورة بجانب الصوت.

يدعم OpenAI وGoogle معظم اللغات في الكتالوج. يدعم Voxtral Mini TTS مجموعة أصغر من اللغات، بما فيها الهولندية والإنجليزية والفرنسية والإسبانية والبرتغالية والإيطالية والألمانية والهندية والعربية.

موجه النظام

في النص إلى صوت، يمكن استخدام موجه النظام للتحكم في النطق والأسلوب. يمكنك على سبيل المثال الإشارة إلى أن اللغة الهولندية يجب أن تبدو طبيعية، وأن المصطلحات مثل AI، AI-Public، ChatGPT وOpenAI تُنطق بنطق إنجليزي، أو أن Claude يجب أن يُنطق كاسم فرنسي.

التفضيلات

يمكن للمستخدمين حفظ إعداداتهم للنص إلى صوت كتفضيلات شخصية. وبالتالي لا حاجة لاختيار النموذج واللغة والصوت وإرشادات النطق في كل مرة.