टेक्स्ट-टू-स्पीच मॉडल्स

AI-Public टेक्स्ट-टू-स्पीच मॉडलों का समर्थन करता है जिनसे टेक्स्ट को ऑडियो में बदला जा सकता है। ये मॉडल डैशबोर्ड पर टेक्स्ट टू ऑडियो और चैट से ऑडियो जनरेट करने वाली सुविधाओं में उपयोग होते हैं।

वर्तमान कैटलॉग

प्रदाता	मॉडल	टिप्पणी
OpenAI	GPT-4o mini TTS	प्राकृतिक-सी आवाज़ के साथ उचित टोन और स्टाइल नियंत्रण।
Google	Gemini 3.1 Flash TTS Preview	नया Gemini-टेक्स्ट-टू-स्पीच मॉडल स्टाइल, गति और टोन पर सटीक नियंत्रण के साथ।
European AI	Voxtral Mini TTS	Mistral Voxtral Mini पर आधारित यूरोपीय टेक्स्ट-टू-स्पीच।

Claude के पास कैटलॉग में अपना स्वयं का टेक्स्ट-टू-स्पीच मॉडल नहीं है। अगर Claude प्रदाता के रूप में सक्षम है, तो स्पीच मॉडेल अन्यConfigured प्रदाताओं पर निर्भर रहते हैं।

क्या एक स्पीच मॉडल निर्धारित करता है

एक स्पीच मॉडल यह निर्धारित करता है कि टेक्स्ट कैसे उच्चारण किया जाएगा और कौन-कौन से विकल्प उपलब्ध होंगे। विचार करें:

उपलब्ध आवाज़ें;
वे भाषाएँ जिनका एक आवाज़ समर्थन करती है;
उच्चारण की गुणवत्ता और प्राकृतिकता;
वह तरीका जिसमें गति, टोन, एक्सेंट और उच्चारण के निर्देशों का पालन किया जाता है।

आवाज़ें और भाषाएँ

उपलब्ध आवाज़ें प्रदाता के अनुसार भिन्न होती हैं। AI-Public टेक्स्ट से ऑडियो दिखाते समय केवल वही आवाज़ दिखाता है जो चुनी गई भाषा के अनुरूप हों, या बहु-भाषा के लिए उपयुक्त आवाज़। अगर किसी आवाज़ का उद्देश्य केवल कुछ भाषाओं के लिए है, तो आवाज़ के साथ भाषा درج होगी।

OpenAI और Google कैटलॉग में अधिकांश भाषाओं का समर्थन करते हैं। Voxtral Mini TTS एक छोटी-सी भाषाओं की सेट का समर्थन करता है, जिसमें डच, अंग्रेजी, फ्रेंच, स्पेनिश, पुर्तगाली, इतालवी, जर्मन, हिंदी और अरबी शामिल हैं।

सिस्टम-पrompt

टेक्स्ट से ऑडियो के लिए सिस्टम-प्रॉम्प्ट का उपयोग उच्चारण और शैली को नियंत्रित करने के लिए किया जा सकता है। आप उदाहरण के लिए बतला सकते हैं कि डच प्राकृतिक звучना चाहिए, ऐसे शब्द जैसे AI, AI-Public, ChatGPT और OpenAI को अंग्रेज़ी उच्चारण के साथ बोला जाए, या Claude को फ्रेंच नाम के रूप में उच्चारित किया जाए।

प्राथमिकताएँ

यूज़र्स अपनी टेक्स्ट-टू-ऑडियो सेटिंग्स को व्यक्तिगत प्राथमिकताओं के रूप में सेव कर सकते हैं। ताकि मॉडल, भाषा, आवाज और उच्चारण के निर्देश बार-बार चयन न करने पड़े।

वर्तमान कैटलॉग​

क्या एक स्पीच मॉडल निर्धारित करता है​

आवाज़ें और भाषाएँ​

सिस्टम-पrompt​

प्राथमिकताएँ​

वर्तमान कैटलॉग

क्या एक स्पीच मॉडल निर्धारित करता है

आवाज़ें और भाषाएँ

सिस्टम-पrompt

प्राथमिकताएँ