टेक्स्ट-टू-स्पीच मॉडल्स
AI-Public टेक्स्ट-टू-स्पीच मॉडलों का समर्थन करता है जिनसे टेक्स्ट को ऑडियो में बदला जा सकता है। ये मॉडल डैशबोर्ड पर टेक्स्ट टू ऑडियो और चैट से ऑडियो जनरेट करने वाली सुविधाओं में उपयोग होते हैं।
वर्तमान कैटलॉग
| प्रदाता | मॉडल | टिप्पणी |
|---|---|---|
| OpenAI | GPT-4o mini TTS | प्राकृतिक-सी आवाज़ के साथ उचित टोन और स्टाइल नियंत्रण। |
| Gemini 3.1 Flash TTS Preview | नया Gemini-टेक्स्ट-टू-स्पीच मॉडल स्टाइल, गति और टोन पर सटीक नियंत्रण के साथ। | |
| European AI | Voxtral Mini TTS | Mistral Voxtral Mini पर आधारित यूरोपीय टेक्स्ट-टू-स्पीच। |
Claude के पास कैटलॉग में अपना स्वयं का टेक्स्ट-टू-स्पीच मॉडल नहीं है। अगर Claude प्रदाता के रूप में सक्षम है, तो स्पीच मॉडेल अन्यConfigured प्रदाताओं पर निर्भर रहते हैं।
क्या एक स्पीच मॉडल निर्धारित करता है
एक स्पीच मॉडल यह निर्धारित करता है कि टेक्स्ट कैसे उच्चारण किया जाएगा और कौन-कौन से विकल्प उपलब्ध होंगे। विचार करें:
- उपलब्ध आवाज़ें;
- वे भाषाएँ जिनका एक आवाज़ समर्थन करती है;
- उच्चारण की गुणवत्ता और प्राकृतिकता;
- वह तरीका जिसमें गति, टोन, एक्सेंट और उच्चारण के निर्देशों का पालन किया जाता है।
आवाज़ें और भाषाएँ
उपलब्ध आवाज़ें प्रदाता के अनुसार भिन्न होती हैं। AI-Public टेक्स्ट से ऑडियो दिखाते समय केवल वही आवाज़ दिखाता है जो चुनी गई भाषा के अनुरूप हों, या बहु-भाषा के लिए उपयुक्त आवाज़। अगर किसी आवाज़ का उद्देश्य केवल कुछ भाषाओं के लिए है, तो आवाज़ के साथ भाषा درج होगी।
OpenAI और Google कैटलॉग में अधिकांश भाषाओं का समर्थन करते हैं। Voxtral Mini TTS एक छोटी-सी भाषाओं की सेट का समर्थन करता है, जिसमें डच, अंग्रेजी, फ्रेंच, स्पेनिश, पुर्तगाली, इतालवी, जर्मन, हिंदी और अरबी शामिल हैं।