مفت AI تحریر سے کلام
31+ اوپن سورس ماڈلز، 231+ آوازیں، 34+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.
آواز AI کے ليے آپ کو جو ضرورت هے
30+ ٹولز اوپن سورس AI ماڈلز سے طاقتور
31+ AI آواز ماڈل
ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ
Kokoro Free
کوکورو 82 ميليون پارامٹر ٹیکس-تو- اسپيچ ماڈل هے جو اسکے وزن کلاس سے اوپر خوبي طرح سے مچتا هے اسکے چھوٹے سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا
بہترین: کم سے کم لاٹنسی کے ساتھ اعلیٰ معیار TTS، اسٹریمنگ ایپلیکیشنز
مفت آزمائیں
Piper Free
پيپر رال سس پي کے ذريعے ترقي يافته ھيں جو VITS اور larynx architectures کا استعمال کر تا هے ۔ یہ پورے طور پر سي پي يو پر چلتا هے ، اس کو ايج ڈیوائس ، گھري خودکاري ، اور آپريشنز کے ليے مثالي بنا تا هے جن کو آف لائن TTS کا احتياج هے ۔ 30+ زبانوں میں 100 سے زائد آوازوں کے ساتھ ، پيپر رال سس پي 4 پر بھی ريئل ٽائم رفتار پر فطري آوازوں کا اظہار کر تا هے ۔
بہترین: تیز پیش نگوئی، رسائی، اور شامل ایپلیکیشنز
مفت آزمائیں
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ایک متوازی انتہا سے انتہا تک TTS طریقہ کار ہے جو کہ دو مرحلہ ماڈل سے زیادہ قدرتی آواز کی آڈیو پیدا کرتا ہے یہ variation inference کو قبول کرتا ہے جو کہ normalizing flows اور ایک مخالف تربیت کے عمل کے ساتھ بڑھایا جاتا ہے، جس سے قدرتی میں ایک اہم بہتری حاصل ہوتی ہے.
بہترین: عام مقصد کا متن-سے-زبان با فطری پروسوڈی
مفت آزمائیں
MeloTTS Free
MyShell.ai کے طرف سے MeloTTS ایک کثیر زبانوں TTS لائبريري ہے جو انگريزي (امريکائي، برطانوي، هندي، آسٽريليائي)، اسپيني، فرانسيسي، چيني، جاپاني اور کو رياني کو مدد دے سکتی هے ۔ یہ انتہائي تیز ہے ، صرف سي پي يو پر تقريباً ريئل ٹائم رفتار پر متن پروسيس کر سکتی هے ۔ MeloTTS پروڈکشن استعمال کے ليے بنا يا گيا هے اور سي پي يو اور جي پي يو دو کے ليے مدد دے سکتی هے ۔
بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے
مفت آزمائیں
OuteTTS Free
OuteTTS اصل فن تعمير کو محفوظ رکھتے ہوئے متن سے بولنے کی صلاحیتوں کے ساتھ بڑے زباني ماڈل کو پھیلا تا هے ۔ یہ مختلف باقائدہ گيوں کو مدد دیتا هے جن ميں llama.cpp (CPU/GPU) ، Hugging Face Transformers ، ExLlamaV2 ، VLLM ، اور Transformers.js کے ذریعے براؤزر انفريشن شامل هے ۔ JSON کے طور پر محفوظ کئے گئے اسپيکر پروفا ئل کے ذریعے صفر شوٹ ويز کلوننگ کي خاصيت هے ۔
بہترین: ایج ڈیبائیلنگ، براؤزر-بنا ہوا TTS، کم وسعت ماحول
مفت آزمائیں
Pocket TTS Free
پوک ٹي ٹی ايس کيو ٹائ ( مو شي کے بنا ئے والے) کے ذريعے 100 ميگا با ڑي پيراميٹر ٹیکس- ٹو- اسپيچ ماڈل هے جو اس کے وزن سے زياد گيں ۔ یہ سي پي يو پر موثر طور پر چلتا هے ، ایک واحد او ڊيو نمونے سے صفر شوٹ ويز کلوننگ کي مدد کرتا هے اور فطري آواز کا آواز بناتا هے ۔ چھوٹا ماڈل سايز اس کو ايج ڈیبائيلنگ اور کم وسيله والا ماحول کے ليے مثالي بنا تا هے
بہترین: ہلکا ڈیبلوپمنٹ، CPU-only ماحول، تیز آواز کلوننگ
مفت آزمائیں
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
بہترین: Fast lightweight TTS, edge deployment, low-latency applications
مفت آزمائیں
Bark Standard
ترانسفر برائے متن آ ديو ماڈل جو سچائيء بات، موسیقی اور آواز کے اثرات پيدا کر تا هے
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
Bark Small Standard
Bark کا کم وزن ورژن تیز تر انفریکشن اور کم یادداشت استعمال کے ساتھ
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
CosyVoice 2 Standard
انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.
ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0
اس کی کوشش کرو
Dia TTS Standard
کثیر اسپیکر ڈائیلاگ پیداوار ماڈل جو اسپیکروں کے درمیان قدرتی گفتگو بناتا ہے.
ڈیولپر: Nari Labs · لائسنس: Apache 2.0
اس کی کوشش کرو
Parler TTS Standard
آپ کو فطری زبان میں آواز کا بیان کرنا ہے اور Parler مطابقت والی بات پیدا کرتی ہے.
ڈیولپر: Hugging Face · لائسنس: Apache 2.0
اس کی کوشش کرو
GLM-TTS Standard
اوپن سورس TTS ماڈلز کے درمیان سب سے کم حرف غلطی کی شرح حاصل کرتا ہے.
ڈیولپر: Zhipu AI · لائسنس: GLM-4 License
اس کی کوشش کرو
IndexTTS-2 Standard
صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.
ڈیولپر: Index Team · لائسنس: Bilibili Model License
اس کی کوشش کرو
Spark TTS Standard
آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.
ڈیولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0
اس کی کوشش کرو
GPT-SoVITS Standard
چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.
ڈیولپر: RVC-Boss · لائسنس: MIT
اس کی کوشش کرو
Orpheus Standard
انسانی سطح پر جذباتی TTS ماڈل 100K گھنٹوں پر تربیت دی گئی کلام کے اعداد و شمار.
ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community
اس کی کوشش کرو
Qwen3 TTS Standard
علی بابا کا متعدد زبانوں کا TTS آواز کلوننگ کے ساتھ، پیشہ ور آوازیں، اور متن سے آواز ڈیزائن.
ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0
اس کی کوشش کرو
Chatterbox Turbo Standard
جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.
ڈیولپر: Resemble AI · لائسنس: MIT
اس کی کوشش کرو
Dia 2 Standard
متعدد اسپیکروں کے ساتھ گفتگو اور paralinguistic کوئس کے ساتھ سٹوریم-پہلی گفتگو TTS.
ڈیولپر: Nari Labs · لائسنس: Apache 2.0
اس کی کوشش کرو
VoxCPM Standard
Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency
ڈیولپر: OpenBMB · لائسنس: Apache 2.0
اس کی کوشش کرو
TADA Standard
ٹیسٹ-آکوسٹک ڈبل الائنمنٹ کے ساتھ صفر-ہوسکلیشن ٹی ٹی ایس، قابل قیاس ایل ایل ایم ٹی ٹی ایس سے 5x تیز.
ڈیولپر: Hume AI · لائسنس: MIT
اس کی کوشش کرو
VibeVoice Standard
مائیکروسافٹ ماڈل طویل فارم ملٹی اسپیکر مواد کے لیے جیسے پوڈکاسٹ اور اوڈیو بک.
ڈیولپر: Microsoft · لائسنس: MIT
اس کی کوشش کرو
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ڈیولپر: Alibaba (FunAudioLLM) · لائسنس: Apache 2.0
اس کی کوشش کرو
CosyVoice 2
انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.
زبانیں: en, zh, ja, ko, fr, de, it, es
آواز
Spark TTS
آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.
زبانیں: en, zh
آواز
GPT-SoVITS
چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.
زبانیں: en, zh, ja, ko
آواز
Chatterbox
ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.
زبانیں: en
آواز
Tortoise TTS
متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.
زبانیں: en
آواز
OpenVoice
براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.
زبانیں: en, zh, ja, ko, fr, de, es, it
آواز
Qwen3 TTS
علی بابا کا متعدد زبانوں کا TTS آواز کلوننگ کے ساتھ، پیشہ ور آوازیں، اور متن سے آواز ڈیزائن.
زبانیں: en, zh, ja, ko, de, fr, ru, pt, es, it
آواز
Chatterbox Turbo
جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.
زبانیں: en
آواز
VoxCPM
Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency
زبانیں: en, zh
آواز
OuteTTS
LLM پر مبنی TTS جو CPU، GPU، يا براؤزر پر چلتا هے llama.cpp اور Transformers.js کے ذریعے
زبانیں: en
آواز
Pocket TTS
ایک واحد نمونے سے آواز کلوننگ کے ساتھ Kyutai کے ذریعے ہلکا 100M پیرامیٹر ماڈل
زبانیں: en, fr
آواز
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
زبانیں: en, zh, ja, ko, de, es, fr, it, ru
آواز
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
زبانیں: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
آواز
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
زبانیں: en, zh
آوازڈیولپر-فیئر API
ایک انتہا نقطہ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.
- OpenAI سازگار فارمیٹ
- ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
- بڑے کاموں کے لیے بیچ پروسیسنگ
- Webhook اطلاعیں
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
سادہ، شفافیت قیمت
آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.
مفت
15 کریڈٹ
- Kokoro, Piper, VITS, MeloTTS
- 500 حروف کی حد
- 3 جن/ گھنٹہ (کوئی اکاؤنٹ نہیں)
پرو
2000 کریڈٹس/مہينا
- شروع کرنے میں سب کچھ
- API رسائی
- ترجیحی پروسیسنگ
بار بار پوچھے گئے سوالات
ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.
AI آواز استعمال کرنا آج شروع کریں
TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں