مفت AI تحریر سے کلام
33+ اوپن سورس ماڈلز، 273+ آوازیں، 33+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.
آواز AI کے ليے آپ کو جو ضرورت هے
30+ ٹولز اوپن سورس AI ماڈلز سے طاقتور
33+ AI آواز ماڈل
ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ
Kokoro مفت
کوکورو 82 ميليون پارامٹر ٹیکس-تو- اسپيچ ماڈل هے جو اسکے وزن کلاس سے اوپر خوبي طرح سے مچتا هے اسکے چھوٹے سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا
بہترین: کم سے کم لاٹنسی کے ساتھ اعلیٰ معیار TTS، اسٹریمنگ ایپلیکیشنز
مفت آزمائیں
Piper مفت
پيپر رال سس پي کے ذريعے ترقي يافته ھيں جو VITS اور larynx architectures کا استعمال کر تا هے ۔ یہ پورے طور پر سي پي يو پر چلتا هے ، اس کو ايج ڈیوائس ، گھري خودکاري ، اور آپريشنز کے ليے مثالي بنا تا هے جن کو آف لائن TTS کا احتياج هے ۔ 30+ زبانوں میں 100 سے زائد آوازوں کے ساتھ ، پيپر رال سس پي 4 پر بھی ريئل ٽائم رفتار پر فطري آوازوں کا اظہار کر تا هے ۔
بہترین: تیز پیش نگوئی، رسائی، اور شامل ایپلیکیشنز
مفت آزمائیں
VITS مفت
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ایک متوازی انتہا سے انتہا تک TTS طریقہ کار ہے جو کہ دو مرحلہ ماڈل سے زیادہ قدرتی آواز کی آڈیو پیدا کرتا ہے یہ variation inference کو قبول کرتا ہے جو کہ normalizing flows اور ایک مخالف تربیت کے عمل کے ساتھ بڑھایا جاتا ہے، جس سے قدرتی میں ایک اہم بہتری حاصل ہوتی ہے.
بہترین: عام مقصد کا متن-سے-زبان با فطری پروسوڈی
مفت آزمائیں
MeloTTS مفت
MyShell.ai کے طرف سے MeloTTS ایک کثیر زبانوں TTS لائبريري ہے جو انگريزي (امريکائي، برطانوي، هندي، آسٽريليائي)، اسپيني، فرانسيسي، چيني، جاپاني اور کو رياني کو مدد دے سکتی هے ۔ یہ انتہائي تیز ہے ، صرف سي پي يو پر تقريباً ريئل ٹائم رفتار پر متن پروسيس کر سکتی هے ۔ MeloTTS پروڈکشن استعمال کے ليے بنا يا گيا هے اور سي پي يو اور جي پي يو دو کے ليے مدد دے سکتی هے ۔
بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے
مفت آزمائیں
Kani TTS 2 مفت
Kani-TTS-2 by NineNineSix ایک الٹرا-ہلکا وزن 400M پیرامیٹر ماڈل ہے جو NVIDIA NanoCodec کے ساتھ Liquid AI LFM2 backbone پر بنایا گیا ہے یہ صرف 3GB VRAM میں چلتا ہے اور A100 (RTF 0.2) پر ~2 ثانیوں میں ~10 سیکنڈ کی بات کا اظہار کرتا ہے.حالی میں عوامی رلیز صرف انگریزی میں `kani-tts-2-en` چک پوائنٹ بھیجتا ہے اور آواز کے کلوننگ کے لئے ضروری اسپیکر-امباڈینگ ہوک کو ظاہر نہیں کرتا - کلوننگ کے لئے Chatterbox / IndexTTS2 / F5-TTS استعمال کریں، یا غیر انگریزی کے لئے Kokoro / MeloTTS.
بہترین: کم VRAM ہارڈ ویئر پر تیز انگریزی پیداوار، تیز پیش نگوئی
مفت آزمائیں
OuteTTS مفت
OuteTTS اصل فن تعمير کو محفوظ رکھتے ہوئے متن سے بولنے کی صلاحیتوں کے ساتھ بڑے زباني ماڈل کو پھیلا تا هے ۔ یہ مختلف باقائدہ گيوں کو مدد دیتا هے جن ميں llama.cpp (CPU/GPU) ، Hugging Face Transformers ، ExLlamaV2 ، VLLM ، اور Transformers.js کے ذریعے براؤزر انفريشن شامل هے ۔ JSON کے طور پر محفوظ کئے گئے اسپيکر پروفا ئل کے ذریعے صفر شوٹ ويز کلوننگ کي خاصيت هے ۔
بہترین: ایج ڈیبائیلنگ، براؤزر-بنا ہوا TTS، کم وسعت ماحول
مفت آزمائیں
Pocket TTS مفت
پوک ٹي ٹی ايس کيو ٹائ ( مو شي کے بنا ئے والے) کے ذريعے 100 ميگا با ڑي پيراميٹر ٹیکس- ٹو- اسپيچ ماڈل هے جو اس کے وزن سے زياد گيں ۔ یہ سي پي يو پر موثر طور پر چلتا هے ، ایک واحد او ڊيو نمونے سے صفر شوٹ ويز کلوننگ کي مدد کرتا هے اور فطري آواز کا آواز بناتا هے ۔ چھوٹا ماڈل سايز اس کو ايج ڈیبائيلنگ اور کم وسيله والا ماحول کے ليے مثالي بنا تا هے
بہترین: ہلکا ڈیبلوپمنٹ، CPU-only ماحول، تیز آواز کلوننگ
مفت آزمائیں
Kitten TTS مفت
Kitten TTS by KittenML ONNX پر بنا يا گيا هے اور 15M سے 80M پرائمر کے تغيرات کے ساتھ (25-80 MB ڈسک پر) CPU پر GPU کے ضرورت کے بغیر اعليٰ معيار کی آواز سنتھز فراہم کر تا هے 8 اندروني آوازوں ، انکشاف گير آواز کی رفتار اور نمبروں ، رقموں اور يونٹوں کے ليے اندروني متن پراپرائزنگ کے خاصيتوں کے ساتھ ايج ڈیبائيلنگ اور کم ليٹنسي ايپليکيشنز کے ليے ايڈفائيڈ
بہترین: تیز ہلکا TTS، کنارے کی نشر، کم-لائٹینیٹی ایپلیکیشنز
مفت آزمائیں
Ming-Omni TTS مفت
InclusionAI کے ذريعے Ming-omni-tts-0.5B BailingMM کے گھنے پسماند پر بنا يا گيا هے جو پيچ-بائي پچ فلو-مطابق آ ڊيو دي کوڈر کے ساتھ 44.1kHz آ وٹ پٹ (CD کي معيار کے قریب) ديا تا هے ، 3+ سيکنڈ ريفرنس سے صفر شوٹ ويز کلونينگ کو مدد دیتا هے اور JSON اشاروں کے ذریعے بنا يا گيا احساس / ڈالیکٹ / BGM کنٹرول شامل کر تا هے ۔ چيني بينک مارکز پر 0.83% WER کا ممتاز استحکام ۔
بہترین: اعلیٰ وفاداری دو زبانوں کی روایت، جذبات سے کنٹرول آواز اداکاری، چینی اوڈیو بک مواد
مفت آزمائیں
MOSS-TTS Nano مفت
MOSS-TTS-Nano-100M MOSS-TTS خاندان کا OpenMOSS کا کمپیکٹ 100M-پرامیٹر قسم ہے، وقفہ-ترمیم ساز فن تعمیر کو شریک کرتا ہے. 8B ماڈل کی اعلیٰ معیار ~80x چھوٹے وزن کے لئے تجارت کرتا ہے اور حیرت انگیز طور پر کم پر-دعا VRAM، اسے فری-تیئر اور اعلیٰ-تھروپٹ ڈیپلوماتز کے لئے مناسب بناتا ہے. یہی 20 زبانوں کی حد.
بہترین: فری ٹیئر ٹی ٹی ایس، اعلی حجم کی پیداوار، کم لیٹنسی تعاملی استعمال
مفت آزمائیں
Bark معیار
ترانسفر برائے متن آ ديو ماڈل جو سچائيء بات، موسیقی اور آواز کے اثرات پيدا کر تا هے
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
Bark Small معیار
Bark کا کم وزن ورژن تیز تر انفریکشن اور کم یادداشت استعمال کے ساتھ
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
CosyVoice 2 معیار
انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.
ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0
اس کی کوشش کرو
Dia TTS معیار
کثیر اسپیکر ڈائیلاگ پیداوار ماڈل جو اسپیکروں کے درمیان قدرتی گفتگو بناتا ہے.
ڈیولپر: Nari Labs · لائسنس: Apache 2.0
اس کی کوشش کرو
Parler TTS معیار
آپ کو فطری زبان میں آواز کا بیان کرنا ہے اور Parler مطابقت والی بات پیدا کرتی ہے.
ڈیولپر: Hugging Face · لائسنس: Apache 2.0
اس کی کوشش کرو
IndexTTS-2 معیار
صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.
ڈیولپر: Index Team · لائسنس: Bilibili Model License
اس کی کوشش کرو
Spark TTS معیار
آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.
ڈیولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0
اس کی کوشش کرو
GPT-SoVITS معیار
چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.
ڈیولپر: RVC-Boss · لائسنس: MIT
اس کی کوشش کرو
Orpheus معیار
انسانی سطح پر جذباتی TTS ماڈل 100K گھنٹوں پر تربیت دی گئی کلام کے اعداد و شمار.
ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community
اس کی کوشش کرو
Qwen3 TTS معیار
علی بابا کا متعدد زبانوں کا TTS پیشہ ور آوازوں اور متن سے آواز ڈیزائن کے ساتھ.
ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0
اس کی کوشش کرو
VieNeu-TTS-v2 معیار
ويتنامي + انگريزي کوڈ-سوچنگ TTS 7 پرائزٹ آوازوں اور صفر-شٹ آواز کلوننگ کے ساتھ صرف سي پي يو ، کوئی GPU کا احتياج نہیں
ڈیولپر: Phạm Nguyễn Ngọc Bảo · لائسنس: Apache 2.0
اس کی کوشش کرو
Chatterbox Turbo معیار
جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.
ڈیولپر: Resemble AI · لائسنس: MIT
اس کی کوشش کرو
VoxCPM معیار
Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency
ڈیولپر: OpenBMB · لائسنس: Apache 2.0
اس کی کوشش کرو
VibeVoice معیار
مائیکروسافٹ ماڈل طویل فارم ملٹی اسپیکر مواد کے لیے جیسے پوڈکاسٹ اور اوڈیو بک.
ڈیولپر: Microsoft · لائسنس: MIT
اس کی کوشش کرو
CosyVoice3 معیار
اگلے نسل کی متعدد زبانوں کی TTS باے-سٹریمینگ، جذباتی کنٹرول، اور صفر-شٹ وائٹ کلونینگ کے ساتھ.
ڈیولپر: Alibaba (FunAudioLLM) · لائسنس: Apache 2.0
اس کی کوشش کرو
NAMAA Saudi TTS معیار
پہلا کھلا سعودی عربی TTS. چاٹر باکس-کیولٹی وائٹ کلونینگ کے ساتھ مقامی سعودی ڈالیکٹ.
ڈیولپر: NAMAA Space · لائسنس: MIT
اس کی کوشش کرو
Darwin TTS معیار
کراس-موڈل Qwen3-TTS متغیر FFN وزن کے ساتھ Qwen3-1.7B زبان ماڈل سے ملے ہوئے تیز متعدد زبانوں کے کلوننگ کے لئے.
ڈیولپر: FINAL-Bench · لائسنس: Apache 2.0
اس کی کوشش کرو
MOSS-TTSD معیار
ملٹی اسپیکر ڈائیلاگ کونٹینیشن ماڈل — پوڈکاسٹ-سٹائل گفتگو پیدا کریں 5 اسپیکروں اور 60 منٹ کے ساتھ منسلک آڈیو کے ساتھ.
ڈیولپر: OpenMOSS · لائسنس: Apache 2.0
اس کی کوشش کرو
CosyVoice 2
انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.
زبانیں: en, zh, ja, ko, fr, de, it, es
آواز
Spark TTS
آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.
زبانیں: en, zh
آواز
GPT-SoVITS
چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.
زبانیں: en, zh, ja, ko
آواز
Chatterbox
ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.
زبانیں: en
آواز
Tortoise TTS
متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.
زبانیں: en
آواز
OpenVoice
براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.
زبانیں: en, zh, ja, ko, fr, es
آواز
VieNeu-TTS-v2
ويتنامي + انگريزي کوڈ-سوچنگ TTS 7 پرائزٹ آوازوں اور صفر-شٹ آواز کلوننگ کے ساتھ صرف سي پي يو ، کوئی GPU کا احتياج نہیں
زبانیں: vi, en
آواز
Chatterbox Turbo
جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.
زبانیں: en
آواز
VoxCPM
Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency
زبانیں: en, zh
آواز
OuteTTS
LLM پر مبنی TTS جو CPU، GPU، يا براؤزر پر چلتا هے llama.cpp اور Transformers.js کے ذریعے
زبانیں: en
آواز
Pocket TTS
ایک واحد نمونے سے آواز کلوننگ کے ساتھ Kyutai کے ذریعے ہلکا 100M پیرامیٹر ماڈل
زبانیں: en, fr
آواز
CosyVoice3
اگلے نسل کی متعدد زبانوں کی TTS باے-سٹریمینگ، جذباتی کنٹرول، اور صفر-شٹ وائٹ کلونینگ کے ساتھ.
زبانیں: en, zh, ja, ko, de, es, fr, it, ru
آواز
NAMAA Saudi TTS
پہلا کھلا سعودی عربی TTS. چاٹر باکس-کیولٹی وائٹ کلونینگ کے ساتھ مقامی سعودی ڈالیکٹ.
زبانیں: ar
آواز
Darwin TTS
کراس-موڈل Qwen3-TTS متغیر FFN وزن کے ساتھ Qwen3-1.7B زبان ماڈل سے ملے ہوئے تیز متعدد زبانوں کے کلوننگ کے لئے.
زبانیں: en, ko, ja, zh
آواز
MOSS-TTSD
ملٹی اسپیکر ڈائیلاگ کونٹینیشن ماڈل — پوڈکاسٹ-سٹائل گفتگو پیدا کریں 5 اسپیکروں اور 60 منٹ کے ساتھ منسلک آڈیو کے ساتھ.
زبانیں: en, zh
آواز
Ming-Omni TTS
44.1kHz کے اعلیٰ وفاداری اور صفر شوٹ وائٹ کلونینگ کے ساتھ InclusionAI سے کمپیکٹ 0.5B Omni-Modal اسپیچ ماڈل
زبانیں: en, zh
آواز
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — یہی فن تعمیر، 80x چھوٹا، فری ٹیئر لیٹنسی.
زبانیں: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
آوازڈیولپر-فیئر API
ایک انتہا نقطہ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.
- OpenAI سازگار فارمیٹ
- ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
- بڑے کاموں کے لیے بیچ پروسیسنگ
- Webhook اطلاعیں
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
سادہ، شفافیت قیمت
آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.
مفت
15,000 حروف + 5,000/دن
- 7 مفت ماڈل Kokoro شامل
- 5000 حروف پر نسل
- API رسائی شامل ہے
پرو
2000 کریڈٹس/مہينا
- شروع کرنے میں سب کچھ
- API رسائی
- ترجیحی پروسیسنگ
بار بار پوچھے گئے سوالات
ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.
AI آواز استعمال کرنا آج شروع کریں
TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں