مفت AI لکت مان ڳالھائڻName
31+ اوپن سورس ماڊل، 231+ آواز، 34+ ٻوليون. ڪوبه اڪائونٽ نه گھرجي.
سڀڪنھن شيءِ جو توھان کي آواز AI جي ضرورت آھي
30+ اوپن سورس اي آءِ ماڊلز سان طاقتور اوزار
31+ AI آواز جا ماڊل
اوپن سورس TTS ماڊلز جو سڀ کان جامع مجموعو هڪ پليٽ فارم ۾
Kokoro Free
ڪوڪورو هڪ 82 ملين پاراميٽرن وارو متن کان ڳالهائڻ وارو ماڊل آهي جيڪو پنهنجي وزن جي ڪلاس کان مٿي آهي. پنهنجي ننڍڙي سائيز جي باوجود ، اهو تمام گهڻو قدرتي ۽ اظهاري ڳالهائڻ پيدا ڪري ٿو. ڪوڪورو ڪيترن ئي ٻولين کي سپورٽ ڪري ٿو جن ۾ انگريزي ، جاپاني ، چيني ۽ ڪورين شامل آهن جن ۾ اظهاري آوازن جي تنوع آهي. اهو ڏاڍو تيز هلندو آهي - هڪ GPU تي حقيقي وقت جي ڀيٽ ۾ تقريبن 100x تيز آواز پيدا ڪري ٿو.
ھن لاءِ بهترين: اعليٰ معياري TTS گھٽ ۾ گھٽ دير سان ، اسٽريمنگ ايپليڪيشنون
مفت آزمايو
Piper Free
پيپر هڪ ھلڪو متن کان ڳالھائڻ وارو انجن آهي جيڪو Rhasspy پاران ترقي يافته آهي جيڪو VITS ۽ larynx architectures استعمال ڪري ٿو. اهو مڪمل طور تي سي پي يو تي هلندو آهي، ان کي ايج ڊيوائسز، گھر جي خودڪار، ۽ آف لائن TTS جي ضرورت وارين ايپليڪيشنن لاءِ مثالي بڻائيندو آهي. 30+ ٻولين ۾ 100 کان وڌيڪ آوازن سان، پيپر هڪ Raspberry Pi 4 تي به حقيقي وقت جي رفتار تي طبعي آواز واري ڳالھائڻ مهيا ڪري ٿو.
ھن لاءِ بهترين: جلدي اڳڪٿيون، رسائي، ۽ داخل ٿيل ايپليڪيشنون
مفت آزمايو
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) هڪ متوازي end-to-end TTS طريقو آهي جيڪو موجوده ٻن مرحلن جي ماڊلن جي ڀيٽ ۾ وڌيڪ قدرتي آواز وارو آڊيو پيدا ڪري ٿو. اهو مختلف انفريشن کي قبول ڪري ٿو جيڪو معمولي وهڪري سان وڌايو ويو آهي ۽ هڪ مقابلي واري تربيت واري عمل سان، طبيعت ۾ وڏي بهتري حاصل ڪري ٿو.
ھن لاءِ بهترين: عام مقصد وارو متن- کان- ڳالھائيءَ ڏانھن
مفت آزمايو
MeloTTS Free
MyShell.ai طرفان MeloTTS هڪ ٻن ٻولين جي TTS لائبريري آهي جيڪا انگريزي (آمريڪي، برطانوي، هندي، آسٽريليا)، اسپينش، فرانسيسي، چيني، جاپاني ۽ ڪورين کي سپورٽ ڪري ٿي. اهو تمام تيز آهي، صرف سي پي يو تي حقيقي وقت جي رفتار تي متن کي پروسيس ڪري ٿو. MeloTTS پيداوار جي استعمال لاءِ ٺاهيو ويو آهي ۽ سي پي يو ۽ جي پي يو ٻنهي کي سپورٽ ڪري ٿو.
ھن لاءِ بهترين: پيداوار جون ايپليڪيشنون جن کي جلدي، ڪيترن ٻولين جي TTS جي ضرورت آھي
مفت آزمايو
OuteTTS Free
OuteTTS وڏي ٻولي ماڊل سان متن-to-speech صلاحيتن سان وڌائي ٿو جڏهن ته اصل آرڪائيو کي برقرار رکڻ. اهو ڪيترن ئي backends سميت llama.cpp (CPU / GPU) ، Hugging Face Transformers ، ExLlamaV2 ، VLLM ، ۽ Transformers.js ذريعي برائوزر انفريشن جي حمايت ڪري ٿو. JSON طور محفوظ ڪيل اسپيڪر پروفائلن ذريعي صفر-شوٽ آواز کلوننگ جون خاصيتون.
ھن لاءِ بهترين: ايج ڊسپلين، برائوزر تي ٻڌل TTS، گهٽ وسيلا ماحول
مفت آزمايو
Pocket TTS Free
پوڪ ٽي ٽي ايس ڪيوٽي (موشي جا ٺاھيندڙ) پاران هڪ 100 ايم پي آرٽيڪل-ٽو-سوئچ ماڊل آھي جيڪو پنھنجي وزن کان وڌي ٿو. اھو سي پي يو تي سھڻي طرح هلندو آھي، ھڪ آڊيو نموني مان صفر-شوٽ آواز جي کلوننگ کي مدد ڏيندو آھي، ۽ قدرتي آواز واري ڳالھائي کي پيدا ڪندو آھي. ننڍو ماڊل جي سائيز ان کي ويجھي استعمال ۽ گھٽ وسيلا ماحولن لاءِ مثالي بڻائيندو آھي.
ھن لاءِ بهترين: هلڪو استعمال، صرف سي پي يو ماحول، جلدي آواز جي کلوننگ
مفت آزمايو
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ھن لاءِ بهترين: Fast lightweight TTS, edge deployment, low-latency applications
مفت آزمايو
Bark Standard
ٽرانسميٽر تي ٻڌل متن کان آڊيو ماڊل جيڪو سچي ڳالھائي، موسيقي ۽ آواز جا اثر پيدا ڪري ٿو.
ڊيولپر: Suno · لائسنس: MIT
ڪوشش ڪريو
Bark Small Standard
بارڪ جو هلڪو ورزن تيز استنباط ۽ گهٽ يادگار استعمال سان.
ڊيولپر: Suno · لائسنس: MIT
ڪوشش ڪريو
CosyVoice 2 Standard
Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency.
ڊيولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0
ڪوشش ڪريو
Dia TTS Standard
ملٽي اسپيڪر ڊالوگ پيدا ڪرڻ وارو ماڊل جيڪو اسپيڪر جي وچ ۾ قدرتي گفتگو پيدا ڪري ٿو.
ڊيولپر: Nari Labs · لائسنس: Apache 2.0
ڪوشش ڪريو
Parler TTS Standard
اوھان کي گھرجي ته آواز کي قدرتي ٻوليءَ ۾ بيان ڪريو ۽ پارلر مطابقت رکندڙ آواز پيدا ڪندو.
ڊيولپر: Hugging Face · لائسنس: Apache 2.0
ڪوشش ڪريو
GLM-TTS Standard
اوپن سورس TTS ماڊلن ۾ تمام گهٽ ڪارڪردگي غلطي جي شرح حاصل ڪري ٿو.
ڊيولپر: Zhipu AI · لائسنس: GLM-4 License
ڪوشش ڪريو
IndexTTS-2 Standard
Zero-shot TTS fine-grained احساس ڪنٽرول ۽ اعلي اظهار سان.
ڊيولپر: Index Team · لائسنس: Bilibili Model License
ڪوشش ڪريو
Spark TTS Standard
آواز جي ڪلوننگ TTS ڪنٽرول ٿيل احساس ۽ ڳالهائڻ جي انداز سان پروموشنز ذريعي.
ڊيولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0
ڪوشش ڪريو
GPT-SoVITS Standard
ٿورڙي شاٽ آواز ڪلوننگ TTS جيڪو ڪنهن به آواز کي رڳو 5 سيڪنڊن جي آڊيو مان نقل ڪري ٿو.
ڊيولپر: RVC-Boss · لائسنس: MIT
ڪوشش ڪريو
Orpheus Standard
انسان جي سطح جو احساساتي TTS ماڊل 100K ڪلاڪن جي ڳالهائڻ جي ڊيٽا تي تربيت ڏنل.
ڊيولپر: Canopy Labs · لائسنس: Llama 3.2 Community
ڪوشش ڪريو
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ڊيولپر: Alibaba (Qwen) · لائسنس: Apache 2.0
ڪوشش ڪريو
Chatterbox Turbo Standard
200ms جي دير سان تيز چيٽ باڪس ۽ کلڻ، ڪُوڙڻ ۽ وڌيڪ لاءِ پارالنگويسٽڪ ٽيگ.
ڊيولپر: Resemble AI · لائسنس: MIT
ڪوشش ڪريو
Dia 2 Standard
ٽٽس جو پهريون سٽنگ-پرينٽ مباحثو، ڪيترن ئي ڳالهائيندڙن سان گفتگو ۽ پارالنگويسٽڪ اشارن سان.
ڊيولپر: Nari Labs · لائسنس: Apache 2.0
ڪوشش ڪريو
VoxCPM Standard
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
ڊيولپر: OpenBMB · لائسنس: Apache 2.0
ڪوشش ڪريو
TADA Standard
صفر-هلوسينيشن TTS سان متن-آڪسٽڪ ڊبل الائنس، 5x تيز تيز LLM TTS کان وڌيڪ.
ڊيولپر: Hume AI · لائسنس: MIT
ڪوشش ڪريو
VibeVoice Standard
مائڪروسافٽ ماڊل ڊگھي فارم جي ملٽي اسپيڪر مواد جهڙوڪ پوڊ ڪاسٽ ۽ آڊيو ڪتابن لاءِ.
ڊيولپر: Microsoft · لائسنس: MIT
ڪوشش ڪريو
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ڊيولپر: Alibaba (FunAudioLLM) · لائسنس: Apache 2.0
ڪوشش ڪريو
CosyVoice 2
Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency.
ٻوليون: en, zh, ja, ko, fr, de, it, es
آواز کلون ڪريو
GLM-TTS
اوپن سورس TTS ماڊلن ۾ تمام گهٽ ڪارڪردگي غلطي جي شرح حاصل ڪري ٿو.
ٻوليون: en, zh
آواز کلون ڪريو
Spark TTS
آواز جي ڪلوننگ TTS ڪنٽرول ٿيل احساس ۽ ڳالهائڻ جي انداز سان پروموشنز ذريعي.
ٻوليون: en, zh
آواز کلون ڪريو
GPT-SoVITS
ٿورڙي شاٽ آواز ڪلوننگ TTS جيڪو ڪنهن به آواز کي رڳو 5 سيڪنڊن جي آڊيو مان نقل ڪري ٿو.
ٻوليون: en, zh, ja, ko
آواز کلون ڪريو
Chatterbox
State-of-the-art zero-shot آواز ڪلوننگ احساس ڪنٽرول سان Resemble AI کان.
ٻوليون: en
آواز کلون ڪريو
Tortoise TTS
ڪيترن ئي آوازن واري متن کان ڳالهائڻ جي معيار تي ڌيان ڏنو ويو آهي autoregressive architecture سان.
ٻوليون: en
آواز کلون ڪريو
OpenVoice
فوري آوازن جو کلوننگ شڪل، احساس، ۽ ڌيان تي ڪنٽرول سان.
ٻوليون: en, zh, ja, ko, fr, de, es, it
آواز کلون ڪريو
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ٻوليون: en, zh, ja, ko, de, fr, ru, pt, es, it
آواز کلون ڪريو
Chatterbox Turbo
200ms جي دير سان تيز چيٽ باڪس ۽ کلڻ، ڪُوڙڻ ۽ وڌيڪ لاءِ پارالنگويسٽڪ ٽيگ.
ٻوليون: en
آواز کلون ڪريو
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
ٻوليون: en, zh
آواز کلون ڪريو
OuteTTS
LLM تي ٻڌل TTS جيڪو CPU، GPU، يا برائوزر ذريعي llama.cpp ۽ Transformers.js ذريعي هلندو آهي.
ٻوليون: en
آواز کلون ڪريو
Pocket TTS
ھڪڙي نموني مان آواز جي کلوننگ سان Kyutai طرفان ھڪڙو ھلڪو 100M پاراميٽر ماڊل.
ٻوليون: en, fr
آواز کلون ڪريو
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ٻوليون: en, zh, ja, ko, de, es, fr, it, ru
آواز کلون ڪريو
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ٻوليون: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
آواز کلون ڪريو
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ٻوليون: en, zh
آواز کلون ڪريوڊيولپر-پھرين API
OpenAI-compatible REST API. One endpoint, 22+ models. Streaming support for real-time applications.
- OpenAI مطابقت رکندڙ شڪل
- ريئل ٽائيم ايپليڪيشنن لاءِ TTS اسٽريمنگ
- وڏين ڪمن لاءِ بيٽ پروسيس
- Webhook اطلاع
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
سادو، شفاف قيمت
مفت شروع ڪريو. جيئن وڌي رهيا آهيو.
گھڻا پڇيا ويندا سوال
What could we improve? Your feedback helps us fix issues.
AI آواز استعمال ڪرڻ اڄ شروع ڪريو
TTS.ai استعمال ڪندي ٺاھيندڙن، ڊيولپرن ۽ ڪاروبار سان شامل ٿيو