مفت AI تحریر سے کلام

20+ اوپن سورس ماڈلز، 107+ آوازیں، 32+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.

1K+
بنانے والے
2K+
نسلیں
20+
AI ماڈل
107+
آوازیں
0/500 حروف مفت
5,000 chars per generation 15000 مفت حروف کوئی کریڈٹ کارڈ نہیں تجارتی استعمال ٹھیک ہے
Sign up free
0:00 / 0:00
آڈیو ڈاؤن لوڈ کریں رابطہ 24 گھنٹوں میں ختم ہو جاتا ہے
TTS.ai کی طرح؟ اپنے دوستوں کو بتاو!

آواز AI کے ليے آپ کو جو ضرورت هے

30+ ٹولز اوپن سورس AI ماڈلز سے طاقتور

20+ AI آواز ماڈل

ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ

KokoroKokoro Free

کوکورو 82 ميليون پارامٹر ٹیکس-تو- اسپيچ ماڈل هے جو اسکے وزن کلاس سے اوپر خوبي طرح سے مچتا هے اسکے چھوٹے سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا

بہترین: کم سے کم لاٹنسی کے ساتھ اعلیٰ معیار TTS، اسٹریمنگ ایپلیکیشنز

مفت آزمائیں

PiperPiper Free

پيپر رال سس پي کے ذريعے ترقي يافته ھيں جو VITS اور larynx architectures کا استعمال کر تا هے ۔ یہ پورے طور پر سي پي يو پر چلتا هے ، اس کو ايج ڈیوائس ، گھري خودکاري ، اور آپريشنز کے ليے مثالي بنا تا هے جن کو آف لائن TTS کا احتياج هے ۔ 30+ زبانوں میں 100 سے زائد آوازوں کے ساتھ ، پيپر رال سس پي 4 پر بھی ريئل ٽائم رفتار پر فطري آوازوں کا اظہار کر تا هے ۔

بہترین: تیز پیش نگوئی، رسائی، اور شامل ایپلیکیشنز

مفت آزمائیں

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ایک متوازی انتہا سے انتہا تک TTS طریقہ کار ہے جو کہ دو مرحلہ ماڈل سے زیادہ قدرتی آواز کی آڈیو پیدا کرتا ہے یہ variation inference کو قبول کرتا ہے جو کہ normalizing flows اور ایک مخالف تربیت کے عمل کے ساتھ بڑھایا جاتا ہے، جس سے قدرتی میں ایک اہم بہتری حاصل ہوتی ہے.

بہترین: عام مقصد کا متن-سے-زبان با فطری پروسوڈی

مفت آزمائیں

MeloTTSMeloTTS Free

MyShell.ai کے طرف سے MeloTTS ایک کثیر زبانوں TTS لائبريري ہے جو انگريزي (امريکائي، برطانوي، هندي، آسٽريليائي)، اسپيني، فرانسيسي، چيني، جاپاني اور کو رياني کو مدد دے سکتی هے ۔ یہ انتہائي تیز ہے ، صرف سي پي يو پر تقريباً ريئل ٹائم رفتار پر متن پروسيس کر سکتی هے ۔ MeloTTS پروڈکشن استعمال کے ليے بنا يا گيا هے اور سي پي يو اور جي پي يو دو کے ليے مدد دے سکتی هے ۔

بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے

مفت آزمائیں

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

Bark SmallBark Small Standard

Bark کا کم وزن ورژن تیز تر انفریکشن اور کم یادداشت استعمال کے ساتھ

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0

اس کی کوشش کرو

Dia TTSDia TTS Standard

ملٹی اسپیکر ڈائیلاگ جنریشن ماڈل جو اسپیکرز کے درمیان قدرتی گفتگو بناتا ہے.

ڈیولپر: Nari Labs · لائسنس: Apache 2.0

اس کی کوشش کرو

Parler TTSParler TTS Standard

آپ کو فطری زبان میں آواز کا بیان کرنا ہے اور Parler مطابقت والی بات پیدا کرتی ہے.

ڈیولپر: Hugging Face · لائسنس: Apache 2.0

اس کی کوشش کرو

GLM-TTSGLM-TTS Standard

اوپن سورس TTS ماڈلز کے درمیان سب سے کم حرف غلطی کی شرح حاصل کرتا ہے.

ڈیولپر: Zhipu AI · لائسنس: GLM-4 License

اس کی کوشش کرو

IndexTTS-2IndexTTS-2 Standard

صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.

ڈیولپر: Index Team · لائسنس: Bilibili Model License

اس کی کوشش کرو

Spark TTSSpark TTS Standard

آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.

ڈیولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0

اس کی کوشش کرو

GPT-SoVITSGPT-SoVITS Standard

چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.

ڈیولپر: RVC-Boss · لائسنس: MIT

اس کی کوشش کرو

OrpheusOrpheus Standard

انسانی سطح پر جذباتی TTS ماڈل 100K گھنٹوں پر تربیت دی گئی کلام کے اعداد و شمار.

ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community

اس کی کوشش کرو

Qwen3 TTSQwen3 TTS Standard

علی بابا کا متعدد زبانوں کا TTS آواز کلوننگ کے ساتھ، پیشہ ور آوازیں، اور متن سے آواز ڈیزائن.

ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0

اس کی کوشش کرو

ChatterboxChatterbox Premium

ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.

معیار:

اس کی کوشش کرو

Tortoise TTSTortoise TTS Premium

متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.

معیار:

اس کی کوشش کرو

StyleTTS 2StyleTTS 2 Premium

انسانی سطح کے متن سے بات کرنے کے لئے انداز کے پھیلنے اور مقابلے کی تربیت کے ذریعے.

معیار:

اس کی کوشش کرو

OpenVoiceOpenVoice Premium

براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.

معیار:

اس کی کوشش کرو

Sesame CSMSesame CSM Premium

مناسب وقت اور جذبات کے ساتھ قدرتی گفتگو پیدا کرنے کے لئے گفتگو کے ماڈل.

معیار:

اس کی کوشش کرو

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

زبانیں: en, zh, ja, ko, fr, de, it, es

آواز

GLM-TTSGLM-TTS

اوپن سورس TTS ماڈلز کے درمیان سب سے کم حرف غلطی کی شرح حاصل کرتا ہے.

زبانیں: en, zh

آواز

IndexTTS-2IndexTTS-2

صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.

زبانیں: en, zh

آواز

Spark TTSSpark TTS

آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.

زبانیں: en, zh

آواز

GPT-SoVITSGPT-SoVITS

چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.

زبانیں: en, zh, ja, ko

آواز

ChatterboxChatterbox

ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.

زبانیں: en

آواز

Tortoise TTSTortoise TTS

متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.

زبانیں: en

آواز

OpenVoiceOpenVoice

براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.

زبانیں: en, zh, ja, ko, fr, de, es, it

آواز

Qwen3 TTSQwen3 TTS

علی بابا کا متعدد زبانوں کا TTS آواز کلوننگ کے ساتھ، پیشہ ور آوازیں، اور متن سے آواز ڈیزائن.

زبانیں: en, zh, ja, ko, de, fr, ru, pt, es, it

آواز

ڈیولپر-پہلی API

ایک انتہا نقطہ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.

  • OpenAI سازگار فارمیٹ
  • ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
  • بڑے کاموں کے لیے بیچ پروسیسنگ
  • Webhook اطلاعیں
API دستاویزات دیکھیں
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

سادہ، شفافیت قیمت

آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.

مفت

$0

15 کریڈٹ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 حروف کی حد
  • 3 جن/ گھنٹہ (کوئی اکاؤنٹ نہیں)
مفت میں رجسٹر کریں

شروع

$9/ميگا بائٹ

500 کریڈٹ / ماہ

  • تمام 22+ ماڈل
  • 100,000 chars per generation
  • آواز کا کلوننگ
شروع کریں
سب سے زیادہ مقبول

پرو

$29/ميگا بائٹ

2000 کریڈٹس/مہينا

  • شروع کرنے میں سب کچھ
  • API رسائی
  • ترجیحی پروسیسنگ
پرو

کاروبار

$99/ميگا بائٹ

10,000 کریڈٹس / ماہ

  • پرو میں سب کچھ
  • بلک API
  • ترجیحی قطار
کاروبار حاصل کریں

تمام منصوبے دیکھیں جن میں کریکٹر پک شامل ہیں →

بار بار پوچھے گئے سوالات

TTS.ai سب سے وسیع AI آواز پلیٹ فارم ہے، 22+ متن سے کلام ماڈل، آواز کلوننگ، کلام سے متن، اور آڈیو ٹولز فراہم کرتا ہے۔ تمام ماڈل کوئی ونڈر لاک-ان کے ساتھ اوپن سورس ہیں۔

ہاں! TTS.ai کوکورو، پائپر، وی ٹی ایس اور میلو ٹی ٹی ایس ماڈلز کے ساتھ مفت ٹیکس-ٹو-سپیچ فراہم کرتا ہے۔ کوئی اکاؤنٹ ضروری نہیں ہے۔ 15000 مفت حروف حاصل کرنے اور تمام ماڈلز تک رسائی حاصل کرنے کیلئے رجسٹر کریں۔ ادا کردہ منصوبے $9/مئی سے شروع ہوتے ہیں۔

رفتار کے ليے Kokoro يا Piper استعمال کريں معيار کے ليے CosyVoice2يا StyleTTS2کوش کريں آواز کي کلوننگ کے ليے Chatterbox يا GPT-SoVITS استعمال کريں گفتگو کے ليے Dia TTS استعمال کريں موازنہ کے ليے ایک ئي متن پر چند ماڈل استعمال کريں

ہاں۔ TTS، STT، وائٹ کلونینگ، اور آڈیو ٹولز کے لئے OpenAI-compatible REST API۔ پرو ($29/month) اور انٹرپرائز ($99/month) منصوبوں پر دستیاب۔ tts.ai/api/ پر دستاویزات دیکھیں۔

آواز کی کیفیت ماڈل کے مطابق مختلف ہوتی ہے۔ CosyVoice 2، StyleTTS 2، اور Chatterbox جیسے پرائم ماڈل انسانی معیار کے قریب کی باتیں پیدا کرتے ہیں۔ Kokoro جیسے مفت ماڈل اکثر استعمال کے حالات کے لئے بہترین کیفیت فراہم کرتے ہیں۔

TTS.ai اسکے ماڈل لائبريري ميں 30+ زبانوں کو سپورٽ کر تا هے ۔ انگريزي ميں سب سے وسیع ماڈل سپورٽ هے ، مگر CosyVoice 2 جیسے ماڈل چيني ، جاپاني اور کو رياني کو سمیٹ کر تا هے ۔ GPT-SoVITS چيني ، جاپاني ، کو رياني اور انگريزي کو ہینڈل کر تا هے ۔ اور MeloTTS انگريزي ، اسپينش ، فرانسيسي ، چيني ، جاپاني اور کو رياني کو سمیٹ کر تا هے ۔

ہاں. تمام پروسیسنگ ہمارے وقف GPU سرور پر ہوتا ہے. ہم آپ کے متن انٹاپ یا فراہمی کے بعد پیدا کی گئی آڈیو کو محفوظ نہیں کرتے. کلوننگ کے لئے اپ لوڈ کیے گئے آواز کے نمونے صرف جاری سیشن کے لیے استعمال کیے جاتے ہیں اور محفوظ نہیں کیے جاتے. ہم آپ کے ڈیٹا کو کبھی بھی تیسری طرف کے ساتھ نہیں تقسیم کرتے یا اسے ماڈلز کو تربیت دینے کے لیے استعمال نہیں کرتے.

ہاں۔ TTS.ai پر پیدا کی گئی تمام آڈیو آپ کے لئے تجارتی استعمال کے لئے ہے، یو ٹیوب ویڈیوز، پوڈکاسٹ، آڈیو بک، ایپ، اشتہارات اور مصنوعات کے لئے۔ ہمارے ماڈل مفت سورس کے تحت ہیں (MIT، Apache 2.0)۔ کوئی روایات یا لقب کی ضرورت نہیں ہے۔

TTS.ai حداکثر معیار کے لیے WAV فارمیٹ میں ڈیفالٹ سے آڈیو پیدا کرتا ہے آپ MP3، FLAC، OGG، یا M4A میں تبدیل کر سکتے ہیں ہمارے مفت آڈیو کنورٹر ٹول کے استعمال سے. API آپ کی پسندیدہ آؤٹ پٹ فارمیٹ کو براہ راست درخواست میں بیان کرنے کی حمایت کرتا ہے.

آواز کا مختصر او ڊيو نمونہ اپ لوڈ کريں (5 سيکنڈ سے کم) جسے آپ کلون کرنا چا هيتے هيں ، پھر اس آواز ميں بولنے کے ليے کوئی متن ٹائپ کريں Chatterbox، GPT-SoVITS اور CosyVoice2کے ماڈل آواز کلوننگ کو مدد ديتے هيں. کلون کي آواز آواز ، اشارہ اور بولنے کا انداز پکڑتا هے

فری ماڈل (Kokoro, Piper, VITS, MeloTTS) کو کوئی اکاؤنٹ کی ضرورت نہیں ہے اور صفر حروف کی قیمت ہے۔ معیاری ماڈل (2,000 حروف/1K انپٹ) میں Bark, CosyVoice 2, F5-TTS, اور Dia شامل ہیں۔ پرائم ماڈل (4,000 حروف/1K انپٹ) میں OpenVoice، Chatterbox، StyleTTS 2، اور Tortoise شامل ہیں۔ ادا کردہ ماڈل عام طور پر بہتر کیفیت، زیادہ آوازیں، اور اضافی خصوصیات جیسے آواز کلوننگ پیش کرتے ہیں۔

جی ہاں، API بٹچ پروسیسنگ کی حمایت کرتا ہے جس سے بڑے پیمانے پر متن کو بولنے میں تبدیل کیا جاسکتا ہے۔ متعدد درخواستیں پیش کر سکتے ہیں اور UUIDs کے استعمال سے نتائج کو غیر ہم آہنگ طور پر حاصل کر سکتے ہیں۔ انٹرپرائز پلان ($99/month) میں تیز بٹچ پروسیسنگ کے لئے ترجیحاتی قطار رسائی شامل ہے۔ آڈیو بک پروڈکشن، کورس مواد، اور بڑے پیمانے پر وائٹ اوور پروجیکٹوں کے لئے بہترین۔
4.0/5 (8)

AI آواز استعمال کرنا آج شروع کریں

TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں