مفت AI تحریر سے کلام

33+ اوپن سورس ماڈلز، 273+ آوازیں، 33+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.

17K+
بنانے والے
70K+
نسلیں
33+
AI ماڈل
273+
آوازیں
TTS.ai سے محبت؟ اپنے دوستوں کو بتائیں!

آواز AI کے ليے آپ کو جو ضرورت هے

30+ ٹولز اوپن سورس AI ماڈلز سے طاقتور

33+ AI آواز ماڈل

ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ

KokoroKokoro مفت

کوکورو 82 ميليون پارامٹر ٹیکس-تو- اسپيچ ماڈل هے جو اسکے وزن کلاس سے اوپر خوبي طرح سے مچتا هے اسکے چھوٹے سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا سا

بہترین: کم سے کم لاٹنسی کے ساتھ اعلیٰ معیار TTS، اسٹریمنگ ایپلیکیشنز

مفت آزمائیں

PiperPiper مفت

پيپر رال سس پي کے ذريعے ترقي يافته ھيں جو VITS اور larynx architectures کا استعمال کر تا هے ۔ یہ پورے طور پر سي پي يو پر چلتا هے ، اس کو ايج ڈیوائس ، گھري خودکاري ، اور آپريشنز کے ليے مثالي بنا تا هے جن کو آف لائن TTS کا احتياج هے ۔ 30+ زبانوں میں 100 سے زائد آوازوں کے ساتھ ، پيپر رال سس پي 4 پر بھی ريئل ٽائم رفتار پر فطري آوازوں کا اظہار کر تا هے ۔

بہترین: تیز پیش نگوئی، رسائی، اور شامل ایپلیکیشنز

مفت آزمائیں

VITSVITS مفت

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ایک متوازی انتہا سے انتہا تک TTS طریقہ کار ہے جو کہ دو مرحلہ ماڈل سے زیادہ قدرتی آواز کی آڈیو پیدا کرتا ہے یہ variation inference کو قبول کرتا ہے جو کہ normalizing flows اور ایک مخالف تربیت کے عمل کے ساتھ بڑھایا جاتا ہے، جس سے قدرتی میں ایک اہم بہتری حاصل ہوتی ہے.

بہترین: عام مقصد کا متن-سے-زبان با فطری پروسوڈی

مفت آزمائیں

MeloTTSMeloTTS مفت

MyShell.ai کے طرف سے MeloTTS ایک کثیر زبانوں TTS لائبريري ہے جو انگريزي (امريکائي، برطانوي، هندي، آسٽريليائي)، اسپيني، فرانسيسي، چيني، جاپاني اور کو رياني کو مدد دے سکتی هے ۔ یہ انتہائي تیز ہے ، صرف سي پي يو پر تقريباً ريئل ٹائم رفتار پر متن پروسيس کر سکتی هے ۔ MeloTTS پروڈکشن استعمال کے ليے بنا يا گيا هے اور سي پي يو اور جي پي يو دو کے ليے مدد دے سکتی هے ۔

بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے

مفت آزمائیں

Kani TTS 2Kani TTS 2 مفت

Kani-TTS-2 by NineNineSix ایک الٹرا-ہلکا وزن 400M پیرامیٹر ماڈل ہے جو NVIDIA NanoCodec کے ساتھ Liquid AI LFM2 backbone پر بنایا گیا ہے یہ صرف 3GB VRAM میں چلتا ہے اور A100 (RTF 0.2) پر ~2 ثانیوں میں ~10 سیکنڈ کی بات کا اظہار کرتا ہے.حالی میں عوامی رلیز صرف انگریزی میں `kani-tts-2-en` چک پوائنٹ بھیجتا ہے اور آواز کے کلوننگ کے لئے ضروری اسپیکر-امباڈینگ ہوک کو ظاہر نہیں کرتا - کلوننگ کے لئے Chatterbox / IndexTTS2 / F5-TTS استعمال کریں، یا غیر انگریزی کے لئے Kokoro / MeloTTS.

بہترین: کم VRAM ہارڈ ویئر پر تیز انگریزی پیداوار، تیز پیش نگوئی

مفت آزمائیں

OuteTTSOuteTTS مفت

OuteTTS اصل فن تعمير کو محفوظ رکھتے ہوئے متن سے بولنے کی صلاحیتوں کے ساتھ بڑے زباني ماڈل کو پھیلا تا هے ۔ یہ مختلف باقائدہ گيوں کو مدد دیتا هے جن ميں llama.cpp (CPU/GPU) ، Hugging Face Transformers ، ExLlamaV2 ، VLLM ، اور Transformers.js کے ذریعے براؤزر انفريشن شامل هے ۔ JSON کے طور پر محفوظ کئے گئے اسپيکر پروفا ئل کے ذریعے صفر شوٹ ويز کلوننگ کي خاصيت هے ۔

بہترین: ایج ڈیبائیلنگ، براؤزر-بنا ہوا TTS، کم وسعت ماحول

مفت آزمائیں

Pocket TTSPocket TTS مفت

پوک ٹي ٹی ايس کيو ٹائ ( مو شي کے بنا ئے والے) کے ذريعے 100 ميگا با ڑي پيراميٹر ٹیکس- ٹو- اسپيچ ماڈل هے جو اس کے وزن سے زياد گيں ۔ یہ سي پي يو پر موثر طور پر چلتا هے ، ایک واحد او ڊيو نمونے سے صفر شوٹ ويز کلوننگ کي مدد کرتا هے اور فطري آواز کا آواز بناتا هے ۔ چھوٹا ماڈل سايز اس کو ايج ڈیبائيلنگ اور کم وسيله والا ماحول کے ليے مثالي بنا تا هے

بہترین: ہلکا ڈیبلوپمنٹ، CPU-only ماحول، تیز آواز کلوننگ

مفت آزمائیں

Kitten TTSKitten TTS مفت

Kitten TTS by KittenML ONNX پر بنا يا گيا هے اور 15M سے 80M پرائمر کے تغيرات کے ساتھ (25-80 MB ڈسک پر) CPU پر GPU کے ضرورت کے بغیر اعليٰ معيار کی آواز سنتھز فراہم کر تا هے 8 اندروني آوازوں ، انکشاف گير آواز کی رفتار اور نمبروں ، رقموں اور يونٹوں کے ليے اندروني متن پراپرائزنگ کے خاصيتوں کے ساتھ ايج ڈیبائيلنگ اور کم ليٹنسي ايپليکيشنز کے ليے ايڈفائيڈ

بہترین: تیز ہلکا TTS، کنارے کی نشر، کم-لائٹینیٹی ایپلیکیشنز

مفت آزمائیں

Ming-Omni TTSMing-Omni TTS مفت

InclusionAI کے ذريعے Ming-omni-tts-0.5B BailingMM کے گھنے پسماند پر بنا يا گيا هے جو پيچ-بائي پچ فلو-مطابق آ ڊيو دي کوڈر کے ساتھ 44.1kHz آ وٹ پٹ (CD کي معيار کے قریب) ديا تا هے ، 3+ سيکنڈ ريفرنس سے صفر شوٹ ويز کلونينگ کو مدد دیتا هے اور JSON اشاروں کے ذریعے بنا يا گيا احساس / ڈالیکٹ / BGM کنٹرول شامل کر تا هے ۔ چيني بينک مارکز پر 0.83% WER کا ممتاز استحکام ۔

بہترین: اعلیٰ وفاداری دو زبانوں کی روایت، جذبات سے کنٹرول آواز اداکاری، چینی اوڈیو بک مواد

مفت آزمائیں

MOSS-TTS NanoMOSS-TTS Nano مفت

MOSS-TTS-Nano-100M MOSS-TTS خاندان کا OpenMOSS کا کمپیکٹ 100M-پرامیٹر قسم ہے، وقفہ-ترمیم ساز فن تعمیر کو شریک کرتا ہے. 8B ماڈل کی اعلیٰ معیار ~80x چھوٹے وزن کے لئے تجارت کرتا ہے اور حیرت انگیز طور پر کم پر-دعا VRAM، اسے فری-تیئر اور اعلیٰ-تھروپٹ ڈیپلوماتز کے لئے مناسب بناتا ہے. یہی 20 زبانوں کی حد.

بہترین: فری ٹیئر ٹی ٹی ایس، اعلی حجم کی پیداوار، کم لیٹنسی تعاملی استعمال

مفت آزمائیں

BarkBark معیار

ترانسفر برائے متن آ ديو ماڈل جو سچائيء بات، موسیقی اور آواز کے اثرات پيدا کر تا هے

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

Bark SmallBark Small معیار

Bark کا کم وزن ورژن تیز تر انفریکشن اور کم یادداشت استعمال کے ساتھ

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

CosyVoice 2CosyVoice 2 معیار

انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.

ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0

اس کی کوشش کرو

Dia TTSDia TTS معیار

کثیر اسپیکر ڈائیلاگ پیداوار ماڈل جو اسپیکروں کے درمیان قدرتی گفتگو بناتا ہے.

ڈیولپر: Nari Labs · لائسنس: Apache 2.0

اس کی کوشش کرو

Parler TTSParler TTS معیار

آپ کو فطری زبان میں آواز کا بیان کرنا ہے اور Parler مطابقت والی بات پیدا کرتی ہے.

ڈیولپر: Hugging Face · لائسنس: Apache 2.0

اس کی کوشش کرو

IndexTTS-2IndexTTS-2 معیار

صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.

ڈیولپر: Index Team · لائسنس: Bilibili Model License

اس کی کوشش کرو

Spark TTSSpark TTS معیار

آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.

ڈیولپر: SparkAudio · لائسنس: CC BY-NC-SA 4.0

اس کی کوشش کرو

GPT-SoVITSGPT-SoVITS معیار

چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.

ڈیولپر: RVC-Boss · لائسنس: MIT

اس کی کوشش کرو

OrpheusOrpheus معیار

انسانی سطح پر جذباتی TTS ماڈل 100K گھنٹوں پر تربیت دی گئی کلام کے اعداد و شمار.

ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community

اس کی کوشش کرو

Qwen3 TTSQwen3 TTS معیار

علی بابا کا متعدد زبانوں کا TTS پیشہ ور آوازوں اور متن سے آواز ڈیزائن کے ساتھ.

ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0

اس کی کوشش کرو

VieNeu-TTS-v2VieNeu-TTS-v2 معیار

ويتنامي + انگريزي کوڈ-سوچنگ TTS 7 پرائزٹ آوازوں اور صفر-شٹ آواز کلوننگ کے ساتھ صرف سي پي يو ، کوئی GPU کا احتياج نہیں

ڈیولپر: Phạm Nguyễn Ngọc Bảo · لائسنس: Apache 2.0

اس کی کوشش کرو

Chatterbox TurboChatterbox Turbo معیار

جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.

ڈیولپر: Resemble AI · لائسنس: MIT

اس کی کوشش کرو

VoxCPMVoxCPM معیار

Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency

ڈیولپر: OpenBMB · لائسنس: Apache 2.0

اس کی کوشش کرو

VibeVoiceVibeVoice معیار

مائیکروسافٹ ماڈل طویل فارم ملٹی اسپیکر مواد کے لیے جیسے پوڈکاسٹ اور اوڈیو بک.

ڈیولپر: Microsoft · لائسنس: MIT

اس کی کوشش کرو

CosyVoice3CosyVoice3 معیار

اگلے نسل کی متعدد زبانوں کی TTS باے-سٹریمینگ، جذباتی کنٹرول، اور صفر-شٹ وائٹ کلونینگ کے ساتھ.

ڈیولپر: Alibaba (FunAudioLLM) · لائسنس: Apache 2.0

اس کی کوشش کرو

NAMAA Saudi TTSNAMAA Saudi TTS معیار

پہلا کھلا سعودی عربی TTS. چاٹر باکس-کیولٹی وائٹ کلونینگ کے ساتھ مقامی سعودی ڈالیکٹ.

ڈیولپر: NAMAA Space · لائسنس: MIT

اس کی کوشش کرو

Darwin TTSDarwin TTS معیار

کراس-موڈل Qwen3-TTS متغیر FFN وزن کے ساتھ Qwen3-1.7B زبان ماڈل سے ملے ہوئے تیز متعدد زبانوں کے کلوننگ کے لئے.

ڈیولپر: FINAL-Bench · لائسنس: Apache 2.0

اس کی کوشش کرو

MOSS-TTSDMOSS-TTSD معیار

ملٹی اسپیکر ڈائیلاگ کونٹینیشن ماڈل — پوڈکاسٹ-سٹائل گفتگو پیدا کریں 5 اسپیکروں اور 60 منٹ کے ساتھ منسلک آڈیو کے ساتھ.

ڈیولپر: OpenMOSS · لائسنس: Apache 2.0

اس کی کوشش کرو

ChatterboxChatterbox پرائمیئم

ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.

معیار:

اس کی کوشش کرو

Tortoise TTSTortoise TTS پرائمیئم

متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.

معیار:

اس کی کوشش کرو

StyleTTS 2StyleTTS 2 پرائمیئم

انسانی سطح کے متن سے بات کرنے کے لئے انداز کے پھیلنے اور مقابلے کی تربیت کے ذریعے.

معیار:

اس کی کوشش کرو

OpenVoiceOpenVoice پرائمیئم

براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.

معیار:

اس کی کوشش کرو

Sesame CSMSesame CSM پرائمیئم

مناسب وقت اور جذبات کے ساتھ قدرتی گفتگو پیدا کرنے کے لئے گفتگو کے ماڈل.

معیار:

اس کی کوشش کرو

CosyVoice 2CosyVoice 2

انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.

زبانیں: en, zh, ja, ko, fr, de, it, es

آواز

IndexTTS-2IndexTTS-2

صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.

زبانیں: en, zh

آواز

Spark TTSSpark TTS

آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.

زبانیں: en, zh

آواز

GPT-SoVITSGPT-SoVITS

چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.

زبانیں: en, zh, ja, ko

آواز

ChatterboxChatterbox

ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.

زبانیں: en

آواز

Tortoise TTSTortoise TTS

متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.

زبانیں: en

آواز

OpenVoiceOpenVoice

براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.

زبانیں: en, zh, ja, ko, fr, es

آواز

VieNeu-TTS-v2VieNeu-TTS-v2

ويتنامي + انگريزي کوڈ-سوچنگ TTS 7 پرائزٹ آوازوں اور صفر-شٹ آواز کلوننگ کے ساتھ صرف سي پي يو ، کوئی GPU کا احتياج نہیں

زبانیں: vi, en

آواز

Chatterbox TurboChatterbox Turbo

جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.

زبانیں: en

آواز

VoxCPMVoxCPM

Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency

زبانیں: en, zh

آواز

OuteTTSOuteTTS

LLM پر مبنی TTS جو CPU، GPU، يا براؤزر پر چلتا هے llama.cpp اور Transformers.js کے ذریعے

زبانیں: en

آواز

Pocket TTSPocket TTS

ایک واحد نمونے سے آواز کلوننگ کے ساتھ Kyutai کے ذریعے ہلکا 100M پیرامیٹر ماڈل

زبانیں: en, fr

آواز

CosyVoice3CosyVoice3

اگلے نسل کی متعدد زبانوں کی TTS باے-سٹریمینگ، جذباتی کنٹرول، اور صفر-شٹ وائٹ کلونینگ کے ساتھ.

زبانیں: en, zh, ja, ko, de, es, fr, it, ru

آواز

NAMAA Saudi TTSNAMAA Saudi TTS

پہلا کھلا سعودی عربی TTS. چاٹر باکس-کیولٹی وائٹ کلونینگ کے ساتھ مقامی سعودی ڈالیکٹ.

زبانیں: ar

آواز

Darwin TTSDarwin TTS

کراس-موڈل Qwen3-TTS متغیر FFN وزن کے ساتھ Qwen3-1.7B زبان ماڈل سے ملے ہوئے تیز متعدد زبانوں کے کلوننگ کے لئے.

زبانیں: en, ko, ja, zh

آواز

MOSS-TTSDMOSS-TTSD

ملٹی اسپیکر ڈائیلاگ کونٹینیشن ماڈل — پوڈکاسٹ-سٹائل گفتگو پیدا کریں 5 اسپیکروں اور 60 منٹ کے ساتھ منسلک آڈیو کے ساتھ.

زبانیں: en, zh

آواز

Ming-Omni TTSMing-Omni TTS

44.1kHz کے اعلیٰ وفاداری اور صفر شوٹ وائٹ کلونینگ کے ساتھ InclusionAI سے کمپیکٹ 0.5B Omni-Modal اسپیچ ماڈل

زبانیں: en, zh

آواز

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS variant — یہی فن تعمیر، 80x چھوٹا، فری ٹیئر لیٹنسی.

زبانیں: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

آواز

ڈیولپر-فیئر API

ایک انتہا نقطہ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.

  • OpenAI سازگار فارمیٹ
  • ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
  • بڑے کاموں کے لیے بیچ پروسیسنگ
  • Webhook اطلاعیں
API دستاویز دیکھیں
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

سادہ، شفافیت قیمت

آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.

مفت

$0

15,000 حروف + 5,000/دن

  • 7 مفت ماڈل Kokoro شامل
  • 5000 حروف پر نسل
  • API رسائی شامل ہے
مفت میں رجسٹر کریں

شروع

$9/ميگا بائٹ

500 کریڈٹ / ماہ

  • تمام 22+ ماڈل
  • 100,000 حروف پر نسل
  • آواز کا کلوننگ
شروع کریں
سب سے زیادہ مقبول

پرو

$29/ميگا بائٹ

2000 کریڈٹس/مہينا

  • شروع کرنے میں سب کچھ
  • API رسائی
  • ترجیحی پروسیسنگ
پرو

کاروبار

$99/ميگا بائٹ

10,000 کریڈٹس / ماہ

  • پرو میں سب کچھ
  • بلک API
  • ترجیحی قطار
کاروبار حاصل کریں

تمام منصوبے دیکھیں جن میں کریکٹر پک شامل ہیں →

بار بار پوچھے گئے سوالات

TTS.ai سب سے وسیع AI آواز پلیٹ فارم ہے، 22+ متن سے کلام ماڈل، آواز کلوننگ، کلام سے متن، اور آڈیو ٹولز فراہم کرتا ہے۔ تمام ماڈل کوئی ونڈر لاک-ان کے ساتھ اوپن سورس ہیں۔

ہاں! TTS.ai کوکورو، پائپر، وی ٹی ایس اور میلو ٹی ٹی ایس ماڈلز کے ساتھ مفت ٹیکس-ٹو-سپیچ فراہم کرتا ہے۔ کوئی اکاؤنٹ ضروری نہیں ہے۔ 15000 مفت حروف حاصل کرنے اور تمام ماڈلز تک رسائی حاصل کرنے کیلئے رجسٹر کریں۔ ادا کردہ منصوبے $9/مئی سے شروع ہوتے ہیں۔

رفتار کے ليے Kokoro يا Piper استعمال کريں معيار کے ليے CosyVoice2يا StyleTTS2کوش کريں آواز کي کلوننگ کے ليے Chatterbox يا GPT-SoVITS استعمال کريں گفتگو کے ليے Dia TTS استعمال کريں موازنہ کے ليے ایک ئي متن پر چند ماڈل استعمال کريں

ہاں۔ TTS، STT، وائٹ کلونینگ اور اوڈیو ٹولز کے لئے OpenAI-compatible REST API۔ ہر منصوبے میں شامل ہے جن میں مفت بھی شامل ہے، ریت حدیں ہیں جو سطح کے مطابق پیمانہ (فریب: 10 req/min، لائٹ: 20، اسٹارٹر: 30، پرو: 60، بزنس: 300)۔ tts.ai/api/ پر دستاویزات دیکھیں۔

آواز کی کیفیت ماڈل کے مطابق مختلف ہوتی ہے۔ CosyVoice 2، StyleTTS 2، اور Chatterbox جیسے پرائم ماڈل انسانی معیار کے قریب کی باتیں پیدا کرتے ہیں۔ Kokoro جیسے مفت ماڈل اکثر استعمال کے حالات کے لئے بہترین کیفیت فراہم کرتے ہیں۔

TTS.ai اسکے ماڈل لائبريري میں 30+ زبانوں کو سپورٽ کرتا هے ۔ انگلش کا سب سے وسیع ماڈل سپورٹ هے ، مگر CosyVoice2کے ماڈل چيني ، جاپاني اور کو ريائي کو سمیٹ کر تے هيں ۔ GPT-SoVITS چيني ، جاپاني ، کو ريائي اور انگريزي کو ہینڈل کرتا هے ۔ اور MeloTTS انگريزي ، اسپينش ، فرانسيسي ، چيني ، جاپاني اور کو ريائي کو سمیٹ کر سکتا هے ۔

ہاں. تمام پروسیسنگ ہمارے وقف GPU سرور پر ہوتا ہے. ہم آپ کے متن انٹاپ یا فراہمی کے بعد پیدا کی گئی آڈیو کو محفوظ نہیں کرتے. کلوننگ کے لئے اپ لوڈ کیے گئے آواز کے نمونے صرف جاری سیشن کے لیے استعمال کیے جاتے ہیں اور محفوظ نہیں کیے جاتے. ہم آپ کے ڈیٹا کو کبھی بھی تیسری طرف کے ساتھ نہیں تقسیم کرتے یا اسے ماڈلز کو تربیت دینے کے لیے استعمال نہیں کرتے.

ہاں۔ TTS.ai پر پیدا کی گئی تمام آڈیو آپ کے لئے تجارتی استعمال کے لئے ہے، یو ٹیوب ویڈیوز، پوڈکاسٹ، آڈیو بک، ایپ، اشتہارات اور مصنوعات کے لئے۔ ہمارے ماڈل مفت سورس کے تحت ہیں (MIT، Apache 2.0)۔ کوئی روایات یا لقب کی ضرورت نہیں ہے۔

TTS.ai WAV فارمیٹ میں آڈیو پیدا کرتا ہے حد سے زائد معیار کے لیے آپ MP3, FLAC, OGG, یا M4A میں تبدیل کر سکتے ہیں ہمارے مفت آڈیو تبدیل کرنے والے ٹول کو استعمال کر کے. API آپ کی پسندیدہ آؤٹ پٹ فارمیٹ کو براہ راست درخواست میں بیان کرنے کی حمایت کرتا ہے.

آواز کا مختصر او ڊيو نمونہ اپ لوڈ کريں (5 سيکنڈ سے کم) جسے آپ کلون کرنا چا هيتے هيں ، پھر اس آواز ميں بولنے کے ليے کوئی متن ٹائپ کريں Chatterbox، GPT-SoVITS اور CosyVoice2کے ماڈل آواز کلوننگ کو مدد ديتے هيں. کلون کي آواز آواز ، اشارہ اور بولنے کا انداز پکڑتا هے

فری ماڈل (Kokoro, Piper, VITS, MeloTTS) کو کوئی اکاؤنٹ کی ضرورت نہیں ہے اور صفر حروف کی قیمت ہے۔ معیاری ماڈل (2,000 حروف/1K انپٹ) میں Bark, CosyVoice 2, F5-TTS, اور Dia شامل ہیں۔ پرائم ماڈل (4,000 حروف/1K انپٹ) میں OpenVoice، Chatterbox، StyleTTS 2، اور Tortoise شامل ہیں۔ ادا کردہ ماڈل عام طور پر بہتر کیفیت، زیادہ آوازیں، اور اضافی خصوصیات جیسے آواز کلوننگ پیش کرتے ہیں۔

جی ہاں. API بٹچ پروسیسنگ کو متن کی بڑی حجم کو بولنے میں تبدیل کرنے کے لئے مدد کرتا ہے. متعدد درخواستیں پیش کریں اور نتائج کو جیپ UUIDs کے استعمال سے غیر ہم آہنگ طور پر واپس لیں۔ کاروبار پلان ($99/mo) اور اس سے اعلیٰ میں تیز بٹچ پروسیسنگ کے لئے ترجیح کی قطار رسائی شامل ہے۔ آڈیو بک پروڈکشن، کورس مواد، اور بڑے پیمانے پر وائٹ اوور پروجیکٹوں کے لئے ایڈیال۔
4.1/5 (42)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

AI آواز استعمال کرنا آج شروع کریں

TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں