مفت AI تحریر سے کلام

82M پیرامیٹرز بہت تیز اظہاري آوازیں کثیر زبانی اسٹریمنگ امداد

ہلکا وزن 82M پیرامیٹر ماڈل بھڑکتے تیز انفریکشن کے ساتھ سٹوڈیو-کیفیت کلام فراہم.

محفوظ · 1.5GB VRAM اس کی کوشش کرو

Piper

سی پی یو دوستانہ آف لائن قابل 100+ آوازیں 35+ زبانیں SSML مدد

ایک تیز، مقامی نیورل ٹیکس سے اسپیکینگ سسٹم رسل بیری پی اور ضم شدہ آلات کے لیے بہتر بنایا گیا ہے

محفوظ · 0 (CPU only) VRAM اس کی کوشش کرو

VITS

آخري سے آخري ترکیب فطري نظم جلدي نتيجه نگي متعدد اسپیکر

متن سے بولنے کے لیے انتہا سے انتہا کے لیے مخالف سیکھنے کے ساتھ مشروط مختلف خودکار کوڈر

محفوظ · 1GB VRAM اس کی کوشش کرو

MeloTTS

سی پی یو- بہتر چند زبانوں والا کثیر حروف تیار کم وقفہ

اعلیٰ معیار کی متعدد زبانوں میں تحریر سے بولنے کی قابلیت جو کم سے کم وقفہ کے ساتھ سی پی یو پر چلتی ہے.

محفوظ · 0.5GB (GPU optional) VRAM اس کی کوشش کرو

Bark

آواز کے اثرات ہنستے/سھتے موسیقی کی پیداوار 100+ اسپیکرز کثیر زبانی

ترانسفر برائے متن آ ديو ماڈل جو سچائيء بات، موسیقی اور آواز کے اثرات پيدا کر تا هے

سست · 5GB VRAM اس کی کوشش کرو

Bark Small

ہلکا وزن پورے Bark سے تیز جذباتي بولي چند زبانوں والا

Bark کا کم وزن ورژن تیز تر انفریکشن اور کم یادداشت استعمال کے ساتھ

متوسط · 2GB VRAM اس کی کوشش کرو

CosyVoice 2

سٹریمنگ صفر-شٹ کلوننگ کراس-لنگويج احساسات کا کنٹرول انسان

انسانی برابری کی فطرت اور صفر کے قریب کی وقفہ کے ساتھ علی بابا کا مقیاسی اسٹریمنگ TTS.

Dia TTS

ملٹی اسپیکر ڈائیلاگ پیدائش فطري تير گي جذباتي اظہار 1.6B پیرامیٹرز

کثیر اسپیکر ڈائیلاگ پیداوار ماڈل جو اسپیکروں کے درمیان قدرتی گفتگو بناتا ہے.

Parler TTS

آواز کی وضاحت فطری زبان کا کنٹرول لنچبل آواز بنانا کوئی پرائزٹ آوازیں ضرورت نہیں

آپ کو فطری زبان میں آواز کا بیان کرنا ہے اور Parler مطابقت والی بات پیدا کرتی ہے.

Indic Parler TTS

هندي زبانیں آواز کی وضاحت فطری زبان کا کنٹرول اصل هندي تلفظ

8+ ہندی زبانوں کے لئے اعلیٰ معیار کی بات بانے کی صلاحیت، قدرتی زبانوں کے آواز کنٹرول کے ساتھ۔

سست · 8GB VRAM اس کی کوشش کرو

KhanomTan TTS

تھائي TTS متعدد اسپیکر YourTTS فن تعمير تجارتی محفوظ لائسنس

تھائی-پہلی متن-سے-زبان کے ساتھ ایک انتخاب کے ساتھ بولنے والے آوازیں.

محفوظ · 2GB VRAM اس کی کوشش کرو

IndexTTS-2

احساسات کا کنٹرول صفر-شٹ احساسات اظہاري بولي فائنل-گرینڈ کنٹرول

صفر-شٹ TTS fine-grained جذبات کے کنٹرول اور اعلیٰ بیانی کے ساتھ.

Spark TTS

آواز کا کلوننگ احساسات کا کنٹرول انداز کنٹرول پرومم-بائز 5 سیکنڈ کلوننگ

آواز کلوننگ TTS کنٹرول شدہ جذبات اور بولنے کے انداز کے ساتھ پروموشنز کے ذریعے.

GPT-SoVITS

5 سیکنڈ کلوننگ آواز گاني چند شوٹ سکھنا اعلیٰ وفاداري کراس-لنگويج

چند شوٹ آواز کلوننگ TTS جو کسی بھی آواز کو 5 سیکنڈ کے آڈیو سے نقل کرتا ہے.

سست · 6GB VRAM اس کی کوشش کرو

Orpheus

انسان کے سطح پر احساس 100K گھنٹے تربیت فطری تاثير بياني بولي

انسانی سطح پر جذباتی TTS ماڈل 100K گھنٹوں پر تربیت دی گئی کلام کے اعداد و شمار.

Chatterbox

صفر-شٹ کلوننگ احساسات کا کنٹرول اعلیٰ وفاداري انداز منتقلی ایک نمونے کا کلوننگ

ریسمبل اے آئی سے جذبات کے کنٹرول کے ساتھ ریاست-of-the-آرٹ صفر-شٹ آواز کلوننگ.

Tortoise TTS

اعلیٰ معیار چند آوازیں DALL-E فن تعمير آواز کا کلوننگ خودکار واپسی

متعدد آوازوں کے متن سے کلام کی کیفیت پر توجہ مرکوز ہے autoregressive فن تعمیر کے ساتھ.

سست · 8GB VRAM اس کی کوشش کرو

StyleTTS 2

انسان انداز مخالف تربيت فطري فرق اعلیٰ وفاداري

انسانی سطح کے متن سے بات کرنے کے لئے انداز کے پھیلنے اور مقابلے کی تربیت کے ذریعے.

OpenVoice

فوری کلوننگ آواز تبدیل احساسات کا کنٹرول اکر کنٹرول کثیر زبانی

براہ راست آواز کلوننگ، انداز، جذبات اور لہجہ پر گنری کنٹرول کے ساتھ.

Qwen3 TTS

9 پرائزٹ آوازیں متن سے آواز کا ڈیزائن احساسات کا کنٹرول زبانیں

علی بابا کا متعدد زبانوں کا TTS پیشہ ور آوازوں اور متن سے آواز ڈیزائن کے ساتھ.

متوسط · 7GB VRAM اس کی کوشش کرو

VieNeu-TTS-v2

7 پرائزٹ آوازیں (شمال + جنوبي اشارے) En-Vi کوڈ-سوچنگ آواز کلوننگ (3-5s حوالہ) پوڈکاسٹ / ملٹی اسپیکرز کی مدد صرف سی پی یو - کوئی جی پی یو ضروری نہیں

ويتنامي + انگريزي کوڈ-سوچنگ TTS 7 پرائزٹ آوازوں اور صفر-شٹ آواز کلوننگ کے ساتھ صرف سي پي يو ، کوئی GPU کا احتياج نہیں

محفوظ · CPU VRAM اس کی کوشش کرو

Sesame CSM

گفتگو فطری وقت لٹ-تیکشن بیکٹيريل 1B پارامٹر

مناسب وقت اور جذبات کے ساتھ قدرتی گفتگو پیدا کرنے کے لئے گفتگو کے ماڈل.

سست · 8GB VRAM اس کی کوشش کرو

Chatterbox Turbo

200ms کے نیچے کی تاخیر علامات 6x ریئل-ٹائم آواز کا کلوننگ وائیرڈ

جلدی سے Chatterbox sub-200ms latency اور paralinguistic ٹیگز کے ساتھ ہنسی، کوشوں، اور زیادہ کے لئے.

محفوظ · 2GB VRAM اس کی کوشش کرو

VoxCPM

آڈیو ٹوکنائزر-آزاد کراس-لنگويج کلوننگ متن پر غور لورا فائين ٹونيننگ

Tokenizer-free TTS production 44.1kHz audio with context-aware paragraph consistency

محفوظ · 4GB VRAM اس کی کوشش کرو

Kani TTS 2

3GB VRAM بہت تیز ہلکا وزن نانو کوڈک مفت

الٹرا-ہلکا وزن 400M انگریزی TTS ماڈل صرف 3GB VRAM میں چل رہا ہے.

محفوظ · 3GB VRAM اس کی کوشش کرو

OuteTTS

سی پی یو براؤزر انفریکشن متعدد باقائدہ اسپیکر پروفا ئل

LLM پر مبنی TTS جو CPU، GPU، يا براؤزر پر چلتا هے llama.cpp اور Transformers.js کے ذریعے

سست · 2GB VRAM اس کی کوشش کرو

VibeVoice

ملٹی اسپیکر 90 منٹ تک پوڈکاسٹ پیدائش اسپیکر 200ms اسٹریمنگ

مائیکروسافٹ ماڈل طویل فارم ملٹی اسپیکر مواد کے لیے جیسے پوڈکاسٹ اور اوڈیو بک.

محفوظ · 4GB VRAM اس کی کوشش کرو

Pocket TTS

100M پیرامیٹرز سی پی یو آواز کا کلوننگ ایک نمونے کا کلوننگ کنارے تیار

ایک واحد نمونے سے آواز کلوننگ کے ساتھ Kyutai کے ذریعے ہلکا 100M پیرامیٹر ماڈل

محفوظ · 1GB VRAM اس کی کوشش کرو

Kitten TTS

صرف سي پي يو انفريشن 80MB ماڈل سائز سے کم 8 داخل آوازیں رفتار کا کنٹرول ONNX پر مبنی 24kHz آؤٹ پٹ

80MB کے نیچے الٹرا-لائٹ وائٹ TTS. CPU پر چلتا ہے بغیر GPU کے.

محفوظ · 0GB VRAM اس کی کوشش کرو

CosyVoice3

دوہرا سٹریمینگ احساسات کا کنٹرول آواز کا کلوننگ رفتار/حجم کنٹرول اشارے کے مطابق

اگلے نسل کی متعدد زبانوں کی TTS باے-سٹریمینگ، جذباتی کنٹرول، اور صفر-شٹ وائٹ کلونینگ کے ساتھ.

محفوظ · 4GB VRAM اس کی کوشش کرو

NAMAA Saudi TTS

سودي عربي جديد سٹنڈرڈ عربي صفر-شٹ آواز کلوننگ احساسات کا کنٹرول مقامي تلفظ

پہلا کھلا سعودی عربی TTS. چاٹر باکس-کیولٹی وائٹ کلونینگ کے ساتھ مقامی سعودی ڈالیکٹ.

متوسط · 6GB VRAM اس کی کوشش کرو

Darwin TTS

آواز کا کلوننگ کراس-لنگويج FFN-بھڑکا ہوا 4 بنيادي زبانیں Qwen3 رکاوٹ

کراس-موڈل Qwen3-TTS متغیر FFN وزن کے ساتھ Qwen3-1.7B زبان ماڈل سے ملے ہوئے تیز متعدد زبانوں کے کلوننگ کے لئے.

متوسط · 7GB VRAM اس کی کوشش کرو

MOSS-TTSD

کثیر اسپیکر ڈائیلاگ 5 اسپیکرس تک 60 منٹ منسجم آڈیو آواز کا کلوننگ پوڈکاسٹ بہتری

ملٹی اسپیکر ڈائیلاگ کونٹینیشن ماڈل — پوڈکاسٹ-سٹائل گفتگو پیدا کریں 5 اسپیکروں اور 60 منٹ کے ساتھ منسلک آڈیو کے ساتھ.

متوسط · 12GB VRAM اس کی کوشش کرو

Ming-Omni TTS

44.1kHz آؤٹ پٹ آواز کا کلوننگ احساسات کا کنٹرول ڈائيلکٹ ڪنٹرول BGM پیدائش کمپیکٹ 0.5B

44.1kHz کے اعلیٰ وفاداری اور صفر شوٹ وائٹ کلونینگ کے ساتھ InclusionAI سے کمپیکٹ 0.5B Omni-Modal اسپیچ ماڈل

متوسط · 3GB VRAM اس کی کوشش کرو

MOSS-TTS Nano