مفت AI لکت مان ڳالھائڻName

82M پيراميڊس تمام تيز اظهاري آواز ڪيتريون ٻوليون اسٽريمنگ مدد

هلڪو وزن وارو 82M پاراميٽر ماڊل اسٽوڊيو-ڪواليٽي ڳالهائڻ مهيا ڪري ٿو جنهن سان جلدي جلدي نتيجو ڪڍيو وڃي ٿو.

ويجھو · 1.5GB VRAM ڪوشش ڪريو

Piper

سي پي يو دوست آف لائن قابل آواز ٻوليون SSML مدد

هڪ تيز، مقامي نيورال متن کان ڳالھائڻ وارو سسٽم راشبي پي ۽ ڳنڍيل اوزارن لاءِ بهتر ڪيو ويو.

ويجھو · 0 (CPU only) VRAM ڪوشش ڪريو

VITS

انڊ- تو- انڊ سنسڪرت قدرتي اکر جلدي نتيجو گھڻا اسپيڪر

end-to-end text-to-speech لاءِ مخالف سکڻ سان شرطي تبديلي وارو آٽوانڪوڊر.

ويجھو · 1GB VRAM ڪوشش ڪريو

MeloTTS

سي پي يو تيز ڪيتريون ٻوليون گھڻيون ڌڪاءَ پيداوار لاءِ تيار ننڍي دير

اعليٰ معياري ڪيترن ئي ٻولين جو متن ڳالهائڻ لاءِ جيڪو سي پي يو تي ٿوري دير سان هلندو آهي.

ويجھو · 0.5GB (GPU optional) VRAM ڪوشش ڪريو

Bark

آواز جا اثر کلندڙ ۽ ڳوڙها وھندڙ ميوزڪ پيدا ڪرڻ 100+ اسپيڪر ڪيتريون ٻوليون

ٽرانسميٽر تي ٻڌل متن کان آڊيو ماڊل جيڪو سچي ڳالھائي، موسيقي ۽ آواز جا اثر پيدا ڪري ٿو.

سست · 5GB VRAM ڪوشش ڪريو

Bark Small

هلڪو وزن مڪمل وڻ جي ڇت کان وڌيڪ تيز احساساتي ڳالهائڻ ڪيتريون ٻوليون

بارڪ جو هلڪو ورزن تيز استنباط ۽ گهٽ يادگار استعمال سان.

ميڊيم · 2GB VRAM ڪوشش ڪريو

CosyVoice 2

ڊرائنگ Zero-shot ڪلوننگ وچولي ٻولي احساس ڪنٽرول انسان جي برابري

Alibaba's scaleable streaming TTS with human-parity naturalness and near-zero latency.

Dia TTS

ڪيترا اسپيڪر ڊالوگ پيدا ڪريو قدرتي ڦيرگھير احساساتي اظهار 1.6B پاراميٽر

ملٽي اسپيڪر ڊالوگ پيدا ڪرڻ وارو ماڊل جيڪو اسپيڪر جي وچ ۾ قدرتي گفتگو پيدا ڪري ٿو.

Parler TTS

آواز جو بيان قدرتي ٻولي ڪنٽرول لچڪدار آواز ٺاهڻ ڪوبه اڳيون ترتيب ڏنل آواز نه گهرجن

اوھان کي گھرجي ته آواز کي قدرتي ٻوليءَ ۾ بيان ڪريو ۽ پارلر مطابقت رکندڙ آواز پيدا ڪندو.

Indic Parler TTS

هندستاني ٻوليون آواز جو بيان قدرتي ٻولي ڪنٽرول سچي هندي ويڪرائي

8+ هندي ٻولين لاءِ اعليٰ معيار جي ڳالھائي، قدرتي ٻولي آواز ڪنٽرول سان.

سست · 8GB VRAM ڪوشش ڪريو

KhanomTan TTS

ٽائيلي TTS گھڻا اسپيڪر YourTTS جو فن تعمير تجارتي- محفوظ لائسنس

Thai-first text-to-speech ٻُڌندڙن جي آوازن جي چونڊ سان.

ويجھو · 2GB VRAM ڪوشش ڪريو

IndexTTS-2

احساس ڪنٽرول صفر-شوٽ احساس ويڪٽر اظهاري ڳالھائڻ ننڍڙو ڪنٽرول

Zero-shot TTS fine-grained احساس ڪنٽرول ۽ اعلي اظهار سان.

Spark TTS

آواز جي کلوننگ احساس ڪنٽرول انداز ڪنٽرول پرومٽ تي ٻڌل 5 سيڪنڊن جي کلوننگ

آواز جي ڪلوننگ TTS ڪنٽرول ٿيل احساس ۽ ڳالهائڻ جي انداز سان پروموشنز ذريعي.

GPT-SoVITS

5 سيڪنڊن جي کلوننگ ڳائيندڙ آواز ڪجھ شوٽ سکڻ اعليٰ سچائي وچولي ٻولي

ٿورڙي شاٽ آواز ڪلوننگ TTS جيڪو ڪنهن به آواز کي رڳو 5 سيڪنڊن جي آڊيو مان نقل ڪري ٿو.

سست · 6GB VRAM ڪوشش ڪريو

Orpheus

انسان جي سطح جو احساس 100K ڪلاڪ قدرتي زور اظهاري ڳالھائڻ

انسان جي سطح جو احساساتي TTS ماڊل 100K ڪلاڪن جي ڳالهائڻ جي ڊيٽا تي تربيت ڏنل.

Chatterbox

Zero-shot ڪلوننگ احساس ڪنٽرول اعليٰ سچائي انداز منتقلي ھڪ نموني ڪلوننگ

State-of-the-art zero-shot آواز ڪلوننگ احساس ڪنٽرول سان Resemble AI کان.

Tortoise TTS

مٿاھين معيار گھڻو آواز DALL-E فن تعمير آواز جي کلوننگ پاڻمرادو واپسي

ڪيترن ئي آوازن واري متن کان ڳالهائڻ جي معيار تي ڌيان ڏنو ويو آهي autoregressive architecture سان.

سست · 8GB VRAM ڪوشش ڪريو

StyleTTS 2

انسان جي سطح انداز ڦهلائي مقابلي واري تربيت طبعي تبديلي اعليٰ سچائي

انسان جي سطح تي لفظن کي ٻوليءَ ۾ تبديل ڪرڻ جو طريقو ۽ مقابلي واري تربيت.

OpenVoice

فوري کلوننگ آواز تبديلي احساس ڪنٽرول ويڪرائي ڪنٽرول ڪيتريون ٻوليون

فوري آوازن جو کلوننگ شڪل، احساس، ۽ ڌيان تي ڪنٽرول سان.

Qwen3 TTS

آواز جي کلوننگ 9 اڳ ٺھرايل آواز متن مان آواز جو ڊزائين احساس ڪنٽرول

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ميڊيم · 7GB VRAM ڪوشش ڪريو

VieNeu-TTS-v2

7 اڳيون ٺاھيل آواز (شمال + ڏکڻ جو ڌڙ) En-Vi ڪوڊ-سوچنگ آواز جو کلون (3-5s حوالو) پوڊ ڪاسٽ / ملٽي اسپيڪر مدد صرف سي پي يو — ڪو به گيپ يو نه گھرجي

ويتنامي + انگريزي ڪوڊ-سوچنگ TTS 7 اڳيون ٺهيل آوازن ۽ صفر-شوٽ آوازن جي کلوننگ سان. صرف CPU-only، GPU جي ضرورت نه آهي.

ويجھو · CPU VRAM ڪوشش ڪريو

Sesame CSM

ڳالھائيندڙ قدرتي وقت موڙ وٺڻ پوئين چينل 1B پاراميٽر

گفتگو جو ماڊل جيڪو مناسب وقت ۽ احساس سان قدرتي گفتگو پيدا ڪري ٿو.

سست · 8GB VRAM ڪوشش ڪريو

Chatterbox Turbo

200ms جي هيٺان دير ٽيگ 6x ريئل-ٽائم آواز جو کلون پاڻي جو نشان

200ms جي دير سان تيز چيٽ باڪس ۽ کلڻ، ڪُوڙڻ ۽ وڌيڪ لاءِ پارالنگويسٽڪ ٽيگ.

ويجھو · 2GB VRAM ڪوشش ڪريو

VoxCPM

آڊيو ٽوڪينيزر-آزاد ٻولين جي وچ ۾ ڪلوننگ سياق سڃاڻندڙ LoRA تيز ترميم

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

ويجھو · 4GB VRAM ڪوشش ڪريو

Kani TTS 2

3GB VRAM تمام تيز آواز جو کلون هلڪو ناينو ڪوڊڪ

400M ماڊل صرف 3GB VRAM ۾ ڊرائيو ڪري ٿو آواز ڪلوننگ جي مدد سان.

ويجھو · 3GB VRAM ڪوشش ڪريو

OuteTTS

سي پي يو برائوزر جو نتيجو گھڻا بڪ اينڊس اسپيڪر پروفاائل

LLM تي ٻڌل TTS جيڪو CPU، GPU، يا برائوزر ذريعي llama.cpp ۽ Transformers.js ذريعي هلندو آهي.

سست · 2GB VRAM ڪوشش ڪريو

VibeVoice

ڪيترا اسپيڪر 90 منٽ پوڊ ڪاسٽ پيدا ڪرڻ اسپيڪر مطابقت 200ms ڊرائنگ

مائڪروسافٽ ماڊل ڊگھي فارم جي ملٽي اسپيڪر مواد جهڙوڪ پوڊ ڪاسٽ ۽ آڊيو ڪتابن لاءِ.

ويجھو · 4GB VRAM ڪوشش ڪريو

Pocket TTS

100M پيراميڊس سي پي يو آواز جو کلون ھڪ نموني کلوننگ پاسي تيار

ھڪڙي نموني مان آواز جي کلوننگ سان Kyutai طرفان ھڪڙو ھلڪو 100M پاراميٽر ماڊل.

ويجھو · 1GB VRAM ڪوشش ڪريو

Kitten TTS

صرف سي پي يو جو اندازو 80MB ماڊل جي آءٌ 8 اندروني آواز رفتار ڪنٽرول ONNX تي ٻڌل 24kHz آءوٽپوٽ

80MB جي هيٺان تمام هلڪو TTS. CPU تي رن ٿو پر GPU نه.

ويجھو · 0GB VRAM ڪوشش ڪريو

CosyVoice3

ٻه-اڌو احساس ڪنٽرول آواز جو کلون رفتار/آواز جو ڪنٽرول هدايتن جي پيروي

پوئين نسل جي ڪيترن ٻولين جي TTS سان ٻه-اسٽريمنگ، احساس ڪنٽرول، ۽ zero-shot آواز کلوننگ.

ويجھو · 4GB VRAM ڪوشش ڪريو

NAMAA Saudi TTS

سفيد عربي جديد معياري عربي Zero-shot آواز جي کلوننگ احساس ڪنٽرول مقامي آواز

پهريون مفت سعودي عرب TTS. چاٽربڪس-ڪواليٽي آواز جي کلوننگ سان مقامي سعودي ٻولي.

ميڊيم · 6GB VRAM ڪوشش ڪريو

Darwin TTS

آواز جو کلون وچولي ٻولي FFN- ملائي 4 بنيادي ٻوليون Qwen3 بيڪ بائونڊ

cross-modal Qwen3-TTS قسم FFN وزن سان Qwen3-1.7B ٻولي ماڊل کان گڏيل وڌيڪ واضح ڪيترن ٻولين جي کلوننگ لاءِ.

ميڊيم · 7GB VRAM ڪوشش ڪريو

MOSS-TTSD

گھڻن ڳالھائيندڙن وارو دؤران 5 اسپيڪر تائين 60 منٽ جو آواز آواز جو کلون پوڊ ڪاسٽ

5 اسپيڪر ۽ 60 منٽن تائين گڏيل آڊيو سان پوڊ ڪاسٽ-شڪل گفتگو پيدا ڪريو.

ميڊيم · 12GB VRAM ڪوشش ڪريو

Ming-Omni TTS

44. 1kHz آءوٽپوٽ آواز جو کلون احساس ڪنٽرول ٻولي ڪنٽرول BGM پيدائش ڪمپيڪٽ 0. 5B

InclusionAI جو 0.5B Omni-Modal سڏ ماڊل اعليٰ وفاداري 44.1kHz آڪسائيڊ ۽ صفر-شوٽ آواز جي کلوننگ سان.

ميڊيم · 3GB VRAM ڪوشش ڪريو

MOSS-TTS Nano