وړیا AI ليکنه وينا ته

پېرامېټرونه 82M ډېر چټک څرګندوونکې غږونه ګڼ ژبنی غږيز ملاتړ

د سپک وزن 82M پارامتر ماډل د سټوډیو کیفیت خبرې اترې سره د ګړندۍ ګړندي استنباط وړاندې کوي.

:دوتنه · 1.5GB VRAM هڅه کول

Piper

يوون- دوستانه نالېږد وړتيا ١٠٠+ غږونه 30+ ژبې ملاتړ SSML

یو چټک، محلي عصبي متن ته د وینا سیسټم چې د Raspberry Pi او پوښل شوي وسیلو لپاره غوره شوی.

:دوتنه · 0 (CPU only) VRAM هڅه کول

VITS

پای-تر-پای ترکیب طبیعي نظم چټک استنباط ګڼ غږوونکي

شرطي variational autoencoder سره د متن-to-speech لپاره د پای-to-end adversarial زده کړه.

:دوتنه · 1GB VRAM هڅه کول

MeloTTS

د يوون سمبالښت ګڼ ژبنی ګڼ لوښېKCharselect unicode block name د توليد لپاره چمتو ټيټه ځنډېدنه

د لوړ کیفیت څو ژبه متن-to-څرګندونې چې د لږ تر لږه latency په CPU چلوي.

:دوتنه · 0.5GB (GPU optional) VRAM هڅه کول

Bark

غږ اغېزې خندا/خپګان د سندرو توليد 100+ غږونکي ګڼ ژبنی

د ترانسپورت پر بنسټ د متن څخه غږیز ماډل چې واقعیت لرونکي وینا، موسیقۍ او غږ اغېزې تولیدوي.

ورو · 5GB VRAM هڅه کول

Bark Small

سپک وزن له بشپړې پاڼې څخه چټک احساساتي ژبه ګڼ ژبنی

سره د چټک استنباط او د حافظې د کارولو کم د Bark روښانه نسخه.

منځنی · 2GB VRAM هڅه کول

CosyVoice 2

لېږل صفر شېټ کلوننګ کراس ژبه احساس کنټرول د انسان برابروالی

د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.

Dia TTS

ګڼ غږونکی کړکۍ جوړول طبیعي پړاو نیول احساساتي څرګندونه پېرامېټرونه

د څو ويناوالو د خبرو اترو نسل ماډل چې د ويناوالو ترمنځ طبیعي خبرې اترې رامینځته کوي.

Parler TTS

غږيز سپړاوی طبیعي ژبه کنټرول انعطاف منونکی غږ جوړول هېڅ مخکې ټاکل شوي غږونه اړين نه دي

تاسو په طبیعي ژبه کې غواړئ غږ تشریح کړئ او Parler د مطابقت وینا تولیدوي.

Indic Parler TTS

هندي ژبې غږيز سپړاوی طبیعي ژبه کنټرول اصلي هندي لوستنهKCharselect unicode block name

د 8+ هند ژبو لپاره د لوړ کیفیت وینا د طبیعي ژبې غږ کنټرول.

ورو · 8GB VRAM هڅه کول

KhanomTan TTS

تايلي TTS ګڼ غږوونکي YourTTS جوړښت سوداګريز خوندي منښتليک

د تایلینډ لومړی متن-په-غږ سره د غږونکي غږونو انتخاب.

:دوتنه · 2GB VRAM هڅه کول

IndexTTS-2

احساس کنټرول صفر شوټ د احساس وکتورونه تعبيري ژبه دقيق کنټرول

صفر-شوت TTS سره fine-grained احساس کنټرول او لوړ expressivity.

Spark TTS

غږ نقلول احساس کنټرول ډول مهار پر پوښتنې بنسټيز ۵-سېکېنډه نقلول

د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.

GPT-SoVITS

۵-سېکېنډه نقلول غږېدلی غږ لنډمهاله زده کړه لوړ وفاداري کراس ژبه

څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.

ورو · 6GB VRAM هڅه کول

Orpheus

د انسان احساسات 100K ساعتونو روزنه طبیعي زور تعبيري ژبه

د انساني کچې احساساتي TTS ماډل د وینا د معلوماتو په 100K ساعتونو کې روزل شوی.

Chatterbox

صفر شېټ کلوننګ احساس کنټرول لوړ وفاداري ډول لېږل يوې نمونې نقلول

د Resemble AI څخه د احساس کنترول سره د state-of-the-art zero-shot غږ کلونینګ.

Tortoise TTS

لوړه کچه ګڼ غږونه DALL-E جوړښت غږ نقلول خپلکارې راګرځېدنه

د څو غږونو متن-تر-غږ په کیفیت تمرکز کوي د اتوریګریفیک معمارۍ سره.

ورو · 8GB VRAM هڅه کول

StyleTTS 2

د انسان کچ ډول خپرېدنه د مقابلې تمرين طبیعي توپیر لوړ وفاداري

د سټایل خپریدو او د مقابلې روزنې له لارې د انساني کچې متن څخه وینا ته.

OpenVoice

لنډمهاله نقلول غږ بدلول احساس کنټرول نښان مهار ګڼ ژبنی

د ګړندي غږ کلونینګ د سټایل، احساس، او ټینګار په اړه د غوړ کنټرول سره.

Qwen3 TTS

غږ نقلول 9 له مخکې ټاکل شوي غږونه د ليکنې نه غږ جوړونه احساس کنټرول

Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.

منځنی · 7GB VRAM هڅه کول

VieNeu-TTS-v2

7 دمخه ټاکل شوي غږونه (شمالي + سویل accents) کوډ-ځنډونه En-Vi غږ کلون (3-5s حواله) پوډکاسټ / څو-غږونکی ملاتړ CPU-only - نه GPU اړين

ویتنامي + انګلیسي کوډ-سویلنګ TTS د 7 preset غږونو او صفر-شوټ غږ کلونینګ سره. CPU-only، نه GPU اړین.

:دوتنه · CPU VRAM هڅه کول

Sesame CSM

غږيز طبیعي مهال پړاو نيول شاتني چينل پېرامېټرونه

د خبرو اترو ماډل چې د مناسب وخت او احساس سره طبیعي خبرو اترو ته وده ورکوي.

ورو · 8GB VRAM هڅه کول

Chatterbox Turbo

لاندې-200ms ځنډ پېرالنګوسي نښانونه 6x رښتيني مهال غږ نقلول اوبه نښې

چټک Chatterbox د sub-200ms latency او paralinguistic توري د خندا، کولمو، او نور.

:دوتنه · 2GB VRAM هڅه کول

VoxCPM

غږيز توکنيزېټر- وړيا کراس ژبه کلونينګ سرليک پوهېدونکی لورا دقيق ټاکنه

د Tokenizer-Free TTS تولید 44.1kHz آډیو سره د متن-aware پاراګراف مطابقت.

:دوتنه · 4GB VRAM هڅه کول

Kani TTS 2

۳ ګېبا VRAM ډېر چټک غږ نقلول سپک وزن نانوکوډېک

د 400M ماډل چې یوازې په 3GB VRAM کې د غږ کلون کولو ملاتړ سره چلیږي.

:دوتنه · 3GB VRAM هڅه کول

OuteTTS

د يوون چارنده لټوونی استنباط ګڼ شاتنۍ د ويناوالو پېژنيالونه

د LLM پر بنسټ TTS چې د CPU، GPU، یا د مرورګر له لارې د llama.cpp او Transformers.js له لارې چلیږي.

ورو · 2GB VRAM هڅه کول

VibeVoice

ګڼ غږونکی تر 90 دقیقې پوډکاسټ جوړول د غږوونکي مطابقت 200ms لېږل

د مایکروسافټ ماډل د اوږدې بڼې څو-څرګندونکو محتوا لکه پوډکاسټونه او آډیو کتابونه.

:دوتنه · 4GB VRAM هڅه کول

Pocket TTS

100M پېرامېټرونه د يوون چارنده غږ کلونول يو-نمونه کلونينګ بريد- چمتو

د Kyutai لخوا د یو واحد نمونې څخه د غږ کلون کولو سره د 100M پارامتر ماډل.

:دوتنه · 1GB VRAM هڅه کول

Kitten TTS

يوازې د يوون چارنده د 80MB ماډل کچ لاندې 8 جوړ شوي غږونه د چټکتيا کنټرول پر ONNX بنسټ وتۍ 24kHz

د 80MB لاندې الټرا-خړ TTS. پرته له GPU په CPU چلوي.

:دوتنه · 0GB VRAM هڅه کول

CosyVoice3

دوه اړخيز احساسات کنټرول غږ کلونول سرعت / حجم کنټرول لارښوونه

د راتلونکي نسل څو ژبه TTS سره د bi-streaming، احساس کنټرول، او صفر-شوت غږ کلونينګ.

:دوتنه · 4GB VRAM هڅه کول

NAMAA Saudi TTS

سعودي عربي ژبه عصري معياري عربيKCharselect unicode block name د صفر-شټ غږ نقلول احساسات کنټرول د ژبې لوستنه

لومړی د سعودي عرب TTS. د Chatterbox-کیفیت غږ کلونینګ سره د سعودي ژبه.

منځنی · 6GB VRAM هڅه کول

Darwin TTS

غږ کلونول ژبني ګډوډ FFN 4 اصلي ژبې Qwen3 لاندکی

د FFN وزن سره د کراس-موډل Qwen3-TTS ډول د Qwen3-1.7B ژبې ماډل څخه د تیز څو ژبو کلون کولو لپاره مخلوط شوی.

منځنی · 7GB VRAM هڅه کول

MOSS-TTSD

ګڼ غږونکی کړکۍ تر 5 غږوونکو 60min منسجم غږيز غږ کلونول پوډکاسټ ټاکنې

د څو غږیز خبرو اترو دوام ماډل - د 5 غږیز غږونو او د 60 دقیقو سره د پوډکاسټ ډول خبرې اترې رامینځته کړئ.

منځنی · 12GB VRAM هڅه کول

Ming-Omni TTS

وتۍ غږ کلونول احساسات کنټرول ژباړه کنترول BGM نسل د 0.5B کوچنی

د 0.5B د شاملولو AI څخه د 44.1kHz لوړ وفادارۍ او د صفر-شوټ غږ کلون کولو سره د 0.5B Omni-modal وینا ماډل.

منځنی · 3GB VRAM هڅه کول

MOSS-TTS Nano