Bezmaksas AI Teksts uz runu

82M parametri Ultra-ātrs Izteiksmīgas balsis Daudzvalodu Straumēšanas atbalsts

Viegls 82M parametra modelis, kas nodrošina studijas-kvalitātes runu ar blazing-fast inference.

Ātrs · 1.5GB VRAM Pamēģini to

Piper

CPU draudzīgs Bezsaistē spējīgs 100+ balsis 35+ valodas VUML atbalsts

Ātrs, vietējais neiroloģiskais teksts uz runu sistēmu optimizēta Aveņu Pi un iegultās ierīces.

Ātrs · 0 (CPU only) VRAM Pamēģini to

VITS

Sintēze no gala līdz galam Dabiskā prozodija Ātra instruktāža Vairāki runātāji

Nosacījumi variācijas autoenkoders ar pretrunu mācīšanos gala līdz galam tekstu-to-speech.

Ātrs · 1GB VRAM Pamēģini to

MeloTTS

CPU optimizēts Daudzvalodu Vairāki akcenti Gatavs ražošanai Zema latentuma

Augstas kvalitātes daudzvalodu tekstu-to-speech, kas darbojas uz CPU ar minimālu latentumu.

Ātrs · 0.5GB (GPU optional) VRAM Pamēģini to

Bark

Skaņas iedarbība Smejas/smadzenes Mūzikas paaudze 100+ runātāji Daudzvalodu

Transformatoru balstīta teksta-audio modelis, kas rada reālistisku runu, mūziku un skaņas efektus.

Lēni · 5GB VRAM Pamēģini to

Bark Small

Viegla masa Ātrāks par pilnu mizu Emocionāla runa Daudzvalodu

Vieglāka versija bark ar ātrāku inclusion un zemāku atmiņas izmantošanu.

Vidējs · 2GB VRAM Pamēģini to

CosyVoice 2

Straume Nulles karstuma klonēšana Cross-lingvistic Emocijas kontrole Cilvēka paritāte

Alibaba straumējamais TTS ar cilvēka paritāti naturalitāti un gandrīz nulles latenci.

Dia TTS

Vairāku skaļruņu Dialoga ģenerēšana Dabas paņēmiens Emocionālā izteiksme Parametri 1.6B

Vairāku runātāju dialoga paaudzes modelis, kas rada dabiskas sarunas starp runātājiem.

Parler TTS

Balss apraksts Dabisko valodu kontrole Elastīga balss radīšana Nevajadzīgas iepriekš iestatītas balsis

Aprakstiet, kāda balss vēlaties dabas valodā, un Parler rada atbilstošu runu.

Indic Parler TTS

11 Indiāņu valodas Balss apraksts Dabisko valodu kontrole Autentisks indikācijas izruna

Augstas kvalitātes runa 8+ indiešu valodām ar dabīgo valodu balss kontroli.

Lēni · 8GB VRAM Pamēģini to

KhanomTan TTS

Taizemes TTS Vairāki runātāji YourTTS arhitektūra Komerciāli droša licence

Thai-pirmais teksts-to-speech ar izvēli runātāju balsis.

Ātrs · 2GB VRAM Pamēģini to

IndexTTS-2

Emocijas kontrole Nulles sitiens Emocijas vektori Izteiksmīga runa Sīkgraudu kontrole

Nulle-shot TTS ar smalki graudainu emociju kontroli un augstu izteiksmi.

Spark TTS

Balss klonēšana Emocijas kontrole Stils kontrole Uz aiztures pamata 5 sek. klonēšana

Balss klonēšana TTS ar kontrolējamu emociju un runāšanas stilu, izmantojot pamudinājumus.

GPT-SoVITS

5 sek. klonēšana Dziedošā balss Nedaudzu šaujamieroču apgūšana Augsta uzticamība Cross-lingvistic

Mazshot balss klonēšanas TTS, kas atkārto jebkuru balsi no tikai 5 sekundes audio.

Lēni · 6GB VRAM Pamēģini to

Orpheus

Cilvēka līmeņa emocijas Apmācība 100K stundās Dabisks uzsvars Izteiksmīga runa

Cilvēka līmeņa emocionālo TTS modelis apguvis 100K runas stundas.

Chatterbox

Nulles karstuma klonēšana Emocijas kontrole Augsta uzticamība Stils pārsūtīšana Atsevišķu paraugu klonēšana

Mūsdienu nulles-shot balss klonēšana ar emociju kontroli no Reemble AI.

Tortoise TTS

Augstākā kvalitāte Daudzbalsu DALL-E arhitektūra Balss klonēšana Autoregresīvs

Daudzbalsu teksts-to-speech koncentrējas uz kvalitāti ar autoregesīvu arhitektūru.

Lēni · 8GB VRAM Pamēģini to

StyleTTS 2

Cilvēka līmenis Stilu difūzija Sacīkstes mācības Dabas variācijas Augsta uzticamība

Cilvēka līmeņa tekstu-to-speech caur stilu difūzija un sacīkstes apmācību.

OpenVoice

Momenta klonēšana Balss konvertēšana Emocijas kontrole Akustīga kontrole Daudzvalodu

Instant balss klonēšana ar granulu kontroli pār stilu, emocijām un akcentu.

Qwen3 TTS

9 iepriekš iestatītas balsis Balss dizains no teksta Emocijas kontrole 10 valodas

Alibaba daudzvalodu TTS ar iepriekš iestatītām balsīm un balss dizainu no teksta.

Vidējs · 7GB VRAM Pamēģini to

VieNeu-TTS-v2

7 iepriekš iestatītas balsis (ziemeļi + dienvidu akcenti) En-Vi kodu skaitīšana Balss klonēšana (3-5 s atsauce) Podcast / vairāku skaļruņu atbalsts Tikai CPU – nav vajadzīgs GPU

Vjetnamiešu + Angļu kods-switching TTS ar 7 iepriekš iestatītas balsis un nulles-shot balss klonēšana. CPU tikai, nav GPU nepieciešams.

Ātrs · CPU VRAM Pamēģini to

Sesame CSM

Apspriedes Dabiskais laiks Apgrozījums Aizmugurējais kanāls 1B parametri

Sarunu runas modelis, kas rada dabisku dialogu ar atbilstošu laiku un emocijām.

Lēni · 8GB VRAM Pamēģini to

Chatterbox Turbo

200 m latentums Paralingvistiskie tagi 6x reālā laika Balss klonēšana Ūdenszīmes

Ātrāka čatterbox ar sub-200m latentumu un paralinguistiskas tags smieties, klepus, un vairāk.

Ātrs · 2GB VRAM Pamēģini to

VoxCPM

44.1.kHz audio Bez tokeneriem Šķērsvalodas klonēšana Konteksts LoRA precizēšana

TTS bez tokenaizera, kas ražo 44.1kHz audio ar konteksts-aparatūru punktu konsistences.

Ātrs · 4GB VRAM Pamēģini to

Kani TTS 2

3GB VRAM Ultra-ātrs Viegla masa Nanokodsc Bezmaksas

Ultra-vieglsvars 400M Angļu TTS modelis darbojas tikai 3GB VRAM.

Ātrs · 3GB VRAM Pamēģini to

OuteTTS

CPU ievade Pārlūkotāja ievads Vairākas aizmugures Skaļruņu profili

LLM balstītas TTS, kas darbojas uz CPU, GPU, vai pārlūkprogramma, izmantojot llama.cpp un Transformers.js.

Lēni · 2GB VRAM Pamēģini to

VibeVoice

Vairāku skaļruņu Līdz 90 min Podcast ģenerēšana Skaļruņu konsekvence 200 m straume

Microsoft modelis ilgtermiņa multi skaļruņu saturam, piemēram, podcast un audiogrāmatām.

Ātrs · 4GB VRAM Pamēģini to

Pocket TTS

100M parametri CPU ievade Balss klonēšana Vienparauga klonēšana Gatavs malai

Viegls Kyutai 100M parametru modelis ar balss klonēšanu no viena parauga.

Ātrs · 1GB VRAM Pamēģini to

Kitten TTS

Tikai CPU ievade Mazāk par 80MB modeļa izmēru 8 iebūvētas balsis Ātruma kontrole uz ONNX bāzes 24kHz izvade

Ultra-vieglsvara TTS zem 80MB. Skrien ar procesoru bez GPU.

Ātrs · 0GB VRAM Pamēģini to

CosyVoice3

Sadale Emocijas kontrole Balss klonēšana Ātruma/tilpuma regulēšana Instrukcijas:

Nākamās paaudzes daudzvalodu TTS ar divstraumu, emociju kontroli un nulles kadru balss klonēšanu.

Ātrs · 4GB VRAM Pamēģini to

NAMAA Saudi TTS

Saūda Arābijas dialekti Mūsdienu standarta arābu Nulles karstuma balss klonēšana Emocijas kontrole Valsts izruna

Pirmā atvērtā Saūda Arābijas TTS. Native Saūda Arābijas dialekts ar Chatterbox kvalitātes balss klonēšanu.

Vidējs · 6GB VRAM Pamēģini to

Darwin TTS

Balss klonēšana Cross-lingvistic FFN iztukšots 4 pamatvalodas Qwen3 mugurkauls

Krustveida Qwen3-TTS variants ar FFN atsvariem, kas sajaukti no Qwen3-1,7B valodas modeļa asākai daudzvalodu klonēšanai.

Vidējs · 7GB VRAM Pamēģini to

MOSS-TTSD

Vairāku skaļruņu dialogs Līdz 5 runātājiem 60 min saskaņots audio Balss klonēšana Podcast optimāla

Vairāku skaļruņu dialoga turpināšanās modelis — ģenerēt podcast tipa sarunas ar līdz 5 skaļruņiem un 60 minūtes ar saskaņotu audio.

Vidējs · 12GB VRAM Pamēģini to

Ming-Omni TTS

44.1.kHz izvade Balss klonēšana Emocijas kontrole Dialektu kontrole BGM ģenerēšana Kompakts 0.5B

Compact 0.5B visa modālā runas modelis no inclusionAI ar augstu uzticamību 44,1kHz izvadi un nulles kadru balss klonēšanu.

Vidējs · 3GB VRAM Pamēģini to

MOSS-TTS Nano