Prosti AI Besedilo v govor

82M parametri Ultra-hitri Izraženi glasovi Večjezična Tekoča podpora

Lahek model 82M parametrov, ki zagotavlja kakovostno studio govora z žareče-hitro inferenco.

Hitro · 1.5GB VRAM Poskusi.

Piper

Prijazno za CPU Neomejeno sposoben 100+ glasov 35+ jezikov Podpora SSML

Hitro, lokalno neuralno besedilo za govorni sistem optimiziran za Maline Pi in vgrajene naprave.

Hitro · 0 (CPU only) VRAM Poskusi.

VITS

Sinteza od konca do konca Naravna prozodija Hitro ugotavljanje Več zvočnikov

Pogojni variacijski avtokoder z adversarialnim učenjem za končno besedilo-to-speech.

Hitro · 1GB VRAM Poskusi.

MeloTTS

Optimizirano s CPU-om Večjezična Večkratni naglasi Pripravljena proizvodnja Nizka zamuda

Visokokakovostna večjezična besedila-na-špik, ki teče na CPU z minimalno latencijo.

Hitro · 0.5GB (GPU optional) VRAM Poskusi.

Bark

Zvočni učinki Smeh/tehtanje Ustvarjanje glasbe 100+ govorniki Večjezična

Transformer-na-audio model, ki ustvarja realen govor, glasbo in zvočne učinke.

Počasi · 5GB VRAM Poskusi.

Bark Small

Lahka Hitreje kot polni Bark čustveni govor Večjezična

Lažja različica Barka z hitrejšim zaključkom in manjšim uporabo pomnilnika.

Srednja · 2GB VRAM Poskusi.

CosyVoice 2

Streaming Kloniranje brez strelov Medjezični Upravljanje čustev Človeška pariteta

Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.

Dia TTS

Večzvočnik Ustvarjanje pogovornega okna Naravna obratovanje Čustveni izraz 1.6B parametri

Večzvočniški dialogski model, ki ustvarja naravne pogovore med zvočniki.

Parler TTS

Opis glasa Nadzor naravnega jezika Prilagodljivo ustvarjanje glasu Ni potrebnih prednastavljenih glasov

Opišite glas, ki ga želite v naravnem jeziku in Parler ustvarja enak govor.

Indic Parler TTS

11 indijskih jezikov Opis glasa Nadzor naravnega jezika Pristni indijski izgovor

Visokokakovostni govor za 8+ indijske jezike z naravno-jezičnim nadzorom glasu.

Počasi · 8GB VRAM Poskusi.

KhanomTan TTS

Tajska TTS Več zvočnikov Arhitektura YourTTS Komercialno varno dovoljenje

Tajsko-prvo besedilo-na-speech z izbiro glasov govornika.

Hitro · 2GB VRAM Poskusi.

IndexTTS-2

Upravljanje čustev Nikakršen udarec. Vektorji čustev Izrazni govor Fino zrele kontrole

Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.

Spark TTS

kloniranje glasu Upravljanje čustev Nadzor sloga Na podlagi prošnje 5-sekundno kloniranje

Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.

GPT-SoVITS

5-sekundno kloniranje Pojalni glas Malokratno učenje Visoka zvestoba Medjezični

Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.

Počasi · 6GB VRAM Poskusi.

Orpheus

Čustva na človeški ravni 100K ur treninga Naravni poudarek Izrazni govor

Emocionalni TTS model na človeški ravni je izurjen na 100K urah govora.

Chatterbox

Kloniranje brez strelov Upravljanje čustev Visoka zvestoba Prenos sloga Kloniranje enega vzorca

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Tortoise TTS

Najvišja kakovost Večglasovni Arhitektura DALL-E kloniranje glasu Samodejno regresivno

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Počasi · 8GB VRAM Poskusi.

StyleTTS 2

Človeška raven Difuzija sloga Usposabljanje nasprotnikov Naravna sprememba Visoka zvestoba

Z difuzijo sloga in nasprotnim usposabljanjem na ravni ljudi.

OpenVoice

Hitro kloniranje Pretvorba glasu Upravljanje čustev Nadzor nad akcentom Večjezična

Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.

Qwen3 TTS

9 prednastavljenih glasov Zasnova glasu iz besedila Upravljanje čustev 10 jezikov

Alibabov večjezični TTS z nastavljenimi glasovi in oblikovanjem glasu iz besedila.

Srednja · 7GB VRAM Poskusi.

VieNeu-TTS-v2

7 prednastavljenih glasov (sever + južni naglas) Preklop kode en-Vi kloniranje glasu (3-5s referenca) Podcast / večzvočniška podpora Samo za CPU – ni potreben GPU

Vietnamski + angleški kodni preklopnik TTS s 7 prednastavljenih glasov in kloniranje glasu brez utripa. CPU-samo, GPU ni potreben.

Hitro · CPU VRAM Poskusi.

Sesame CSM

Pogovorno Naravni časovni razpored Obrnitev Zadnji kanal Parametri 1B

Pogovorni model govora ustvarja naravni dialog z ustreznim časovnim razporedom in čustvi.

Počasi · 8GB VRAM Poskusi.

Chatterbox Turbo

Pod-200ms latency Paralinguistične oznake 6x v realnem času kloniranje glasu Označevanje mejnih vrednosti

Hitreje Chatterbox z pod-200ms latency in paralinguistične oznake za smeh, kašelj in več.

Hitro · 2GB VRAM Poskusi.

VoxCPM

Zvok 44.1kHz Brez tokenizerja Kloniranje med jeziki Obveščenost o kontekstu Dobro uravnavanje loRA

TTS brez tokenizerja, ki proizvaja zvok 44.1kHz z doslednostjo iz konteksta.

Hitro · 4GB VRAM Poskusi.

Kani TTS 2

3GB VRAM Ultra-hitri Lahka Nanokodek Prosto

Ultra-lahek model 400M angleškega TTS, ki teče samo v 3GB VRAM.

Hitro · 3GB VRAM Poskusi.

OuteTTS

Preverjanje procesa Preverjanje brskalnika Več orodij Profili zvočnikov

LLM-based TTS, ki deluje na CPU, GPU ali brskalnik preko lama.cpp in Transformers.js.

Počasi · 2GB VRAM Poskusi.

VibeVoice

Večzvočnik Do 90 min Generacija podcasta Doslednost govornika 200ms streaming

Microsoft model za dolgoformne večzvočniške vsebine, kot so podcasti in zvočne knjige.

Hitro · 4GB VRAM Poskusi.

Pocket TTS

Parametri 100M Preverjanje procesa kloniranje glasu Kloniranje z enim vzorcem Pripravljena na rob

Lahek model parametrov 100M s strani Kyutai z kloniranjem glasu iz enega vzorca.

Hitro · 1GB VRAM Poskusi.

Kitten TTS

Preskus samo za CPU Pod velikostjo modela 80MB 8 vgrajenih glasov Upravljanje hitrosti Na podlagi ONNX Izhod 24kHz

Ultra-lahka TTS pod 80MB. Teče na CPU brez GPU.

Hitro · 0GB VRAM Poskusi.

CosyVoice3

Dvojno stromiranje Upravljanje čustev kloniranje glasu Upravljanje hitrosti/ obsega Navodila, ki sledijo

Naslednja generacija večjezični TTS z dvojnim streamingom, kontrolo čustev in ničelnim kloniranjem glasu.

Hitro · 4GB VRAM Poskusi.

NAMAA Saudi TTS

Saudski arabski dialekt Sodobni standardni arabski Kloniranje glasu brez utripa Upravljanje čustev Naravni izgovor

Prvi odprt saudsko-arabski TTS. Naravni saudski dialekt s Chatterbox kakovost glas kloniranje.

Srednja · 6GB VRAM Poskusi.

Darwin TTS

kloniranje glasu Medjezični FFN-krvav 4 temeljni jeziki Qwen3 hrbtenica

Medmodalna različica Qwen3-TTS z uteži FFN zmešana iz jezikovnega modela Qwen3-1,7B za ostrejšo večjezično kloniranje.

Srednja · 7GB VRAM Poskusi.

MOSS-TTSD

Pogovorno okno z več zvočniki Do 5 govornikov 60min koherentnega zvoka kloniranje glasu optimizirani podcast

Model za nadaljevanje večzvočniškega dialoga – ustvari pogovore v stilu podcasta z do 5 zvočniki in 60 minutami skladnega zvoka.

Srednja · 12GB VRAM Poskusi.

Ming-Omni TTS

Izhod 44.1kHz kloniranje glasu Upravljanje čustev Upravljanje dialektov Generacija BGM Kompaktno 0,5B

Compact 0.5B vsemodalni govorni model iz vključevanjaAI z visoko vernostjo 44.1kHz izhoda in kloniranjem glasu brez utripa.

Srednja · 3GB VRAM Poskusi.

MOSS-TTS Nano