Free AI Text to SpeechQuery

82M ma parameters Mofulumira kwambiri Maganizo owoneka bwino Chilankhulo chosiyanasiyana Streaming thandizo

Lightweight 82M parameter model imabweretsa mawu a studio-quality ndi chidziwitso chofulumira.

Mofulumira · 1.5GB VRAM Yambitsani

Piper

CPU-friendly Opanda zingwe zogwirizana 100 + mawu 35 + zinenero Kuthandizira SSML

M'malo mwake, njira yosinthira mawu ndi mawu yosinthidwa yosinthidwa kwa Raspberry Pi ndi zida zophatikizidwa.

Mofulumira · 0 (CPU only) VRAM Yambitsani

VITS

End-to-end synthesization Malemba a m'Baibulo Fast kumvetsa Okamba ambiri

Kusintha kwa autoencoder ndi kuphunzira kwa adversarial kwa end-to-end text-to-speech.

Mofulumira · 1GB VRAM Yambitsani

MeloTTS

CPU-optimized Mabungwe Malemba ambiri Kutulutsa-kuthamanga Low latency

High-quality multilingual text-to-speech yomwe imagwira ntchito pa CPU ndi latency yochepa.

Mofulumira · 0.5GB (GPU optional) VRAM Yambitsani

Bark

Zochitika za mawu Kucheka / kupweteka Music chitukuko 100 + okamba Chilankhulo chosiyanasiyana

Model ya text-to-audio yokhala ndi transformer yomwe imapanga mawu, nyimbo, ndi zotsatira za mawu zowoneka bwino.

Mofulumira · 5GB VRAM Yambitsani

Bark Small

Lightweight Mofulumira kuposa Full Bark Chilankhulo cha Emotional Chilankhulo chosiyanasiyana

Lighter mtundu wa Bark ndi mofulumira kumvetsa ndi pansi kugwiritsa ntchito kumbukirani.

M'mawu · 2GB VRAM Yambitsani

CosyVoice 2

Kutumiza Zero-shot cloning Cross-lingual Kuwongolera maganizo Human-parity

Alibaba's scalable streaming TTS ndi khalidwe la munthu-parity ndi kupitilira-zero latency.

Dia TTS

Wolankhula ambiri Kukhazikitsa kwa dialog Kusinthasintha kwachilengedwe Kusonyeza maganizo 1.6B Parameters

Multi-wokamba nkhani dialogue chiyambi cha mtundu womwe amaumba zokambirana zachilengedwe pakati pa okamba nkhani.

Parler TTS

Kufotokozera kwa mawu Chilankhulo chachilengedwe kuwongolera Kulenga mawu osinthika Sizikufunikira mawu osankhidwa kale

Kufotokozera mawu mukufuna mu chilankhulo chachilengedwe ndi Parler amapanga mawu ogwirizana.

Indic Parler TTS

11 Zilankhulo za ku India Kufotokozera kwa mawu Control ya zinenero zachilengedwe Authentic Indian kulankhula

Kulankhula kwabwino kwa 8+ mabungwe a Indian ndi kuwongolera mawu kwachilengedwe.

Mofulumira · 8GB VRAM Yambitsani

KhanomTan TTS

Thai TTS Okamba ambiri YourTTS architecture Lisensi yotetezeka yamalonda

Thai-yamba malemba-ku-kulankhula ndi kusankha kwa mawu okamba.

IndexTTS-2

Kuwongolera maganizo Zero-shot Ma vector a maganizo Chilankhulo cha Expressive Fine-grained kuwongolera

Zero-shot TTS ndi kuwongolera kwa maganizo olimba komanso kutanthauzira kwakukulu.

Spark TTS

Kusintha kwa mawu Kuwongolera maganizo Kuwongolera kwa mtundu Kuchokera pa lamulo 5-second cloning

Kulankhula kloning TTS ndi controlable chisoni ndi kulankhula mtundu mwa kufunsa.

GPT-SoVITS

5-second cloning Kuimba mawu Kuphunzira kwa ma shots ochepa High fidelity Cross-lingual

Few-shot mawu kloning TTS kuti amachitanso chilichonse mawu kuchokera 5 masekondi a audio.

Mofulumira · 6GB VRAM Yambitsani

Orpheus

Human-level emotion 100K maola ophunzitsa Mphatso yachilengedwe Chilankhulo cha Expressive

Model ya TTS yokhudzana ndi munthu yophunzitsa 100K maola a data ya mawu.

Chatterbox

Kusintha kwa zero-shot Kuwongolera maganizo High fidelity Kusintha kwa mtundu Kugwiritsa ntchito chitsanzo chimodzi

State-of-the-art zero-shot kujambula mawu ndi kuwongolera maganizo kuchokera ku Resemble AI.

Tortoise TTS

Mtengo wapatali Maganizo ambiri DALL-E chikhalidwe Kusintha kwa mawu Kusintha kwachidule

Multi-wolankhula malemba-ku-kulankhula kuganizira za katundu ndi autoregressive ukadaulo.

Mofulumira · 8GB VRAM Yambitsani

StyleTTS 2

Mtundu wa munthu Kufalitsa kwa mtundu Maphunziro otsutsana Zosintha zachilengedwe High fidelity

Kusintha kwa mawu kukhala mawu pamalingaliro a munthu pogwiritsa ntchito kufalitsa kwa mtundu ndi kuphunzitsa motsutsana.

OpenVoice

Chipangizo 3: Kusintha kwa mawu Kuwongolera maganizo Kuwongolera kwa Accent Chilankhulo chosiyanasiyana

Instant mawu kloning ndi granular kuwongolera pa mtundu, chisoni, ndi accent.

Qwen3 TTS

9 preset mawu Kujambula mawu kuchokera pamutu Kuwongolera maganizo 10 azinenero

TTS ya Alibaba ndi mawu osankhidwa ndi mawu osankhidwa kuchokera ku malemba.

M'mawu · 7GB VRAM Yambitsani

VieNeu-TTS-v2

7 preset mawu (North + South accents) En-Vi code-switching Kulankhula kloning (3-5s reference) Podcast / multi-wokamba nkhani thandizo CPU-only - palibe GPU yofunikira

Vietnamese + Chijeremani code-switching TTS ndi 7 preset mawu ndi zero-shot mawu kloning. CPU-khama, palibe GPU zofunika.

Mofulumira · CPU VRAM Yambitsani

Sesame CSM

Chilankhulo Timing yachilengedwe Kusinthasintha Backchannel 1B Parameters

Kulankhulana kwa mawu kumabweretsa uthenga woyenera ndi nthawi yoyenera ndi maganizo.

Mofulumira · 8GB VRAM Yambitsani

Chatterbox Turbo

Sub-200ms latency Masamba 6x nthawi yachidule Kusintha kwa mawu Kulemba

Faster Chatterbox ndi sub-200ms latency ndi paralinguistic tags kwa laughs, kupweteka, ndi zina zambiri.

VoxCPM

44.1kHz audio Tokenizer-free Cross-lingual cloning Kutengera mfundo LoRA fine-tuning

TTS yopanda Tokenizer yomwe imapanga 44.1kHz audio ndi kugwirizana kwa masamba omvetsetsa.

Mofulumira · 4GB VRAM Yambitsani

Kani TTS 2

3GB VRAM Mofulumira kwambiri Lightweight NanoCodec Opanda ndalama

Model ya 400M English TTS yokhala ndi 3GB VRAM.

Mofulumira · 3GB VRAM Yambitsani

OuteTTS

CPU inference Kumvetsa msakatuli Ma backends ambiri Ma profiles a wokamba

LLM-ogwirizana TTS kuti amayenda pa CPU, GPU, kapena browser kudzera llama.cpp ndi Transformers.js.

VibeVoice

Wolankhula ambiri Kufika 90 min Podcast chiyambi Kugwirizana kwa wokamba 200ms kusonkhana

Microsoft model for long-form multi-speaker content monga podcasts ndi audiobooks.

Mofulumira · 4GB VRAM Yambitsani

Pocket TTS

100M ma parameters CPU inference Kusintha kwa mawu Kugwiritsa ntchito Kusintha

Model ya 100M ya Kyutai ndi kulumikizana kwa mawu kuchokera ku satifiketi imodzi.

Mofulumira · 1GB VRAM Yambitsani

Kitten TTS

CPU-only inference Pambuyo 80MB mtundu wa mtundu 8 built-in mawu Kuwongolera kwamphamvu ONNX-based 24kHz kutulutsa

Ultra-lightweight TTS pansi 80MB. Amagwira ntchito pa CPU popanda GPU.

Mofulumira · 0GB VRAM Yambitsani

CosyVoice3

Bi-streaming Kuwongolera maganizo Kusintha kwa mawu Kuwongolera kwa Speed / volume Kuphunzitsa kutsatira

TTS yatsopano ya TTS ndi bi-streaming, kuwongolera maganizo, ndi kujambula mawu opanda kanthu.

Mofulumira · 4GB VRAM Yambitsani

NAMAA Saudi TTS

Chijeremani Arabic dialect Chijeremani chamakono Kujambula mawu kwa zero-shot Kuwongolera maganizo Kulankhula kwa mayina

Kuyamba kutsegulira Saudi-Arabic TTS. Native Saudi dialect ndi Chatterbox-quality voice cloning.

M'mawu · 6GB VRAM Yambitsani

Darwin TTS

Kusintha kwa mawu Cross-lingual FFN-osakanikirana 4 zinenero zazikulu Qwen3 backbone

Qwen3-TTS ndi mtundu wa Qwen3-1.7B, womwe umagwiritsa ntchito ma FFN kuti agwirizane ndi ma TTS ena.

M'mawu · 7GB VRAM Yambitsani

MOSS-TTSD

Multi- wokamba uthenga Kufika pa 5 okamba 60min coherent audio Kusintha kwa mawu Podcast-osinthidwa

Model yotsatira ya macheza a olankhula ambiri - kuyambitsa macheza a podcast-style ndi mpaka 5 olankhula ndi maola 60 a mawu ogwirizana.

M'mawu · 12GB VRAM Yambitsani

Ming-Omni TTS

44.1kHz kutulutsa Kusintha kwa mawu Kuwongolera maganizo Kuwongolera kwa maudindo Kubadwa kwa BGM Compact 0.5B

Model ya 0.5B yokhala ndi mawu osiyanasiyana a inclusionAI ndi 44.1kHz yokhala ndi 44.1kHz yokhala ndi 44.1kHz ndi zero-shot voice cloning.

M'mawu · 3GB VRAM Yambitsani

MOSS-TTS Nano

Compact 100M Fast kumvetsa Madera ambirimbiri Kusintha kwa mawu Mmodzi MOSS banja

Tiny 100M MOSS-TTS mtundu - chimodzimodzi chikhalidwe, 80x ochepa, free-tier latency.