Slobodna AL Tekst za govor
31+ modeli otvorenog izvora, 231+ glasove, 34+ jezici. Nije potreban račun.
Sve što trebaš za glasovnu inteligenciju
30+ alata napajanih modelima AI-a otvorenog izvora
31+ AI Glasovni modeli
Najopsežnija kolekcija modela TTS otvorenog izvora u jednoj platformi
Kokoro Free
Kokoro je 82 milijuna parametara text-to-speech model koji udara mnogo iznad svoje težine klase. Unatoč svojoj malenoj veličini, ona proizvodi izuzetno prirodan i ekspresivan govor. Kokoro podržava više jezika, uključujući engleski, japanski, kineski i korejski, s različitim izrazitivnim glasovima. To radi nevjerojatno brzo – stvaranje audio gotovo 100x brže od real-time na GPU.
Najbolje za: visokokvalitetni TTS s minimalnom latencijom, streaming aplikacije
Pokušaj slobodno
Piper Free
Piper je lagani tekst-na-špeech motor razvijen od strane Rhaspy koji koristi VITS i grkljan arhitekture. To radi u cijelosti na CPU, što je idealan za rubne uređaje, kućna automatizacija, i aplikacije zahtijeva offline TTS. Sa preko 100 glasova preko 30+ jezika, Piper donosi prirodno-zvučni govor na realnom vremenu brzine čak i na Raspberry Pi 4.
Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije
Pokušaj slobodno
VITS Free
VITS (Varicionalni zaključak s protivrečnim učenjem za kraj-na-kraj Tekst-na- govor) je paralelna metoda kraj-na-kraj TTS koja stvara više prirodnog zvučnog zvuka nego trenutni dvostupenjski modeli. Prihvaća varijacionalni zaključak pojačan s normalizacijskim tokovi i procesom protivrečnog treninga, što postiže značajno poboljšanje prirodnosti.
Najbolje za: Općenamenski tekst-na-speech s prirodnom prozodijom
Pokušaj slobodno
MeloTTS Free
MeloTTS by MyShell.ai je višejezična TTS biblioteka koja podupire engleski (američki, britanski, indijanski, australijski), španjolski, francuski, kineski, japanski i korejski. To je izuzetno brzo, obrada teksta pri skoro realnom vremenu samo na CPU. MeloTTS je dizajniran za proizvodnju korištenja i podržava i CPU i GPU zaključak.
Najbolje za: Proizvodnja zahtjeva za brzim, višejezičnim TTS-om
Pokušaj slobodno
OuteTTS Free
OutetTS proširuje velike jezičke modele s tekst-u-peech mogućnosti pri očuvanju originalne arhitekture. Ona podržava više pozadina uključujući llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, pa čak i zaključak preglednika preko Transformers.js. Mogućnosti nulto-shoot kloniranja glasa kroz zvučnike profile spremljene kao JSON.
Najbolje za: Raspoređivanje ruba, TTS na bazi preglednika, okruženja s niskim izvorima
Pokušaj slobodno
Pocket TTS Free
Pocket TTS by Kyutai (kreatori Moshi) je kompaktan model 100M parametara tekst-to-speech koji udara mnogo iznad svoje težine. Ona radi učinkovito na CPU, podržava kloniranje glasa nula-shot iz jednog zvučnog uzorka, i proizvodi prirodno-zvučni govor. Mala veličina modela čini ga idealnim za raspoređivanje ruba i niske izvorne sredine.
Najbolje za: Lagano raspoređivanje, CPU-samo okruženja, brzo kloniranje glasa
Pokušaj slobodno
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Najbolje za: Fast lightweight TTS, edge deployment, low-latency applications
Pokušaj slobodno
Bark Standard
Transformer-based text-to-audio model koji generira realan govor, glazbu, i zvučne efekte.
Razvojnik: Suno · Dozvola: MIT
Probaj.
Bark Small Standard
Lakša verzija Barka s bržim zaključkom i manjim korištenjem memorije.
Razvojnik: Suno · Dozvola: MIT
Probaj.
CosyVoice 2 Standard
Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.
Razvojnik: Alibaba (Tongyi Lab) · Dozvola: Apache 2.0
Probaj.
Dia TTS Standard
Višezvučnički dijaloški model koji stvara prirodne razgovore između zvučnika.
Razvojnik: Nari Labs · Dozvola: Apache 2.0
Probaj.
Parler TTS Standard
Opišite glas koji želite na prirodnom jeziku i Parler generira odgovarajući govor.
Razvojnik: Hugging Face · Dozvola: Apache 2.0
Probaj.
GLM-TTS Standard
Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.
Razvojnik: Zhipu AI · Dozvola: GLM-4 License
Probaj.
IndexTTS-2 Standard
Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.
Razvojnik: Index Team · Dozvola: Bilibili Model License
Probaj.
Spark TTS Standard
Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.
Razvojnik: SparkAudio · Dozvola: CC BY-NC-SA 4.0
Probaj.
GPT-SoVITS Standard
Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.
Razvojnik: RVC-Boss · Dozvola: MIT
Probaj.
Orpheus Standard
Emocionalni TTS model na ljudskoj razini obučen na 100K sati govora podataka.
Razvojnik: Canopy Labs · Dozvola: Llama 3.2 Community
Probaj.
Qwen3 TTS Standard
Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.
Razvojnik: Alibaba (Qwen) · Dozvola: Apache 2.0
Probaj.
Chatterbox Turbo Standard
Brže Chatterbox s pod-200ms latency i paralinguističke oznake za smijeh, kašalj, i više.
Razvojnik: Resemble AI · Dozvola: MIT
Probaj.
Dia 2 Standard
Streaming-prva razgovora TTS s višegovornika dijalogom i paralinguističkim znakovima.
Razvojnik: Nari Labs · Dozvola: Apache 2.0
Probaj.
VoxCPM Standard
TTS bez tokenizera proizvodi zvuk 44.1kHz s konzistentnošću kontekst-svjesnog paragrafa.
Razvojnik: OpenBMB · Dozvola: Apache 2.0
Probaj.
TADA Standard
Zero-halucinacija TTS s tekstualno-akustičnim dvostrukim poravnanjem, 5x brže od usporedive LLM TTS.
Razvojnik: Hume AI · Dozvola: MIT
Probaj.
VibeVoice Standard
Microsoft model za dugoformni višezvučni sadržaj poput podcasta i audio knjiga.
Razvojnik: Microsoft · Dozvola: MIT
Probaj.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Razvojnik: Alibaba (FunAudioLLM) · Dozvola: Apache 2.0
Probaj.
CosyVoice 2
Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.
Jezici: en, zh, ja, ko, fr, de, it, es
Kloniranje glasa
GLM-TTS
Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.
Jezici: en, zh
Kloniranje glasa
IndexTTS-2
Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.
Jezici: en, zh
Kloniranje glasa
Spark TTS
Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.
Jezici: en, zh
Kloniranje glasa
GPT-SoVITS
Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.
Jezici: en, zh, ja, ko
Kloniranje glasa
Chatterbox
Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.
Jezici: en
Kloniranje glasa
Tortoise TTS
Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.
Jezici: en
Kloniranje glasa
OpenVoice
Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.
Jezici: en, zh, ja, ko, fr, de, es, it
Kloniranje glasa
Qwen3 TTS
Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.
Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it
Kloniranje glasa
Chatterbox Turbo
Brže Chatterbox s pod-200ms latency i paralinguističke oznake za smijeh, kašalj, i više.
Jezici: en
Kloniranje glasa
VoxCPM
TTS bez tokenizera proizvodi zvuk 44.1kHz s konzistentnošću kontekst-svjesnog paragrafa.
Jezici: en, zh
Kloniranje glasa
OuteTTS
LLM-based TTS koji radi na CPU, GPU, ili preglednik preko lama.cpp i Transformers.js.
Jezici: en
Kloniranje glasa
Pocket TTS
Lagani model parametra 100M od strane Kyutai s kloniranjem glasa iz jednog uzorka.
Jezici: en, fr
Kloniranje glasa
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Jezici: en, zh, ja, ko, de, es, fr, it, ru
Kloniranje glasa
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Jezici: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Kloniranje glasa
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Jezici: en, zh
Kloniranje glasaProgramer- prvi API
OpenAI kompatibilan REST API. Jedan ishod, 22+ modeli. Streaming support for real-time applications.
- OpenAI kompatibilan format
- Streaming TTS za aplikacije u realnom vremenu
- Paketska obrada za velike poslove
- Webhook obavijesti
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednostavna, prozirna cijena
Počnite slobodno.
Slobodno
15 kredita
- Kokoro, Piper, VITS, MeloTTS
- Ograničenje znaka
- 3 gen/sat (bez računa)
Pokretanje
500 kredita/mjesečno
- Svi 22+ modeli
- 100.000 znakova po generaciji
- Kloniranje glasa
Profesionalno
2.000 kredita/mjesečno
- Sve u Starteru
- API pristup
- Prioritetna obrada
Česta pitanja
Što možemo poboljšati? Vaša povratna informacija nam pomaže riješiti probleme.
Počnite koristiti AI glas danas
Pridružite se kreatorima, programerima i poduzećima koji koriste TTS.ai