Slobodna AI Tekst-u-govor
31+ modeli otvorenog koda, 231+ glasovi, 34+ Nema potrebe za računom.
Sve što trebate za glasovnu AI
30+ alata podržanih modelima UI otvorenog koda
31+ AI Voice Models
Najopsežnija kolekcija modela TTS otvorenog koda na jednoj platformi
Kokoro Slobodan
Kokoro je model tekst-u-govor sa 82 miliona parametara koji je daleko iznad svoje klase težine. Uprkos svojoj maloj veličini, on proizvodi izuzetno prirodan i izražajan govor. Kokoro podržava više jezika uključujući engleski, japanski, kineski i korejski sa različitim izražajnim glasovima. Radi nevjerojatno brzo — generirajući zvuk gotovo 100 puta brže nego u stvarnom vremenu na GPU.
Najbolje za: Visokokvalitetni TTS sa minimalnom latencijom, aplikacije za streaming
Probaj besplatno
Piper Slobodan
Piper je lagan motor za pretvorbu teksta u govor razvijen od strane Rhasspy koji koristi VITS i larynx arhitekture. Radi u potpunosti na CPU, što ga čini idealnim za edge uređaje, automatizaciju doma, i aplikacije koje zahtijevaju offline TTS. Sa preko 100 glasova na preko 30 jezika, Piper isporučuje prirodno zvučan govor u realnom vremenu čak i na Raspberry Pi 4.
Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije
Probaj besplatno
VITS Slobodan
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelna metoda koja generira prirodniji zvuk od trenutnih dvofaznih modela.Uzima varijacionalnu inferencu pojačanu normalizacijskim tokovima i adversarialnim procesom učenja, postižući značajno poboljšanje prirodnosti.
Najbolje za: Opća svrha tekst-u-govor s prirodnom prozodijom
Probaj besplatno
MeloTTS Slobodan
MeloTTS od MyShell.ai je višejezična TTS biblioteka koja podržava engleski (američki, britanski, indijski, australijski), španski, francuski, kineski, japanski i korejski. Iznimno je brza, obrađuje tekst skoro u realnom vremenu samo na CPU-u. MeloTTS je dizajniran za produkcijsku upotrebu i podržava i CPU i GPU zaključivanje.
Najbolje za: Produkcijske aplikacije trebaju brz, višejezični TTS
Probaj besplatno
OuteTTS Slobodan
OuteTTS proširuje velike jezičke modele sa mogućnostima tekst-u-govor, a istovremeno čuva originalnu arhitekturu. Podržava višestruke backendeve uključujući llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, pa čak i zaključivanje preglednika putem Transformers.js.
Najbolje za: Edge implementacija, TTS zasnovan na pregledniku, okruženja sa niskim resursima
Probaj besplatno
Pocket TTS Slobodan
Pocket TTS od Kyutai (kreatori Moshi) je kompaktan 100M parametara tekst-u-govor model koji je puno iznad svoje težine. Radi efikasno na CPU, podržava kloniranje glasa bez snimanja iz jednog audio uzorka, i proizvodi prirodno zvučan govor. Mala veličina modela ga čini idealnim za edge implementaciju i okruženja sa niskim resursima.
Najbolje za: Lako raspoređivanje, okruženja samo sa CPU-om, brzo kloniranje glasa
Probaj besplatno
Kitten TTS Slobodan
Kitten TTS by KittenML je ultra-lagani model tekst-u-govor izgrađen na ONNX. Sa varijantama od 15M do 80M parametara (25-80 MB na disku), on isporučuje visokokvalitetnu sintezu glasa na CPU bez potrebe za GPU. Ima 8 ugrađenih glasova, podesivu brzinu govora, i ugrađenu preprocesažu teksta za brojeve, valute i jedinice. Idealno za edge implementaciju i aplikacije sa niskim latencijama.
Najbolje za: Brzi, lagani TTS, edge implementacija, aplikacije sa niskim latencijama
Probaj besplatno
Bark Standardni
Tekst-u-zvuk model zasnovan na transformatorima koji generira realističan govor, muziku i zvučne efekte.
Programer: Suno · Licenca: MIT
Probaj.
Bark Small Standardni
Laganiji oblik Bark-a sa bržim zaključavanjem i manjom upotrebom memorije.
Programer: Suno · Licenca: MIT
Probaj.
CosyVoice 2 Standardni
Alibaba-in skalabilni streaming TTS sa ljudskom paritetom prirodnosti i skoro nultom latencijom.
Programer: Alibaba (Tongyi Lab) · Licenca: Apache 2.0
Probaj.
Dia TTS Standardni
Multi-speaker dijaloški model koji stvara prirodne razgovore između govornika.
Programer: Nari Labs · Licenca: Apache 2.0
Probaj.
Parler TTS Standardni
Opisujte glas koji želite u prirodnom jeziku i Parler će generirati odgovarajući govor.
Programer: Hugging Face · Licenca: Apache 2.0
Probaj.
GLM-TTS Standardni
Najveći broj slučajeva je u odnosu na početne vrijednosti T-limfocita.
Programer: Zhipu AI · Licenca: GLM-4 License
Probaj.
IndexTTS-2 Standardni
Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.
Programer: Index Team · Licenca: Bilibili Model License
Probaj.
Spark TTS Standardni
Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.
Programer: SparkAudio · Licenca: CC BY-NC-SA 4.0
Probaj.
GPT-SoVITS Standardni
Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.
Programer: RVC-Boss · Licenca: MIT
Probaj.
Orpheus Standardni
Emocionalni TTS model na ljudskom nivou obučen na 100K sati govornih podataka.
Programer: Canopy Labs · Licenca: Llama 3.2 Community
Probaj.
Qwen3 TTS Standardni
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Programer: Alibaba (Qwen) · Licenca: Apache 2.0
Probaj.
Chatterbox Turbo Standardni
Brži Chatterbox sa latencijom ispod 200 ms i paralingvističkim oznakama za smijeh, kašalj i drugo.
Programer: Resemble AI · Licenca: MIT
Probaj.
Dia 2 Standardni
Prvi je u svijetu razvio konverzacijski TTS sa multi-govornikom dijalogom i paralingvističkim signalima.
Programer: Nari Labs · Licenca: Apache 2.0
Probaj.
VoxCPM Standardni
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistency.
Programer: OpenBMB · Licenca: Apache 2.0
Probaj.
TADA Standardni
TTS sa nultom halucinacijom sa tekst-akustičnim dvostrukim poravnanjem, 5x brži od usporedivog LLM TTS.
Programer: Hume AI · Licenca: MIT
Probaj.
VibeVoice Standardni
Microsoftov model za dugotrajni multi-speaker sadržaj kao što su podcasti i audioknjige.
Programer: Microsoft · Licenca: MIT
Probaj.
CosyVoice3 Standardni
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Programer: Alibaba (FunAudioLLM) · Licenca: Apache 2.0
Probaj.
CosyVoice 2
Alibaba-in skalabilni streaming TTS sa ljudskom paritetom prirodnosti i skoro nultom latencijom.
Jezici: en, zh, ja, ko, fr, de, it, es
Glas
IndexTTS-2
Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.
Jezici: en, zh
Glas
Spark TTS
Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.
Jezici: en, zh
Glas
GPT-SoVITS
Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.
Jezici: en, zh, ja, ko
Glas
Tortoise TTS
Višeglasni tekst-u-govor fokusiran je na kvalitetu sa autoregresivnom arhitekturom.
Jezici: en
Glas
OpenVoice
Instant kloniranje glasa sa granularnom kontrolom stila, emocija i naglaska.
Jezici: en, zh, ja, ko, fr, de, es, it
Glas
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it
Glas
Chatterbox Turbo
Brži Chatterbox sa latencijom ispod 200 ms i paralingvističkim oznakama za smijeh, kašalj i drugo.
Jezici: en
Glas
VoxCPM
Tokenizer-free TTS produces 44.1kHz audio with context-aware paragraph consistency.
Jezici: en, zh
Glas
OuteTTS
LLM-based TTS koji radi na CPU, GPU, ili pregledniku preko llama.cpp i Transformers.js.
Jezici: en
Glas
Pocket TTS
100M parametar model od strane Kyutai sa kloniranjem glasa iz jednog uzorka.
Jezici: en, fr
Glas
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Jezici: en, zh, ja, ko, de, es, fr, it, ru
Glas
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Jezici: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Glas
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Jezici: en, zh
GlasDeveloper-First API
OpenAI-kompatibilni REST API. Jedna krajnja tačka, 22+ modela. Podrška za streaming aplikacija u realnom vremenu.
- OpenAI-kompatibilni format
- Streaming TTS za aplikacije u stvarnom vremenu
- Serijska obrada za velike zadatke
- Webhook obavijesti
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednostavno, transparentno određivanje cijena
Počnite besplatno, povećavajte kako rastete.
Slobodan
15 kredita
- Kokoro, Piper, VITS, MeloTTS
- 500 znakova
- 3 gen/sat (bez računa)
Starter
500 kredita/mjesečno
- Sve 22+ modela
- 100.000 znakova po generaciji
- Kloniranje glasa
Pro
2,000 kredita/mjesečno
- Sve u Starteru
- API pristup
- Prioritetna obrada
Često postavljana pitanja
Šta možemo da poboljšamo? Vaše povratne informacije nam pomažu da riješimo probleme.
Počnite koristiti AI Voice danas
Pridružite se kreatorima, programerima i kompanijama koje koriste TTS.ai