Free AI Tekst-u-govor
20+ modeli otvorenog koda, 107+ glasovi, 32+ Nije potreban račun.
Sve što trebate za glasovnu AI
30+ alata podržanih modelima UI otvorenog koda
20+ AI Voice Models
Najopsežnija kolekcija modela TTS otvorenog koda na jednoj platformi
Kokoro Free
Kokoro je model tekst-u-govor sa 82 miliona parametara koji je daleko iznad svoje klase težine. Uprkos svojoj maloj veličini, on proizvodi nevjerojatno prirodan i ekspresivan govor. Kokoro podržava više jezika uključujući engleski, japanski, kineski i korejski sa različitim ekspresivnim glasovima. Radi nevjerojatno brzo — generirajući zvuk gotovo 100 puta brže nego u stvarnom vremenu na GPU.
Najbolje za: TTS visokog kvaliteta sa minimalnom latencijom, aplikacije za streaming
Probaj besplatno
Piper Free
Piper je lagan motor za pretvorbu teksta u govor razvijen od strane Rhasspy koji koristi VITS i larynx arhitekture. Radi u potpunosti na CPU, što ga čini idealnim za edge uređaje, automatizaciju doma, i aplikacije koje zahtijevaju offline TTS. Sa preko 100 glasova na preko 30 jezika, Piper isporučuje prirodno zvučan govor u realnom vremenu čak i na Raspberry Pi 4.
Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije
Probaj besplatno
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelni end-to-end TTS metod koji generira više prirodnog zvuka od trenutnih dvofaznih modela.On prihvaća varijacionalnu inferenciju pojačanu normalizirajućim tokovima i adversarialnim procesom treniranja, postižući značajno poboljšanje prirodnosti.
Najbolje za: Tekst-u-govor opće namjene s prirodnom prozodijom
Probaj besplatno
MeloTTS Free
MeloTTS od MyShell.ai je višejezična TTS biblioteka koja podržava engleski (američki, britanski, indijski, australijski), španski, francuski, kineski, japanski i korejski. Iznimno je brza, obrađuje tekst skoro u realnom vremenu samo na CPU-u. MeloTTS je dizajniran za produkcijsku upotrebu i podržava i CPU i GPU zaključivanje.
Najbolje za: Produkcijske aplikacije trebaju brz, višejezični TTS
Probaj besplatno
Bark Standard
Tekst-u-zvuk model zasnovan na transformatorima koji generira realističan govor, muziku i zvučne efekte.
Programer: Suno · Licenca: MIT
Probaj.
Bark Small Standard
Laganiji oblik Bark-a sa bržim zaključavanjem i manjom upotrebom memorije.
Programer: Suno · Licenca: MIT
Probaj.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Programer: Alibaba (Tongyi Lab) · Licenca: Apache 2.0
Probaj.
Dia TTS Standard
Multi-speaker dialogue generation model that creates natural conversations between speakers.
Programer: Nari Labs · Licenca: Apache 2.0
Probaj.
Parler TTS Standard
Opisujte glas koji želite u prirodnom jeziku i Parler će generirati odgovarajući govor.
Programer: Hugging Face · Licenca: Apache 2.0
Probaj.
GLM-TTS Standard
Najveći broj slučajeva je u odnosu na početne vrijednosti T-limfocita.
Programer: Zhipu AI · Licenca: GLM-4 License
Probaj.
IndexTTS-2 Standard
Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.
Programer: Index Team · Licenca: Bilibili Model License
Probaj.
Spark TTS Standard
Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.
Programer: SparkAudio · Licenca: CC BY-NC-SA 4.0
Probaj.
GPT-SoVITS Standard
Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.
Programer: RVC-Boss · Licenca: MIT
Probaj.
Orpheus Standard
Emocionalni TTS model na ljudskom nivou obučen na 100K sati govornih podataka.
Programer: Canopy Labs · Licenca: Llama 3.2 Community
Probaj.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Programer: Alibaba (Qwen) · Licenca: Apache 2.0
Probaj.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.
Jezici: en, zh, ja, ko, fr, de, it, es
Glas
IndexTTS-2
Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.
Jezici: en, zh
Glas
Spark TTS
Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.
Jezici: en, zh
Glas
GPT-SoVITS
Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.
Jezici: en, zh, ja, ko
Glas
Tortoise TTS
Višeglasni tekst-u-govor fokusiran je na kvalitetu sa autoregresivnom arhitekturom.
Jezici: en
Glas
OpenVoice
Instant kloniranje glasa sa granularnom kontrolom nad stilom, emocijama i naglaskom.
Jezici: en, zh, ja, ko, fr, de, es, it
Glas
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it
GlasDeveloper-First API
OpenAI-kompatibilni REST API. Jedna krajnja tačka, 22+ modela. Podrška za streaming aplikacija u realnom vremenu.
- OpenAI-kompatibilni format
- Streaming TTS za aplikacije u stvarnom vremenu
- Serijska obrada za velike zadatke
- Webhook obavijesti
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednostavno, transparentno određivanje cijena
Počnite besplatno, povećavajte kako rastete.
Slobodan
15 kredita
- Kokoro, Piper, VITS, MeloTTS
- 500 znakova
- 3 gen/sat (bez računa)
Starter
500 kredita/mjesečno
- Sve 22+ modela
- 100.000 znakova po generaciji
- Kloniranje glasa
Pro
2,000 kredita/mjesečno
- Sve u Starteru
- API pristup
- Prioritetna obrada
Često postavljana pitanja
Počnite koristiti AI Voice danas
Pridružite se kreatorima, programerima i kompanijama koje koriste TTS.ai