Slobodna AL Tekst za govor
20+ modeli otvorenog izvora, 107+ glasove, 32+ jezici. Nije potreban račun.
Sve što trebaš za glasovnu inteligenciju
30+ alata napajanih modelima AI-a otvorenog izvora
20+ AI Glasovni modeli
Najopsežnija kolekcija modela TTS otvorenog izvora u jednoj platformi
Kokoro Free
Kokoro je 82 milijuna parametara text-to-speech model koji udara mnogo iznad svoje težine klase. Unatoč svojoj malenoj veličini, ona proizvodi izuzetno prirodan i ekspresivan govor. Kokoro podržava više jezika, uključujući engleski, japanski, kineski i korejski, s različitim izrazitivnim glasovima. To radi nevjerojatno brzo – stvaranje audio gotovo 100x brže od real-time na GPU.
Najbolje za: visokokvalitetni TTS s minimalnom latencijom, streaming aplikacije
Pokušaj slobodno
Piper Free
Piper je lagani tekst-na-špeech motor razvijen od strane Rhaspy koji koristi VITS i grkljan arhitekture. To radi u cijelosti na CPU, što je idealan za rubne uređaje, kućna automatizacija, i aplikacije zahtijeva offline TTS. Sa preko 100 glasova preko 30+ jezika, Piper donosi prirodno-zvučni govor na realnom vremenu brzine čak i na Raspberry Pi 4.
Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije
Pokušaj slobodno
VITS Free
VITS (Varicionalni zaključak s protivrečnim učenjem za kraj-na-kraj Tekst-na- govor) je paralelna metoda kraj-na-kraj TTS koja stvara više prirodnog zvučnog zvuka nego trenutni dvostupenjski modeli. Prihvaća varijacionalni zaključak pojačan s normalizacijskim tokovi i procesom protivrečnog treninga, što postiže značajno poboljšanje prirodnosti.
Najbolje za: Općenamenski tekst-na-speech s prirodnom prozodijom
Pokušaj slobodno
MeloTTS Free
MeloTTS by MyShell.ai je višejezična TTS biblioteka koja podupire engleski (američki, britanski, indijanski, australijski), španjolski, francuski, kineski, japanski i korejski. To je izuzetno brzo, obrada teksta pri skoro realnom vremenu samo na CPU. MeloTTS je dizajniran za proizvodnju korištenja i podržava i CPU i GPU zaključak.
Najbolje za: Proizvodnja zahtjeva za brzim, višejezičnim TTS-om
Pokušaj slobodno
Bark Standard
Transformer-based text-to-audio model koji generira realan govor, glazbu, i zvučne efekte.
Razvojnik: Suno · Dozvola: MIT
Probaj.
Bark Small Standard
Lakša verzija Barka s bržim zaključkom i manjim korištenjem memorije.
Razvojnik: Suno · Dozvola: MIT
Probaj.
CosyVoice 2 Standard
Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.
Razvojnik: Alibaba (Tongyi Lab) · Dozvola: Apache 2.0
Probaj.
Dia TTS Standard
Višezvučnički dijaloški model koji stvara prirodne razgovore između zvučnika.
Razvojnik: Nari Labs · Dozvola: Apache 2.0
Probaj.
Parler TTS Standard
Opišite glas koji želite na prirodnom jeziku i Parler generira odgovarajući govor.
Razvojnik: Hugging Face · Dozvola: Apache 2.0
Probaj.
GLM-TTS Standard
Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.
Razvojnik: Zhipu AI · Dozvola: GLM-4 License
Probaj.
IndexTTS-2 Standard
Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.
Razvojnik: Index Team · Dozvola: Bilibili Model License
Probaj.
Spark TTS Standard
Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.
Razvojnik: SparkAudio · Dozvola: CC BY-NC-SA 4.0
Probaj.
GPT-SoVITS Standard
Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.
Razvojnik: RVC-Boss · Dozvola: MIT
Probaj.
Orpheus Standard
Emocionalni TTS model na ljudskoj razini obučen na 100K sati govora podataka.
Razvojnik: Canopy Labs · Dozvola: Llama 3.2 Community
Probaj.
Qwen3 TTS Standard
Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.
Razvojnik: Alibaba (Qwen) · Dozvola: Apache 2.0
Probaj.
CosyVoice 2
Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.
Jezici: en, zh, ja, ko, fr, de, it, es
Kloniranje glasa
GLM-TTS
Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.
Jezici: en, zh
Kloniranje glasa
IndexTTS-2
Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.
Jezici: en, zh
Kloniranje glasa
Spark TTS
Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.
Jezici: en, zh
Kloniranje glasa
GPT-SoVITS
Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.
Jezici: en, zh, ja, ko
Kloniranje glasa
Chatterbox
Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.
Jezici: en
Kloniranje glasa
Tortoise TTS
Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.
Jezici: en
Kloniranje glasa
OpenVoice
Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.
Jezici: en, zh, ja, ko, fr, de, es, it
Kloniranje glasa
Qwen3 TTS
Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.
Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it
Kloniranje glasaProgramer- prvi API
OpenAI kompatibilan REST API. Jedan ishod, 22+ modeli. Streaming support for real-time applications.
- OpenAI kompatibilan format
- Streaming TTS za aplikacije u realnom vremenu
- Paketska obrada za velike poslove
- Webhook obavijesti
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Jednostavna, prozirna cijena
Počnite slobodno.
Slobodno
15 kredita
- Kokoro, Piper, VITS, MeloTTS
- Ograničenje znaka
- 3 gen/sat (bez računa)
Pokretanje
500 kredita/mjesečno
- Svi 22+ modeli
- 100.000 znakova po generaciji
- Kloniranje glasa
Profesionalno
2.000 kredita/mjesečno
- Sve u Starteru
- API pristup
- Prioritetna obrada
Česta pitanja
Počnite koristiti AI glas danas
Pridružite se kreatorima, programerima i poduzećima koji koriste TTS.ai