Realnovremenska TTS
Streaming text-to-speech s sub-sekunde prve-audio latency. Izgrađen za glasovne agente i uživo aplikacije.
Kako streaming TTS djeluje
1. Pošalji tekst
POST tekst na /v1/tts/stream/ kao zahtjev za dogadjaje poslužitelja-Sent.
2. Model generira
Kokoro dijeli tekst i generira uzorak zvuka po uzorku na GPU.
3. Stream Chunks
Base64 kodirani WAV komadi stižu preko SSE-a i počni odmah svirati.
4. Slušajte uživo
Korisnik čuje početak rečenice u manje od sekunde, čak i na dugim ulazima.
Slučaji korištenja
Gdje podsekundni latency otključava nova iskustva.
Glasovni agenti
Razgovorni roboti koji reagiraju brzo kao čovjek.
Live Dubbing
Prevedite i dub struja u realnom vremenu bez buffering pauze.
Igre
NCC dijalog koji odmah reagira na izbor igrača, bez predanih VO.
Pristupačnost
Čitatelji ekrana i pomoćni alat koji počinju govoriti čim korisnik klikne.
Planovi TTS-a u realnom vremenu
Započnite besplatno, nadogradnja kada trebate više
- Kokoro streaming (free model)
- 500 znakova po generaciji
- 10 slobodnih tokova/dan po anonimnom korisniku
- Podsekundni prvi-audio latency
- SSE streaming preko HTTPS
- 15.000 znakova pri prijavljivanju
- 5000 znakova po toku
- API ključ za programski pristup
- Povijest generacije
- Nema dnevnog zatvarača toka
- MOSS-TTS-Realtime (kada je živo)
- 100.000 znakova po toku
- Prioritet GPU reda
- Glasovni agent + integracija Twilio
- Ograničenja veće stope
Česta pitanja
Što možemo poboljšati? Vaša povratna informacija nam pomaže riješiti probleme.
Tok govora u realnom vremenu
Besplatno za prvih 10 generacija dnevno. Prijavite se kako bi otključali puni dodatak karaktera i API pristup.