Realtime TTS
Stream tekst-u-govor sa sub-sekundičnim prvim audio zakašnjenjem. Napravljeno za glasovne agente i live aplikacije.
Kako radi streaming TTS
Pošalji tekst
POST tekst na /v1/tts/stream/ kao zahtjev za događaje poslane sa servera.
2. Model generira
Kokoro razbija tekst i generira audio uzorak po uzorku na GPU-u.
3. Stream Chunks
1964. godine, tvrtka "Sigma" je počela sa proizvodnjom 64-bitnih procesora i počela je sa proizvodnjom 64-bitnih računara.
Slušaj uživo
Korisnik čuje početak rečenice za manje od sekunde, čak i na dugim ulazima.
Slučajevi upotrebe
Gdje sub-sekunda latencija otključava nova iskustva.
Voice Agents
Konverzacijski roboti koji odgovaraju brzo kao što bi to učinio čovjek.
Live Dub
Prevodi i sinkronizira stream u realnom vremenu bez pauzama.
Igre
NPC dijalog koji reagira na izbore igrača odmah, bez prethodnog renderiranja VO.
Dostupnost
Čitači ekrana i pomoćni alati koji počinju govoriti u trenutku kada korisnik klikne.
Realtime TTS Plans
Počnite besplatno, nadogradite kada vam treba više
- Kokoro streaming (free model)
- 500 znakova po generaciji
- 10 besplatnih streamova/dan po anonimnom korisniku
- Sub-sekunda prvo-audio zakašnjenje
- SSE strujanje preko HTTPS
- 15.000 znakova pri registraciji
- 5000 znakova po toku
- API ključ za programski pristup
- Historija generacija
- Nema dnevnog ograničenja strujanja
- MOSS-TTS-Realtime (kada je živ)
- 100.000 znakova po toku
- Prioritet GPU reda
- Voice agent + Twilio integracija
- Viša ograničenja stope
Često postavljana pitanja
Šta možemo da poboljšamo? Vaše povratne informacije nam pomažu da riješimo probleme.
Stream govor u stvarnom vremenu
Besplatno za prvih 10 generacija dnevno. Prijavite se da otključate puni broj znakova i API pristup.