TTS v realnem času
Streaming tekst-to-speech s sub-sekundo prve-audio latency. Zgrajen za glasovne agente in živo aplikacijo.
Kako streaming TTS deluje
1. Pošlji besedilo
Besedilo POST na /v1/tts/stream/ kot zahteva za strežnik-Sent Dogodki.
2. Model ustvarja
Kokoro raztrga besedilo in ustvarja zvočni vzorec po vzorcu na GPU.
3. Stream Chunks
Base64 kodirani koščki WAV prispejo čez SSE in začnejo igrati takoj.
4. Poslušajte v živo
Uporabnik sliši začetek stavka v manj kot sekundi, celo na dolgih vhodih.
Uporabni primeri
Kjer podsekunda latency odpira nove izkušnje.
Glasovni agenti
Pogovorni roboti, ki se odzovejo tako hitro kot človek.
Živo klepetanje
Prevedite in potopite potok v realnem času brez pufring pavze.
Igre
Okno NPC, ki se takoj odzove na izbiro igralca, ni predanega VO.
Dostopnost
Bralci zaslona in pomočna orodja, ki začnejo govoriti takoj, ko uporabnik klikne.
Načrti TTS v realnem času
Začnite brezplačno, nadgradnja, ko potrebujete več
- Kokoro streaming (free model)
- 500 znakov na generacijo
- 10 brezplačnih tokov/dan na anonimnega uporabnika
- Poddruga prva-audio latency
- SSE streaming preko HTTPS
- 15.000 znakov pri prijavi
- 5000 znakov na tok
- API ključ za programski dostop
- Zgodovina ustvarjanja
- Ni dnevnega pokrovčka toka
- MOSS-TTS-Realtime (ko je v živo)
- 100.000 znakov na tok
- Prednostna vrstica GPU
- Glasovni agent + vključevanje Twilio
- Mejne vrednosti višje stopnje
Pogosta vprašanja
Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.
Tok govora v realnem času
Brezplačen za prvih 10 generacij na dan. Prijavite se, da odklenete celoten lični dodatek in API dostop.