Realtime TTS
Streaming test-to-diskors b'sub-tieni ewwel awdjo latency. Mibnija għall-aġenti vuċi u applikazzjonijiet ħajjin.
Kif Streaming TTS xogħlijiet
1. Ibgħat it-test
Test POST għal /v1/tts/stream/ bħala talba Avvenimenti Mibgħuta mis-Server.
2. Mudell jiġġenera
Kokoro chunks-test u jiġġenera awdjo kampjun-by-kampjun fuq il-GPU.
3. Biċċiet tal-fluss
Base64-ikkodifikati biċċiet WAV jaslu fuq SSE u jibdew jilagħbu immedjatament.
4. Listen Live
Utent jisma l-bidu tas-sentenza f'inqas minn sekonda, anke fuq inputs twal.
Każijiet ta’ użu
Fejn sub-sekonda latency unlocks esperjenzi ġodda.
Aġenti tal-vuċi
Bots konversazzjonali li jirrispondu malajr daqs kemm ikun bniedem.
Live dubjar
Ittraduċi u dub nixxiegħa fil-ħin reali mingħajr buffering pauses.
Logħob
NPC djalogu li jirreaġixxi għall-għażliet player istantanjament, l-ebda VO pre-rendered.
Aċċessibbiltà
Qarrejja tal-iskrin u għodod ta' assistenza li jibdew jitkellmu fil-mument li l-utent jikklikkja.
Realtime TTS Pjanijiet
Ibda b'xejn, aġġorna meta jkollok bżonn aktar
- Kokoro streaming (mingħajr mudell)
- 500 karattru għal kull ġenerazzjoni
- 10 flussi b'xejn/jum għal kull utent anonimu
- Sub-tieni latency ewwel awdjo
- SSE streaming fuq HTTPS
- 15,000 karattru meta tiffirma
- 5,000 karattru għal kull nixxija
- Ċavetta API għal aċċess programmatiku
- Storja tal-ġenerazzjoni
- Ebda limitu ta’ flussi ta’ kuljum
- MOSS-TTS-Realtime (meta jkun ħaj)
- 100,000 karattri għal kull nixxiegħa
- Prijorità tal-kju tal-GPU
- Aġent tal-vuċi + Twilio integrazzjoni
- Limiti ta’ rata ogħla
Mistoqsijiet Frekwenti (FAQ)
X'nistgħu ntejbu? Il-feedback tiegħek jgħinna nsolvu l-problemi.
Stream Diskors fil-Ħin Reali
B'xejn għall-ewwel 10 ġenerazzjonijiet kuljum.Irreġistra biex tiżblokka l-allokazzjoni sħiħa tal-karattri u l-aċċess għall-API.