Realtime TTS
Streaming tekst-til-tale med sub-sekund første-audio latency. Bygget til voice agenter og live-applikationer.
Hvordan Streaming TTS virker
1. Send tekst
POST tekst til /v1/tts/stream/ som en Server-Sent Events anmodning.
2. Model Generer
Koko skærer teksten og gener lyd prøve-for-stikprøve på GPU'en.
3. Stream Chunks
Base64-kodede WAV stykker ankommer over SSE og begynde at spille med det samme.
4. Lyt levende
Brugeren hører starten af sætningen i under et sekund, selv på lange indgange.
Brugstilfælde
Hvor sub-second latency låser op for nye oplevelser.
Stemmeagenter
Konversationelle bots, der reagerer så hurtigt som et menneske ville.
Live- dybning
Oversæt og dub en strøm i realtid uden buffer pauser.
Spil
NPC- dialog, der reagerer på spillerens valg øjeblikkeligt, ingen præ-afsender VO.
Tilgængelighed
Skærmlæsere og hjælpeværktøjer, der begynder at tale det øjeblik, en bruger klikker.
Realtime TTS-planer
Start gratis, opgradere når du har brug for mere
- Kokoro streaming (gratis model)
- 500 tegn pr. generation
- 10 gratis vandløb pr. dag pr. anonym bruger
- Subsekundær first-audio latency
- SSE streaming over HTTPS
- 15.000 tegn ved tilmelding
- 5.000 tegn pr. strøm
- API- nøgle til programmatisk adgang
- Generationshistorik
- Ingen daglig strømkapsel
- MOSS-TTS-Realtime (når du bor)
- 100.000 tegn pr. strøm
- Prioriteret GPU-kø
- Stemmeagent + Twilio integration
- Højere rentegrænser
Ofte stillede spørgsmål
Hvad kan vi forbedre? Din feedback hjælper os med at løse problemer.
Streamtalen i realtid
Gratis for de første 10 generationer om dagen. Tilmeld dig for at låse den fulde karakter godtgørelse og API adgang.