Realtime TTS
Streaming text-to-speech met sub-second first-audio latency. Gebouwd voor spraakagenten en live toepassingen.
Hoe Streaming TTS werkt
1. Tekst versturen
POST tekst naar /v1/tts/stream/als een verzoek om Server-Sent Events.
2. Model Generaties
Kokoro brokken de tekst en genereert audio sample-voor-sample op de GPU.
3. Stream Chunks
Base64-gecodeerde WAV brokken arriveren boven SSE en beginnen onmiddellijk te spelen.
4. Live luisteren
Gebruiker hoort het begin van de zin in minder dan een seconde, zelfs op lange ingangen.
Cases gebruiken
Waar subseconde latency nieuwe ervaringen ontsluit.
Spraakmiddelen
Conversatie bots die zo snel reageren als een mens zou doen.
Live Dubbing
Vertaal en dub een stroom in real time zonder bufferpauzes.
Spelletjes
NPC-dialoog die onmiddellijk reageert op spelerkeuzes, geen vooraf gerenderde VO.
Toegankelijkheid
Schermlezers en hulpmiddelen die beginnen te spreken op het moment dat een gebruiker klikt.
Realtime TTS-plannen
Start gratis, upgrade wanneer je meer nodig hebt
- Kokoro streaming (vrij model)
- 500 tekens per generatie
- 10 gratis streams/dag per anonieme gebruiker
- Subseconde eerste audio latentie
- SSE streaming over HTTPS
- 15.000 tekens bij aanmelding
- 5.000 tekens per stroom
- API sleutel voor programmatische toegang
- Generatiegeschiedenis
- Geen dagelijkse stream cap
- MOSS-TTS-Realtime (toen live)
- 100.000 tekens per stroom
- Prioritaire GPU-wachtrij
- Spraakmiddel + integratie van Twilio
- Hogere snelheidslimieten
Veelgestelde vragen
Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.
Stream Speech in Real Time
Gratis voor de eerste 10 generaties per dag. Schrijf je in om de volledige karaktertoeslag en API toegang te ontgrendelen.