Realtime TTS
Streamovanie prevodu textu na reč s latenciou prvého zvuku nižšou ako sekunda. Vytvorené pre hlasových agentov a živé aplikácie.
Text
StreamovanieHlas & nastavenia
Ako funguje streamovanie TTS
1. Odoslať text
POST text na /v1/tts/stream/ ako požiadavka na odosielanie udalostí zo servera.
2. Model generuje
Kokoro rozdeľuje text na kúsky a generuje zvuk vzorku po vzorke na GPU.
Softvér podobný softvéru Stream Chunks:
Base64-kódované WAV kusy dorazí cez SSE a začať hrať okamžite.
Počúvať naživo
Užívateľ počuje začiatok vety za menej ako sekundu, a to aj pri dlhých vstupoch.
Prípady použitia
Kde latencia nižšia ako sekunda otvára nové možnosti.
Hlasové agenti
Konverzačné roboty, ktoré reagujú tak rýchlo, ako by to urobil človek.
Živé dabingové vystúpenia
Preklad a nahrávanie streamu v reálnom čase bez prestávok v vyrovnávacej pamäti.
Hry
NPC dialóg, ktorý reaguje na voľby hráčov okamžite, žiadne pred-rendered VO.
Prístupnosť
Čítačky obrazovky a pomocné nástroje, ktoré začnú hovoriť v okamihu, keď používateľ klikne.
Realtime TTS plány
Začnite zdarma, inovujte, keď budete potrebovať viac
- Kokoro streaming (free model)
- 500 znakov na generáciu
- 10 bezplatných streamov/deň na anonymného používateľa
- Sub-sekundové first-audio oneskorenie
- SSE streamovanie cez HTTPS
- 15 000 znakov pri registrácii
- 5 000 znakov na stream
- API kľúč pre programový prístup
- História generácií
- Žiadny denný limit streamu
- MOSS-TTS-Realtime (ak je živý)
- 100 000 znakov na stream
- Prioritná fronta GPU
- Hlasový agent + Twilio integrácia
- Vyššie sadzbové limity
Často kladené otázky
Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.
Streamovanie reči v reálnom čase
Zaregistrujte sa a odomknite si plný počet znakov a prístup k rozhraniu API.