TTS en temps real
S' està creant text a veu amb les aplicacions sub-segones de primera mà. Es construeix per als agents de veu i en directe.
Text
Corrent de dades& Arranjament de la veu
Com funciona el corrent de dades TTS
1. Envia text
Text POST a / v1/ tts/stream/ com a sol· licitud d' esdeveniment del servidor.
2. Model Genera
Kokoro fragmenta el text i genera mostres d'àudio a la GPU.
3, trossos de corrent de dades
Els trossos base64-code WAV arriben sobre SSE i comencen a jugar immediatament.
4. Escolta en directe
L' usuari escolta l' inici de la frase en menys d' un segon, fins i tot en llargues entrades.
Casos d' ús
A on s'obrin noves experiències en sub-segon.
Agents de veu
Els robots conversals que responen tan ràpid com un humà.
En directe de Dubbing
Traduïu i du un flux en temps real sense pausa per a la memòria intermèdia.
Jocs
Diàleg NPC que reacciona a les opcions del jugador instantàniament, sense pre-gresed VO.
Accessibilitat
Els lectors de pantalla i eines ajudants que comencen a parlar en el moment en que un usuari fa clic.
Plans TTS realName
Inicia lliure, actualització quan necessiteu més
- Kokoro Ratch ( model lliure)
- 500 caràcters per generació
- 10 fluxos lliures/ dia per usuari anònim
- Sub-segon primer-audio tardency
- SSE el flux sobre HTTPS
- 15.000 caràcters a signar
- 5000 caràcters per flux
- Clau API per a l' accés temàtic
- Historial de generació
- No hi ha cap barret diari
- MOS- TTS- Temps (quan viu)
- 100.000 caràcters per flux
- Cua de la GPU de prioritat
- Agent de veu + Twilio integració
- Límits de taxa superior
Preguntes més freqüents
Les teves reaccions ens ajuden a solucionar problemes.
Pronunciació del corrent de dades en temps real
Lliure per a les primeres 10 generacions al dia. S' està preparant per a desbloquejar l' ús d' assignació de caràcters i l' API complet.