Sanntids TTS
Streammer tekst- til- tale med subsekunders førstelyds latenstid. Byggt for taleagenter og levende programmer.
Hvordan strømmende TTS virker
1. Send tekst
POST tekst til /v1/tts/ stream/ som en forespørsel om « Tjenersent » - hendelser.
2. Modellgenerasjoner
Kokoro blokkerer teksten og lager lyd- for- sampling på GPU.
3. Strømkrøller
Base64-kodede WAV- blokker ankommer SSE og begynner å spille med en gang.
4. Lytt levende
Bruker hører starten på setningen i løpet av et sekund, selv ved lange innganger.
Brukstilfeller
Dersom subsekunders latenstid åpner opp nye erfaringer.
Stemmeagenter
Samtalebotter som responderer så fort som et menneske ville.
Levende dubbing
Oversett og dubletter en strøm i sanntid uten mellomlagringspauser.
Spill
NPC- dialog som reagerer på spillervalg med en gang, ingen forhåndsinnsendt VO.
Tilgjengelighet
Skjermlesere og hjelpeverktøy som begynner å snakke det øyeblikket brukeren klikker.
Sanntids TTS- planer
Start ledig, oppgrader når du trenger mer
- Kokorstrøm (fri modell)
- 500 tegn per generasjon
- 10 frie strømmer per dag per anonym bruker
- Delsekund førstelyds latenstid
- SSE- strømmer over HTTPS
- 15.000 tegn ved innlogging
- 5000 tegn per strøm
- API-nøkkel for programmatisk tilgang
- Generasjonshistorie
- Ingen dagstrømslokk
- MOSS-TTS-Realtime (når i live)
- 100.000 tegn per strøm
- Prioritet GPU- kø
- Stemmeagent + Twilio-integrasjon
- Høyere satsgrenser
Ofte stilte spørsmål
Hva kan vi forbedre? din tilbakemelding hjelper oss med å løse problemer.
Strømmer tale i sanntid
Ledig for de første 10 generasjonene om dagen. Registrer deg for å låse opp full tegnkvote og API- tilgang.