Realtime TTS
Fluturimi i tekstit në fjalë me një vonesë të parë të zërit prej nën një sekonde. I ndërtuar për agjentë zëri dhe aplikacione të drejtpërdrejta.
Si funksionon Streaming TTS
Dërgo tekst
POST tekst në /v1/tts/stream/ si një kërkesë për ngjarje të dërguar nga serveri.
2. Modeli gjeneron
Kokoro copëton tekstin dhe gjeneron audio shembulli-me-shembulli në GPU.
3. Fluksi i fragmenteve
Base64-encoded WAV copëza arrijnë mbi SSE dhe fillojnë të luajnë menjëherë.
Dëgjo
Përdoruesi dëgjon fillimin e fjalisë në më pak se një sekond, edhe në hyrje të gjata.
Përdorimi
Ku vonesat e shkurtra të sekundit të hapin përvoja të reja.
Zëri
Botët bisedues që përgjigjen aq shpejt sa një njeri.
Dublimi i drejtpërdrejtë
Përkthe dhe dublojë një rrjedhje në kohë reale pa pushimet e buferit.
Lojra
Dialogu NPC që reagon menjëherë ndaj zgjedhjeve të lojtarit, pa VO të parapara.
Açesibiliteti
Lexues ekrani dhe mjete ndihmëse që fillojnë të flasin në momentin që një përdorues klikon.
Plani i TTS në kohë reale
Fillo falas, përmirëso kur të duash më shumë
- Kokoro streaming (model i lirë)
- 500 karakterë për gjeneratë
- 10 streams falas/ditë për përdorues anonim
- Latency e audios së parë sub-second
- SSE streaming mbi HTTPS
- 15,000 karaktere në regjistrim
- 5,000 karakterë për stream
- Kyçi API për hyrjen me program
- Gjenerata
- Pa kufizim të përditshëm të rrjedhjes
- MOSS-TTS-Realtime (kur në jetë)
- 100,000 karakterë për stream
- Prioriteti i GPU
- Agjenti i zërit + integrimi i Twilio
- Limitet e normave më të larta
Pyetje të shpeshta
Çfarë mund të përmirësojmë? Feedback-i juaj na ndihmon të zgjidhim problemet.
Flukso fjalët në kohë reale
Pa pagesë për 10 gjeneratat e para në ditë. Regjistrohu për të zhbllokuar të gjithë karakterët dhe hyrjen në API.