Realaus laiko TTS
Srautinis tekstas-į-speech su sub-antro pirmojo-audio latentiškumas. Pastatytas balso agentų ir gyvų programų.
Tekstas
SrautasBalso & nustatymai
Kaip srautinis TTS veikia
1. Siųsti tekstą
Po/v1/tts/srautas/ kaip serverio-siųstų įvykių užklausą.
2. Modelis generuoja
Kokoro išstumia tekstą ir generuoja garso imtį pagal GPU.
3. Srauto gabalai
Base64-užkoduotas WAV chunks atvykti per SSE ir pradėti žaisti nedelsiant.
4. Klausyti gyvai
Vartotojas girdi sakinio pradžią po sekunde, net dėl ilgos įvesties.
Naudojimo atvejai
Kur poantrinė latentinė atrakina naują patirtį.
Balso agentai
Pokalbių robotai, kurie reaguoja taip pat greitai, kaip ir žmogus nori.
Gyvas dubbavimas
Išversti ir iškasti srautą realiu laiku be buferinių pauzių.
Žaidimai
NPC dialogas, kuris reaguoja į žaidėjo pasirinkimus iš karto, jokių iš anksto VO.
Prieinamumas
Ekrano skaitytuvai ir pagalbiniai įrankiai, kurie pradeda kalbėti momentą, kai vartotojas paspaudžia.
Realaus laiko TTS planai
Pradėti nemokamai, atnaujinti, kai jums reikia daugiau
- Kokoro transliacija (laisvas modelis)
- 500 simbolių vienai kartai
- 10 laisvų srautų per dieną vienam anoniminiam vartotojui
- Poantrinė pirmojo audio latentiškumas
- SSE transliacija per HTTPS
- 15 000 simbolių pasirašymo metu
- 5 000 chars vienam srautui
- API raktas programinei prieigai
- Generacijos istorija
- Nėra dienos srauto dangtelio
- MOSS-TTS-Realtime (jei gyva)
- 100 000 chars vienam srautui
- Prioritetinis GPU eilė
- Balso agentas + Twilio integracija
- Didesnio tarifo ribos
Dažnai užduodami klausimai
Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.
Srauto kalba realiu laiku
Nemokami pirmosios 10 kartų per dieną. Užsiregistruoti atrakinti visą charakterio pašalpa ir API prieiga.