Denbora errealeko TTS
Testu-hizketaren streaminga, segundo azpiko lehen audioaren latentziarekin. Ahots-agenteen eta zuzeneko aplikazioentzat eraikia.
Testua
KorronteaAhotsaren & ezarpenak
Nola funtzionatzen du TTS streaming-ak
1. Bidali testua
POST testua /v1/tts/stream/-era Zerbitzariak bidalitako gertaeren eskaera gisa.
2. Ereduak sortzen du
Kokorok testua zatitu eta audioa sortzen du lagin-lagin GPUan.
3. Korronte-zatiak
Base64-ko WAV zatiak SSE-tik iristen dira eta berehala erreproduzitzen hasten dira.
4. Entzun zuzenean
Erabiltzaileak esaldiaren hasiera segundo bat baino gutxiagotan entzuten du, baita sarrera luzeetan ere.
Erabilera-kasuak
Bigarren mailako latentziak esperientzia berriak irekitzen dituena.
Ahots- agenteak
Gizakiak bezalako izaki bizidunek ere, euren burua erreproduzitzeko gaitasuna dute.
Zuzeneko bikoizpena
Itzul ezazu eta bikoiztu korronte bat denbora errealean, buffer-etenaldiarik gabe.
Jokoak
NPC elkarrizketa-koadroa, jokalarien aukeraketei berehala erantzuten diena, ez aurre-errendatutako ahotsa.
Erabilerraztasuna
Pantaila irakurleak eta erabiltzaileak klik egiten duen unean hitz egiten hasten diren tresna lagungarriak.
TTS denbora errealeko planak
Hasi doan, bertsio-berritu gehiago behar duzunean
- Kokoro streaming (modelo librea)
- 500 karaktere belaunaldiko
- 10 korronte libre/egun erabiltzaile anonimo bakoitzeko
- Lehenengo audioaren segundo azpiko atzerapena
- SSE fluxua HTTPS bidez
- 15.000 karaktere erregistroan
- 5.000 karaktere korronte bakoitzeko
- API gakoa programa bidezko sarbiderako
- Sorkuntzaren historia
- Ez dago eguneroko korronte-mugarik
- MOSS-TTS-Realtime (bizirik dagoenean)
- 100.000 karaktere korronte bakoitzeko
- GPUaren lehentasun-ilara
- Ahots-agentea + Twilio integrazioa
- Emaria mugatzea
Maiz egiten diren galderak
Zer hobetu dezakegu? Zure iritziak arazoak konpontzen laguntzen digu.
Hizketa denbora errealean
Doakoa egunean lehen 10 belaunaldietan. Harpidetu karaktere-kopuru osoa eta API sarbide osoa desblokeatzeko.