Reāllaika TTS
Straumējot tekstu uz speech ar sub-sekundi pirmā-audio latency. Paredzēts balss aģentiem un tiešraides lietojumprogrammām.
Kā darbojas straumēšanas TTS
1. Sūtīt tekstu
Pēc teksta uz / v1/ tts/ straume/ kā servera nosūtīto notikumu pieprasījumu.
2. Paraugs ģenerators
Kokoro satver tekstu un rada audio paraugu pa paraugiem GPU.
3. Stream gabali
Base64 kodēti WAV gabali ierodas pāri SSE un sākt spēlēt nekavējoties.
4. Klausīties dzīvi
Lietotājs uzklausa teikuma sākumu pēc otrās, pat par gariem ievades.
Izmantošanas gadījumi
Ja sekundārā latence atklāj jaunu pieredzi.
Balss aģenti
Sarunu roboti, kas reaģē tik ātri, cik cilvēks būtu.
Dzīvs dubbs
Tulkot un rakt plūsmu reālajā laikā bez bufera pauzes.
Spēles
NPC logs, kas reaģē uz spēlētāju izvēli uzreiz, nav iepriekš izsludināts VO.
Pieejamība
Ekrāna lasītāji un palīglīdzekļi, kas sāk runāt brīdī, kad lietotājs klikšķ.
Reāllaika TTS plāni
Sākt bezmaksas, uzlabot, kad jums ir nepieciešams vairāk
- Kokoro straumēšana (brīvais modelis)
- 500 rakstzīmes paaudzē
- 10 brīvas plūsmas/dienā vienam anonīmam lietotājam
- Sub-otrā pirmā laikmeta latentums
- SSE straumēšana pa HTTPS
- Pierakstīšanās brīdī 15 000 rakstzīmju
- 5 000 rakstzīmju uz plūsmu
- API atslēga programmātiskai piekļuvei
- Paaudžu vēsture
- Nav ikdienas plūsmas vāciņa
- MOSS-TTS-Realtime (ja dzīvs)
- 100 000 chars uz plūsmu
- Prioritārais GPU rinda
- Balss aģents + Twilio integrācija
- Augstākas likmes ierobežojumi
Bieži uzdoti jautājumi
Ko mēs varam uzlabot? Jūsu atgriezeniskā saite palīdz mums atrisināt problēmas.
Straumes runa reālā laikā
Bez maksas pirmajām 10 paaudzēm dienā. Pierakstīties, lai atslēgtu pilnu rakstzīmju pabalstu un API piekļuvi.