Realtempa TTS
Flua teksto-al-parolo kun subsekunda unua-aŭda latenteco. Konstruita por voĉaj agentoj kaj realaj aplikaĵoj.
Kiel funkcias la flua TTS
1. Sendi tekston
POST text to /v1/tts/stream/ as a Server-Sent Events request.
2. Modelo generas
Kokoro tranĉas la tekston kaj generas aŭd-ekzemplon-post-ekzemplon sur la GPU.
3. Fluo- partoj
La 64-bita kodo de la DOS-a operaciumo estas DOS-64, kaj ĝi estas uzata en la plej multaj operaciumoj.
4. Aŭskultu rekte
La vortoj de la unua frazo estas en la unua linio, la vortoj de la dua frazo en la dua linio.
Uzkazoj
La subaj partoj de la folioj estas senfoliaj.
Voĉaj agentoj
La ĉasado okazas per rapidaj paŝoj, kiuj similas al tiuj de homo.
Rete
Traduki kaj dubli fluon en reala tempo sen bufraj paŭzoj.
LudojName
La NPC-dialogo kiu reagas al la ludantoj-elektoj tuj, sen antaŭ-renderigita VO.
Alirebleco
Ekranlegiloj kaj helpiloj kiuj komencas paroli kiam uzanto klakadas.
Realtempaj TTS-planoj
Komencu senpage, ĝisdatigu kiam vi bezonas pli
- Kokoro fluanta (libera modelo)
- 500 signoj po generacio
- 10 liberaj fluoj/tago por anonima uzanto
- Subsekunda unua-aŭda prokrasto
- SSE fluado tra HTTPS
- 15, 000 signoj ĉe enskribo
- 5000 signoj po fluo
- API-ŝlosilo por programa aliro
- Genera historio
- Neniu ĉiutaga flulimigo
- MOSS- TTS- Realtime (se viva)
- 100, 000 signoj po fluo
- GPU- prioritata vico
- Voĉa agento + Twilio-integriĝo
- Pli altaj limoj de rapideco
Oftaj demandoj
Kion ni povus plibonigi? Via reago helpas nin solvi problemojn.
Fluigi parolon en realtempaComment
Senpage por la unuaj 10 generacioj tage. Aliĝi por malŝlosi la plenan signo- permeson kaj API- aliron.