TTS masa nyata
Strim teks-ke-tutur dengan latensi audio pertama sub-saat. Dibina untuk ejen suara dan aplikasi langsung.
Teks
Streaming& Tetapan Suara
Bagaimana Streaming TTS Berfungsi
1. Hantar Teks
Teks POST ke /v1/tts/stream/ sebagai permintaan Peristiwa Dihantar-Pelayan.
2. Model Menjana
Kokoro memotong teks dan menghasilkan sampel-secara-sampel audio pada GPU.
3. Strim Butir-butir
Bahagian WAV terkodkan Base64 tiba melalui SSE dan mula main dengan segera.
4. Dengar Langsung
Pengguna mendengar permulaan ayat dalam masa kurang dari satu saat, walaupun pada input panjang.
Gunakan Kes
Di mana latensi sub-saat membuka pengalaman baru.
Ejen Suara
Bot perbualan yang menjawab secepat manusia akan.
Dubbing Segera
Terjemah dan dub strim dalam masa nyata tanpa penimbal jeda.
Permainan
Dialog NPC yang bertindak balas kepada pilihan pemain dengan serta merta, tiada VO pra-dihasilkan.
Kebolehcapaian
Pembaca skrin dan alat bantuan yang mula bercakap bila pengguna klik.
Rencana TTS masa nyata
Mulakan percuma, naik taraf bila anda perlukan lebih
- Kokoro streaming (model percuma)
- 500 aksara per generasi
- 10 strim percuma/hari bagi setiap pengguna anonim
- Lentingan audio pertama subsaat
- Strim SSE melalui HTTPS
- 15,000 aksara pada pendaftaran
- 5,000 aksara per strim
- Kekunci API untuk akses program
- Sejarah Penjanaan
- Tiada had strim harian
- MOSS-TTS-Realtime (bila hidup)
- 100,000 aksara per strim
- Baris gilir GPU keutamaan
- Ejen suara + integrasi Twilio
- Had kadar lebih tinggi
Soalan Lazim
Apa yang boleh kami perbaiki?
Strim Perbualan dalam Masa Sebenar
Percuma untuk 10 generasi pertama sehari. Daftar untuk membuka kebenaran aksara penuh dan akses API.