TTS Realtime
Streaming teks-to-peech with sub-detik first-audio latensi. Dibuat untuk agen suara dan aplikasi hidup.
Cara Kerja TTS streaming
Kirim Teks
Teks POST ke /v1/tts/stream/ sebagai permintaan Events Server-Sent.
2. Model Menghasilkan
Kokoro potongan teks dan menghasilkan sampel audio-oleh-sample di GPU.
3. Chunks Stream
Base64-enkode WAV potongan tiba di atas SSE dan mulai bermain segera.
4 dengarkan hidup
Pengguna mendengar awal dari kalimat di bawah satu detik, bahkan pada masukan panjang.
Gunakan Kasus
Dimana latensi sub-detik membuka pengalaman baru.
Agen Suara
Robot percakapan yang merespon secepat manusia.
Live Dubbing
Terjemahkan dan dub arus secara real time tanpa buffering pause.
Permainan
NPC dialog yang bereaksi terhadap pilihan pemutar secara instan, tidak ada pra-render VO.
Aksesibilitas
Pembaca layar dan alat bantu yang mulai berbicara saat klik pengguna.
Rencana TTS Realtime
Mulai bebas, upgrade ketika Anda membutuhkan lebih banyak
- Kokoro streaming (model bebas)
- 500 karakter per generasi
- 10 aliran bebas/hari per pengguna anonim
- Latensi Pertama-Oudio Sub-detik
- SSE streaming melalui HTTPS
- 15.000 karakter di signup
- 5.000 karakter per stream
- Kunci API bagi akses programmatis
- Sejarah generasi
- Tidak ada tutup arus harian
- MOSS-TTS-Realtime (ketika hidup)
- 100.000 karakter per stream
- Antrian GPU prioritas
- Agen suara + Twilio integrasi
- Batas tingkat yang lebih tinggi
Pertanyaan yang Sering Diajukan
Umpan balikmu membantu kita memperbaiki masalah.
Stream Speech in Real Time
Bebas untuk 10 generasi pertama sehari. mendaftar untuk membuka tunjangan karakter penuh dan akses API.