TTS wektu nyata

Streaming teks-ka-wacana kalawan latensi sub-detik audio-pertama. Diwangun pikeun agen-wacana jeung aplikasi live.

Teks

Streaming
0/5,000 aksara ~0.3s first audio

& Setelan Suara

Ana uga sing nganggo model-model acak.

Latensi langsung

Klik Stream kanggo ngukur latensi audio pertama

Keluaran

Audio bakal diunggah ing kene nalika diunggah.

0:00
Sepotong pisanan:
Jumlah potongan: 0
Total wektu:

Cara Streaming TTS Works

1. Kirim teks

1/1000 detik utawa 1/1000 detik utawa 1/1000 detik iku siji unit SI kanggo wektu.

2. Model Generates

Kokoro ngetok teks lan ngahasilkeun audio sampling-by-sample ing GPU.

3. Stream Chunks

1964 - Pangéran Soeharto tiwas nalika ngagem topeng nalika nganjang ka Istana Merdeka.

4. Listen Live

Sacara umum, kecap-kecap dimimitian ku hurup anu panjang, contona.

Kegunaan

Sacara umum, subyek bisa diklasifikasikeun dadi tilu golongan.

Penyiaran

Kajaba iku, gawéan-gawéan kang digawé bisa digawé kanthi cepet.

Dubbing langsung

Translate lan dub a stream ing wektu nyata tanpa buffering pause.

Game

NPC dialog nu ngarespon ka pilihan pamaén langsung, tanpa VO dipre-rendered.

Kemudahan akses

Pamaca layar jeung alat bantu anu mimiti nyarita nalika pangguna klik.

Realtime TTS Plans

Miwiti gratis, upgrade nalika perlu luwih

Bebas
  • Kokoro streaming (model gratis)
  • 500 karakter saben generasi
  • 10 streams gratis / dina saben pangguna anonim
  • Sub-detik pertama-audio latensi
  • SSE streaming liwat HTTPS
Paling populer
Akun
  • 15,000 karakter ing signup
  • 5,000 karakter saben stream
  • Kunci API kanggo akses program
  • Sejarah Generasi
  • Ora ana watesan aliran saben dina
Daftar Free
Pro
  • MOSS-TTS-Realtime (wektu live)
  • 100,000 aksara saben stream
  • Prioritas GPU
  • Voice agent + Twilio integrasi
  • Batas laju sing luwih dhuwur
Nampilake

Takon-takon sing sering diajukake

Teks-ka-wacana waktu-nyata ngaluarkeun potongan audio sakumaha anu dihasilkeun, lain ngantosan sakumna kalimat réngsé. Sampel audio munggaran datang dina kirang ti hiji detik, ngajadikeun éta cocog pikeun agén sora hirup, duplikasi, sarta aplikasi interaktif dimana latensi penting.

TTS biasa ngahasilkeun file audio lengkep saméméh ngabalikeun nanaon — anjeun ngantosan, teras ngadéngékeun sakumna kalimat sakaligus. TTS realtime ngagunakeun Server-Sent Events (SSE) pikeun ngaluarkeun potongan audio pondok sakumaha modelna ngahasilkeunana. Pamaké ngadengekeun awal kalimat sahenteuna sajam, bahkan dina input panjang.

Kokoro nyaéta backend piawai — éta ngahasilkeun audio kira-kira 100x langkung gancang tibatan realtime dina GPU modern. Kami ngahijikeun MOSS-TTS-Realtime salaku alternatif kualitas luhur; pangguna bakal tiasa milih per pancén sanggeus éta dikirimkeun.

Latensi audio munggaran anu biasa dina Kokoro nyaéta 300-800ms ngaliwatan sambungan umum. Jaringan round-trip dominan saatos éta. Halamanna ngagambarkeun waktos-ka-audio-pertama anu diukur langsung dina UI supados anjeun tiasa ningali persis sabaraha lami unggal pancén.

Sacara umum, para ahli nu ngarti kana téori komunikasi, komunikasi, sarta komunikasi interpersonal, nyatakeun yén komunikasi interpersonal nyaéta komunikasi anu dilaksanakeun ku jalma-jalma anu ngalaksanakeun interaksi anu saling berinteraksi, anu ngawengku dua atawa leuwih jalma.

Ya. POST ka https://api.tts.ai/v1/tts/stream/ kalawan awak anu sami sareng titik akhir /v1/tts/ biasa. Balapanna nyaéta hiji aliran SSE tina potongan WAV anu dikodekeun base64. Tingkat bébas nyarankeun 10 generasi per dinten per pangguna anu teu dikenal; pangguna anu diverifikasi meunangkeun ijin karakter lengkep per akun.

Kokoro ngagunakeun sora anu dilatih sateuacanna sarta henteu kloning. MOSS-TTS-Realtime (sapertosna diintegrasikeun) ngadukung kloning sora zero-shot ti referensi 3 detik. Pikeun kloning sora lengkep ayeuna, anggo halaman /text-to-speech/ biasa sareng Chatterbox atanapi GPT-SoVITS — éta henteu tiasa distreaming tapi ngahasilkeun sora anu ditangtukeun.

Biaya karakter sarua jeung titik akhir TTS biasa. Kokoro nyaéta tingkat bébas (biaya 1x). MOSS-TTS-Realtime bakal dijalankeun dina tingkat standar (biaya 2x) lamun diaktifkeun. Protokol streaming henteu nambahan biaya tambahan.

Ya - pasangan titik akhir streaming sareng webhook sora Twilio pikeun narik audio langsung kana telepon. Platform agen sora urang parantos ngalakukeun ieu pikeun IVR sareng telepon kaluar. Latensi akhir-ka-akhir dina telepon biasana 1-2 detik kalebet tanggapan STT sareng LLM.

Upami jaringan anjeun leungit hiji bagian nalika transit, pamuter stream bakal leumpang ka hareup tibatan ngaleupaskeun. Pikeun aplikasi anu teu bisa ngatoleransi celah, balik deui ka titik akhir non-streaming biasa, atawa buffer 500ms audio saméméh ngamimitian pamuter.
5.0/5 (1)

Apa sing bisa kita ningkatake? Pangarep-arepmu mbantu kita ngrampungake masalah.

Stream Ucapan ing Wektu Real

Gratis pikeun 10 generasi munggaran sapopoé. Daftarkeun pikeun ngabuktoskeun ambang karakter lengkep sareng aksés API.