Rauntíma TTS

Straumspilun texta í tal með undirsekúndu fyrstu hljóðleiðslu. Byggð fyrir raddumboðsmenn og lifandi forrit.

Texti

Straumspilun
0/5,000 stafir ~0.3s Fyrsta hljóð

Stillingar raddstýringar

Aðeins fyrir straumspilunartæki.

Lifandi leynd

Smelltu á Stream til að mæla fyrsta hljóð leynd

Úttak

Hljóð stykki mun spila hér eins og þeir streyma inn.

0:00
Fyrsti hlutinn:
Samtals stykki: 0
Samtals tími:

Hvernig Streaming TTS virkar

1. Senda texta

POST texta til /v1/tts/stream/ sem Server-Sent Events beiðni.

2. Model býr

Kokoro chunks textann og býr til hljóð sýnishorn-fyrir-sýni á GPU.

3. Stream stykki

Base64-kóðað WAV stykki koma yfir SSE og byrja að spila strax.

4. Hlustaðu á lifandi

Notandi heyrir upphaf setningarinnar í undir sekúndu, jafnvel á löngum inntak.

Nota tilfelli

Þar sem undir-sekúndna leynd opnar nýja reynslu.

Talforrit

Samtals vélmenni sem bregðast eins hratt og maður myndi.

Live Dubbing

Þýða og dub straum í rauntíma án biðminni hlé.

Leikir

NPC valmynd sem bregst við val leikmanna þegar í stað, engin fyrirfram gerð VO.

Aðgengi

Skjásending

Rauntíma TTS áætlanir

Byrjaðu ókeypis, uppfærðu þegar þú þarft meira

Frjáls
  • Kokoro straumspilun (ókeypis líkan)
  • 500 stafir á kynslóð
  • 10 ókeypis straumar / dag á nafnlausum notanda
  • Sub-sekúndna fyrsta hljóð leynd
  • SSE straumspilun yfir HTTPS
Vinsælasta
Ókeypis reikningur
  • 15.000 stafir við skráningu
  • 5.000 stafir á straum
  • API lykill fyrir forritunaraðgang
  • Generation sögu
  • Engin dagleg straumtakmörk
Skráðu þig ókeypis
Pro
  • MOSS-TTS-Realtime (þegar lifandi)
  • 100.000 stafir á straum
  • Forgangsröð GPU
  • Voice umboðsmaður + Twilio samþættingu
  • Hærri takmörk
Uppfærsla

Algengar spurningar (FAQ)

Rauntíma texti-til-tal streymir hljóðbrotum þegar þau eru búin til, í stað þess að bíða eftir að öll setningin sé lokið.Fyrsta hljóðsýnið kemur á innan við einni sekúndu, sem gerir það hentugur fyrir lifandi raddþjónustu, dublering og gagnvirk forrit þar sem leynd skiptir máli.

Venjulegur TTS býr til alla hljóðskrána áður en hann skilar neinu — þú bíður og heyrir síðan alla setninguna í einu. Rauntíma TTS notar Server-Sent Events (SSE) til að streyma stuttum hljóðhlutum þegar líkanið framleiðir þá.

Kokoro er sjálfgefið bakenda - það býr til hljóð um 100x hraðar en rauntíma á nútíma GPU. Við erum að samþætta MOSS-TTS-Realtime sem hærri gæði val; notendur munu geta valið á beiðni þegar það skip.

Dæmigert fyrsta hljóð leynd á Kokoro er 300-800ms yfir opinbera tengingu. Net hringferð ríkjandi eftir það. Síðan yfirborði lifandi mælt tíma-til-fyrsta-hljóð í UI þannig að þú getur séð nákvæmlega hversu lengi hver beiðni tók.

Raddþjónustur sem svara samtals, lifandi þýðingar fyrir streymismiðla, gagnvirkar leikjapersónur, aðgengislesendur sem byrja að tala um leið og notandi smellir og hvaða forrit sem er þar sem bíða eftir tveimur eða þremur sekúndum fyrir hljóð myndi líða tregt.

Já. POST til https://api.tts.ai/v1/tts/stream/ með sama líkama og venjulegur /v1/tts/ endapunktur. Svarið er SSE straumur af base64-kóðuðum WAV-hlutum. Ókeypis stigið styður 10 kynslóðir á dag fyrir hvern nafnlausan notanda; auðkenndir notendur fá fulla stafafjölda fyrir hvern reikning.

Kokoro notar fyrirfram þjálfaðar raddir og klónar ekki. MOSS-TTS-Realtime (þegar það er samþætt) styður núll-skot raddklóningu frá 3 sekúndna tilvísun. Fyrir fulla raddklóningu í dag, notaðu venjulega / text-to-speech / síðuna með Chatterbox eða GPT-SoVITS - þau eru ekki straumspilunarhæf en framleiða sérsniðnar raddir.

Sama kostnaður og venjulegur TTS endapunktur. Kokoro er ókeypis (1x kostnaður). MOSS-TTS-Realtime mun keyra á venjulegu stigi (2x kostnaður) þegar virkt er. Straumspilunarreglurnar bæta ekki við neinum verðaukagjaldi.

Já — paraðu straumspilunarendapunktinn við Twilio-rödd til að senda hljóð í símtal. Okkar raddþjónusta gerir þetta nú þegar fyrir IVR og úthringingar.Endir-til-enda leynd í símtali er venjulega 1-2 sekúndur, þar á meðal STT og LLM svar.

Ef netkerfið þitt missir hluta af flutningi, mun straumspilarinn sleppa áfram frekar en að stöðva. Fyrir forrit sem þola ekki bil, skaltu fara aftur í venjulegt endapunkt án straumspilunar eða biðja um 500ms af hljóði áður en þú byrjar að spila.
5.0/5 (1)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Straumræða í rauntíma

Frjáls fyrir fyrstu 10 kynslóðir á dag. Skráðu þig til að opna fulla stafastyrk og API aðgang.