TTS tiempo real

Transmisión texto-gui ñe'ẽngue-pe latencia sonido ypy-pe subsegundo-pe. Oñemoheñói agentes ñe'ẽngue ha aplicación-kuéra directo-pe g̃uarã.

Ndoguerekói gueteri ñe'ẽ TTS nde ñe'ẽme. Yvy'akuaa ñamoĩnge umi nde'éregua! Oñemu ñe'ẽ

Ñe'ẽ

Streaming
0/5,000 caracteres ~0.3s Audio ypy

Ñe'ẽnguéra ñemohenda

Umi modelo oguerekóva transmisión añónte.

Latencia en vivo

Oñemongu'e Stream ojejesareko hag̃ua latencia audio ypy rehe

Ojejapo

Umi sonido fragmento ojehechaukata ko'ápe oikehápe.

0:00
Pedazo ypy:
Bloques tuichakue: 0
Tiempo total:

Mba'éichapa oiko TTS transmisión

Oñemoĩ texto

Ñe'ẽ POST /v1/tts/stream/-pe peteĩ evento-kuéra servidor-gui ojeiporúvaramo.

Modelo ñemoheñói

Kokoro omboja'o ñe'ẽnguéra ha omoheñói ñe'ẽnguéra muestra por muestra GPU-pe.

3. Flujo fragmento-kuéra

Umi fragmento WAV codificado base64-pe og̃uahẽ SSE-pe ha oñepyrũ ojehai pya'e.

Oñe'ẽ'ỹre

Upe usuario ohechakuaa ñe'ẽjoaju ñepyrũmby peteĩ segundo sa'ive aja, jepéramo umi ñe'ẽjoaju ipukúva.

Caso de uso

Latencia subsegundo rehegua ombohape experiencia pyahu.

Agentes ñe'ẽ

Umi bot conversacional oñembohováiva pya'eterei peteĩ yvypóra ojapoháicha.

Doblaje directo

Oñemoambue ha oñembohasa peteĩ flujo tiempo real-pe, oñemomombyry'ỹre.

Juego

Ñemomarandu NPC-pe, ombohováiva umi jugador jeporavo pya'e, ndoguerekói peteĩ VO oñemohendapyréva.

Accesibilidad

Umi lector de pantalla ha herramienta de ayuda oñepyrũ oñe'ẽ peteĩ usuario ohai jave.

Planes TTS tiempo real-pe

Oñepyrũva'erã terã'ỹre, oñemoambue oñeikotevẽ jave hetave

Libre
  • Kokoro streaming (modelo libre)
  • 500 caractere peteĩ generación-pe g̃uarã
  • 10 flujo ojehepyme'ẽva peteĩ árape peteĩteĩ usuario anónimo-pe g̃uarã
  • Latencia de sonido ypy subsegundo-pe
  • SSE jeporu HTTPS rupive
Ojehecharamovéva
Conta libre
  • 15.000 caractere registro-pe
  • 5000 caracter peteĩteĩ flujo-pe g̃uarã
  • Clave API jeike programación rupive
  • Generación rembiasakue
  • Ndojehechavéima flujo rehegua límite
Oñemoinge'ỹre
Pro
  • MOSS-TTS-Realtime (oĩ jave)
  • 100.000 carácter peteĩteĩ flujo-pe g̃uarã
  • GPU cola ñemboguatapy
  • Agente ñe'ẽ + Twilio ñemohenda
  • Tasa ijyvatevéva límite
Ñemoambue

Pregunta ojejapóva py'ỹinte

Ñe'ẽnguérape g̃uarã ñe'ẽnguéra ñemoambue tiempo real-pe ombohasa ñe'ẽnguéra peteĩteĩ ñemoheñói aja, ojejesarekóvo ñe'ẽnguéra ojeipysove hag̃ua. Ñe'ẽnguéra ñemoambue ypykuéra rehegua muestra ypy og̃uahẽ peteĩ segundo-pe, upéva rupive ojeiporukuaa ñe'ẽnguéra rehe ñeñangarekorã, ñe'ẽnguéra duplicación ha aplicación interactiva-kuéra, latencia oñemomba'eguasúva.

TTS katuínte omoheñói archivo de sonido tuichakue ojejuhu mboyve oimeraẽ mba'e - ehecha, upéi oikumby ñe'ẽjoaju tuichakue peteĩ jey. TTS tiempo real-pe oipuru servidor-pegua Evento-kuéra Ojejapyhyva (SSE) ombohasa hag̃ua ñe'ẽjoaju michĩvéva modelo omoheñóiháicha. Upe usuario oikumby ñe'ẽjoaju ñepyrũmby sapy'ánte, jepéramo umi ñe'ẽjoaju ipukúva.

Kokoro hína backend por defecto; omoheñói ñehendurã 100 jey pya'eve peteĩ GPU moderno tiempo real-gui. Oñemoinge MOSS-TTS-Realtime peteĩ alternativa calidad ijyvatevévaramo; umi usuario ikatu oiporavo peteĩ ñeikotevẽ rupive, osẽ rire.

Umi latencia ypy ñehendurã Kokoro-pe hína 300-800 ms peteĩ conexión pública rupive. Upe rire, red-pegua viaje ñembohasa oñemomba'eguasu. Ko aranduka ohechauka mba'éichapa ohasáta ñehendurã ypy interfaz de usuario-pe, ikatu hag̃uaicha ehecha mba'eichaitépa hi'are peteĩteĩ umi ñeporandu.

Agentes ñe'ẽnguéra ombohováiva ñe'ẽjoaju, ñe'ẽjoaju directo medio de transmisión-pe g̃uarã, NPCs ñe'ẽjoaju rehegua, lector de accesibilidad oñepyrũva oñe'ẽ peteĩ usuario ohai jave, ha oimeraẽ aplicación oikotevẽva mokõi térã mbohapy segundo ñe'ẽjoaju oikotevẽva, ikatu ojeipy'apy.

Jepéramo. POST https://api.tts.ai/v1/tts/stream/-pe, cuerpo ojoguáva punto final /v1/tts/-pe. Respuesta hína peteĩ flujo SSE fragmento WAV codificado base64-pe. Oĩ 10 generación peteĩ árape peteĩ usuario anónimo-pe g̃uarã; umi usuario autenticado oguereko carácter-kuéra asignación tuichakue peteĩ cuenta-pe g̃uarã.

Kokoro oiporu ñe'ẽnguéra oñemoarandupyréva ha ndoiporúi clonación. MOSS-TTS-Realtime (oñemoinge jave) oykeko ñe'ẽnguéra clonación cero disparo rehegua peteĩ referencia 3 segundo-pegua. Ñe'ẽnguéra clonación tuichakue g̃uarã ko'ágã, oiporu pe página /text-to-speech/ Chatterbox térã GPT-SoVITS ndive; ko'ã ndoguerekói capacidad de transmisión, katu omoheñói ñe'ẽnguéra ojehechapyréva.

Caracter repy ojoguáva punto final TTS katuípe. Kokoro hína nivel libre (repy 1x). MOSS-TTS-Realtime oikota nivel estándar-pe (repy 2x) oñemohenda jave. Ko protocolo transmisión rehegua ndohejái repy repy jepyapy.

Avei, ojoaju punto final de transmisión peteĩ webhook ñe'ẽnguéra rehegua Twilio ndive, oñe'ẽ hag̃ua ñe'ẽnguéra rehe peteĩ llamada telefónica-pe. Jaikuaaháicha, ko'ã plataforma agente ñe'ẽnguéra rehegua ojapo ko'ã mba'e IVR ha llamadas salientes-pe g̃uarã. Latencia peteĩ llamada telefónica-pe, ojekuaahápe peteĩteĩ, hína 1-2 segundo, oikehápe avei STT ha respuesta LLM.

Rete oipe'a jave peteĩ fragmento transmisión aja, reproductor de transmisión ojupive ohóvo oñembotuichave rãngue. Umi aplicación ndoguerekóiva interrupción, ojevy jey punto final katui ndoguerekóiva transmisión-pe térã oñemombyky 500 ms ñehendurã oñepyrũ mboyve reproducción.
5.0/5 (1)

Mba'épa ikatu ñambohape? Tuichave ñemoneĩ oipytyvõta ñamoambue hag̃ua umi apañuãi.

Ñemoambue ñehendurã tiempo real-pe

Oñeme'ẽ'ỹre 10 generación ypy ára peteĩteĩpe. Oñeme'ẽ peteĩ registro ojeipe'a hag̃ua caractere-kuéra jeporu ha API jeike.