راستىنلا TTS

تېكىستتىن سۆزگە سۈرئەتلىك ئۆتۈش، بىرىنچى ئاۋازنىڭ كېچىكىشى بىر سېكۇنتتىن ئاز. ئاۋاز خادىملىرى ۋە تىرىك پروگراممىلارغا ياسالغان.

تېكىست

ئېقىم
0/5,000 ھەرپلەر ~0.3s ئاۋاز

ئاۋاز تەڭشىكى

پەقەتلا سۈرەتكە ئېلىش ئىقتىدارى بار.

ۋاقىتلىق توختاپ قېلىش

ئاۋازنىڭ ئالدىنقى ۋاقىتنى ئۆلچەش ئۈچۈن Stream نى چېكىڭ

چىقىرىش

ئاۋازلىق قىسمى كىرگەندە بۇ يەردە قويۇلىدۇ.

0:00
تۇنجى قىسىم:
جەمئىي پارچە: 0
جەمئىي ۋاقىت:

TTS نىڭ قانداق ئىشلەيدىغانلىقى

1. تېكىست ئەۋەتىش

/v1/tts/stream/ غا POST تېكىستنى مۇلازىمېتىر يوللىغان ۋەقە تەلەپ قىلىش شەكلىدە يوللايدۇ.

2. مودېل ياساش

Kokoro تېكىستنى پارچىلاپ، GPU نىڭ ئۈن-تېخنىكا ساندۇقىدا ساندۇق-ساندۇق ھالەتتە ئاۋازنى ياسايدۇ.

3. ئېقىم پارچىلىرى

Base64-ئېكودلانغان WAV پارچىلىرى SSE ئارقىلىق كېلىپ، دەرھال قويۇشقا باشلايدۇ.

4. تىرىك ئاڭلاش

User hears the start of the sentence in under a second, even on long inputs.

ئىشلىتىش ئەھۋالى

2-باب :ئۆزگىرىشچانلىقنىڭ يېڭىلىق يارىتىش ئىقتىدارىنى كۆرسىتىدۇ.

ئاۋاز خادىملىرى

سىزنى ئادەمدەك تېز جاۋاپ بېرىدىغان سۆزلىشىش بوتى.

تىرىك دوپپ

Translate and dub a stream in real time without buffering pauses.

ئويۇنلار

ئويۇنچىنىڭ تاللاشلىرىغا دەرھال ئىنكاس قايتۇرىدىغان NPC دىئالوگى، ئالدىن سىزىلغان VO يوق.

قولايلىق

ئېكران ئوقۇغۇچ ۋە قوللايدىغان قوراللار، ئىشلەتكۈچى چېكىپ قويغاندىن كېيىن سۆزلەشكە باشلايدۇ.

راستىنلا TTS پىلانى

ھەقسىز باشلاپ، تېخىمۇ كۆپ نەرسە كېرەك بولغاندا يېڭىلاڭ

بوش
  • Kokoro ئېقىم (ئەركىن نەشرى)
  • ھەر بىر نەشردە 500 ھەرپ
  • ھەربىر نامسىز ئىشلەتكۈچى ئۈچۈن كۈندە 10 ھەقسىز ئېقىم
  • بىرىنچى ئاۋازنىڭ 1 سېكۇنتتىن كىچىك كېچىكىشى
  • HTTPS ئارقىلىق SSE ئېقىمى
ئەڭ كۆپ كۆرۈلىدىغان
ھەقسىز ھېسابات
  • 15000 ھەرپ
  • ھەر بىر ئېقىمدا 5000 ھەرپ
  • پروگرامما ئارقىلىق قوزغىتىش ئۈچۈن API ئاچقۇچى
  • ياساش تارىخى
  • كۈندىلىك ئېقىم چەكلىمىسى يوق
ھەقسىز قوشۇل
مەشغۇلاتچى
  • MOSS-TTS-Realtime (ئادەم سۆزلىگەندە)
  • ھەر بىر ئېقىمدا 10 ھەرپ
  • ئالدىنقى ئورۇندىكى GPU نىڭ ئالدىنقى قاتارى
  • ئاۋاز خادىمى + Twilio بىرلەشتۈرۈش
  • يۇقىرى سۈرئەتلىك چەكلىمىلەر
يېڭىلاش

كۆپ سورالغان سوئاللار

Realtime text-to-speech streams audio chunks as they are generated, instead of waiting for the entire sentence to complete. The first audio sample arrives in under one second, making it suitable for live voice agents, dubbing, and interactive applications where latency matters.

ئاددىي TTS ھەر قانداق نەرسىنى قايتۇرۇپ بېرىشتىن بۇرۇن تولۇق ئاۋاز ھۆججىتىنى ھاسىل قىلىدۇ - سىز كۈتۈۋېلىپ، ئاندىن بىر قېتىمدا پۈتۈن جۈملىنى ئاڭلايسىز. راست ۋاقىتلىق TTS مۇلازىمېتىردىن ئەۋەتىلگەن ۋەقەلەرنى (SSE) ئىشلىتىپ، مودېلنىڭ ئۇلارنى ھاسىل قىلغاندا قىسقا ئاۋاز پارچەلىرىنى ئاڭلاپ بېرىدۇ. ئىشلىتىدىغان ئادەم جۈملىنىڭ باشلىنىشىنى بەكلا تېز ئاڭلايدۇ، ئۇزۇن كىرگۈزگۈچلەردەمۇ شۇنداق.

Kokoro كۆڭۈلدىكىدەك يانفون پروگراممىسىدۇر. ئۇ زامانىۋى گرافىكىلىق كارتىغا قارىغاندا 100 ھەسسە تېزرەك ئۈن چىقىرىدۇ. بىز MOSS-TTS-Realtime نى تېخىمۇ ياخشى تاللاش دەپ بىرلەشتۈردۇق. بۇ پروگرامما ئېلان قىلىنغاندىن كېيىن، ئىشلەتكۈچىلەر ھەر بىر تەلەپ بويىچە تاللاشقا بولىدۇ.

Kokoro نىڭ ئاددىي بىرىنچى ئاۋاز كېچىكىشى 300-800ms بولۇپ، بۇ ئاۋازنى ئاڭلىتىش ئۈچۈن كۆپرەك تورنى ئىشلىتىدۇ. بۇ تورنى ئىشلىتىش جەريانىدا ھەر بىر تەلەپنىڭ قانچىلىك ۋاقىتنى ئىگىلەيدىغانلىقىنى كۆرۈش ئۈچۈن، تور بېكىتى ھەر بىر ئاۋازنى ئاڭلىتىش ئۈچۈن ۋاقىتنى تەكشۈرىدۇ.

Voice agents that respond conversationally, live dubbing for streaming media, interactive game NPCs, accessibility readers that start speaking the moment a user clicks, and any application where waiting two or three seconds for audio would feel sluggish.

ئۇنداق. POST نى https://api.tts.ai/v1/tts/stream/ غا يوللاڭ. بۇ ئاددىي /v1/tts/ ئاخىرلاشتۇرۇش نۇقتىسى بىلەن ئوخشاش بولىدۇ. جاۋاب base64-encoded WAV chunks نىڭ SSE ئېقىمىدۇر. ھەقسىز دەرىجىدە ھەر بىر نامسىز ئىشلەتكۈچى كۈندە 10 قېتىم يېڭىلىنىدۇ؛ ئىجازەت ئالغان ئىشلەتكۈچىلەر ھەر بىر ھېسابات ئۈچۈن تولۇق ھەرپ مىقدارىنى ئالىدۇ.

Kokoro ئالدىن تەلىم ئالغان ئاۋازلارنى ئىشلىتىدۇ، قۇلۇپلاشمايدۇ. MOSS-TTS-Realtime (ئىككىلەشتۈرۈلگەندە) 3 سېكۇنتلۇق رىقابەتتىن باشلاپ ئاۋازنى قۇلۇپلاشنى قوللايدۇ. ھازىرقى زاماندا تولۇق ئاۋازنى قۇلۇپلاش ئۈچۈن Chatterbox ياكى GPT-SoVITS بىلەن /text-to-speech/ بەتلىرىنى ئىشلىتىڭ - بۇلار سۈرەتكە ئېلىشقا قادىر ئەمەس، لېكىن ئۆزىڭىزنىڭ ئاۋازىنى قۇلۇپلايدۇ.

ئاددىي TTS ئاخىرقى نۇقتىسى بىلەن ئوخشاش ھەرپ باھاسى. Kokoro ھەقسىز دەرىجىلىك (1x باھاسى). MOSS-TTS-Realtime قوزغالغاندا، ئاددىي دەرىجىلىك (2x باھاسى) بىلەن ئىشلەيدۇ. سۈرئەتلىك ئۆتۈش كېلىشىمى ھېچقانداق باھا قوشمايدۇ.

ھەئە — تېلېفون زىيارىتىگە ئاۋازنى قوشۇش ئۈچۈن، تارقىتىش ئاخىرى نۇقتىسىنى Twilio ئاۋازلىق webhook بىلەن بىرلەشتۈرىمىز. بىزنىڭ ئاۋازلىق ئەترىتىمىز IVR ۋە چىقىش زىيارىتى ئۈچۈن بۇنى قىلىۋاتىدۇ. تېلېفون زىيارىتىنىڭ ئاخىرىدىن ئاخىرىغىچە كېچىكىشى ئادەتتە STT ۋە LLM جاۋابىنى ئۆز ئىچىگە ئالغان 1-2 سېكۇنت.

تورىڭىزدا بىر قىسىم ئۇچۇرلار يوقاپ كەتسە، ئېقىم قويغۇ توسقۇنلۇققا ئۇچراشتىن بۇرۇن ئالدىغا ئۆتۈپ كېتىدۇ. بۇ خىل خاتالىقنى قوبۇل قىلالمايدىغان پروگراممىلار ئۈچۈن، ئېقىم قويغۇغا ئوخشاش نورمال ئاخىرقى نۇقتىغا قايتىپ كېلىڭ ياكى قويۇشنى باشلاشتىن بۇرۇن 500 مىسلى ئۇسسۇلنى ساقلىۋېلىنىدۇ.
5.0/5 (1)

قانداق ياخشىلاشقا بولىدۇ؟ سىزنىڭ پىكىرىڭىز بىزنى مەسىلىلەرنى ھەل قىلىشقا يېتەكلەيدۇ.

راست ۋاقىتلىق سۆزلىشىش

كۈندە 10 نەپەر ئادەمنى ئىشلەتكەندە ھەقسىز. تولۇق ھەرپ سانلىق-مەلۇماتلارنى ۋە API گە ئېرىشىش ئۈچۈن قوشۇلۇڭ.