සැබෑ කාලයේ TTS

උප-තත්පර පළමු ශ්රව්ය ප්රමාද සමග පෙළ-කථාව ප්රවාහනය. හඬ නියෝජිතයන් සහ සජීවී යෙදුම් සඳහා ඉදි කර ඇත.

අපි තවම ඔබේ භාෂාවෙන් TTS හඬක් නැහැ. අපිට උදව් කරන්න ඔබගේ එක එකතු කරන්න! ඔබේ හඬ විකුණන්න

පෙළ

ශ්‍රිතය
0/5,000 අකුරු ~0.3s පළමු ශ්‍රව්‍ය

හඬ සැකසුම් (S)

සරල රේඛීය ආකෘති පමණක් භාවිතා කරයි.

සජීවී ප්‍රමාදතාව

පළමු ශ්‍රව්‍ය ප්‍රමාදතාව මැනීමට ස්ට්රීම් ක්ලික් කරන්න

ප්‍රථිධානය

ශ්‍රව්‍ය කොටස් මෙහිදී වාදනය වේ.

0:00
පළමු කොටස:
මුළු කෑලි: 0
මුළු කාලය:

ක්රියාකාරකම් TTS ක්රීඩා කරන ආකාරය

1. පෙළ යවන්න

/v1/tts/stream/ වෙත POST පෙළ සේවාදායකය-එවන සිදුවීම් ඉල්ලීමක් ලෙස.

2. ආකෘතිය ජනනය

ටයිටැනික් ට්‍රෝජන්

3. ධාරා චුන්ක්ස්

64-bit පරිගණක වලදී, ස්ථාපනය කිරීමෙන් පසු ස්ථාපනය කිරීම ආරම්භ වේ.

4. සජීවී සවන්

යම්කිසි වචනයක් තත්පරයකට බාහිරව සටහන් කිරීමේදී එයට යෙදෙන කාලය සටහන් කර ගැනීමේ දී යම්කිසි කාලයක් ගතවේ.

භාවිතය

තත්පරයට අඩු ප්‍රමාදයකින් නව අත්දැකීම් අගුළු දමනවා.

හඬ නියෝජිතයන්

මිනිසෙකුට හැකි තරම් ඉක්මනින් ප්‍රතිචාර දක්වන සංවාදාත්මක රොබෝවරු.

සජීවී ඩබින්

බෆරින් විරාම තොරව සැබෑ කාලයේ දී ගලා පරිවර්තනය සහ ඩබ්.

ක්‍රීඩාName

NPC සංවාදය ක්ෂණිකව ක්රීඩකයා තෝරා ගැනීමට ප්රතිචාර දක්වන, පෙර-පරිවර්තනය VO නැත.

පිවිසුම් හැකියාව

පරිශීලකයා ක්ලික් කරන මොහොතේ කතා කිරීම ආරම්භ කරන තිර කියවන්නන් සහ සහාය උපකරණ.

තත්කාලීන TTS සැලසුම්

ඔබට වැඩි අවශ්ය විට නිදහස් ආරම්භ, උසස්

නිදහස්
  • Kokoro ශ්රව්ය (නිදහස් ආකෘතිය)
  • පරම්පරාවට අකුරු 500
  • 10 නොමැකෙන පරිශීලකයෙකුට / දිනකට නොමිලේ
  • තත්පරයට පහළ පළමු ශ්‍රව්‍ය ප්‍රමාදතාව
  • HTTPS හරහා SSE විකාශනය
ජනප්‍රියම
නොමිලේ ගිණුම
  • ලියාපදිංචියේදී අක්ෂර 15,000
  • ධාරාවකට අකුරු 5,000
  • වැඩසටහන්ගත පිවිසීම සඳහා API යතුර
  • ජනපද ඉතිහාසය
  • දිනපතා ධාරා උපරිමයක් නැත
ලියාපදිංචි වන්න
ප්‍රො
  • MOSS-TTS-සත්‍ය කාලීන (සජීවී විට)
  • ධාරාවකට අකුරු 100,000
  • ප්‍රමුඛතා GPU පෝලිය
  • හඬ නියෝජිත + Twilio ඒකාබද්ධ
  • ඉහළ අනුපාත සීමා
යාවත්කාලීන කරන්න

නිතර අසන ප්රශ්න

ඔවුන් ජනනය කරන ලෙස, තත්කාලීන පෙළ-කථාව ශ්රව්ය චුන්ක්ස් ගලා, සම්පූර්ණ කිරීමට මුළු වාක්‍යය සඳහා බලා සිටින වෙනුවට. පළමු ශ්රව්ය සාම්පලය තත්පරයකට යටතේ පැමිණේ, සජීවී හඬ නියෝජිතයන් සඳහා එය සුදුසු, ද්විත්ව, හා අන්තර්ක්රියාකාරී යෙදුම් කල් ඉකුත්වීම වැදගත් වන තැන.

සාමාන්‍ය TTS කිසිවක් ආපසු පෙර සම්පූර්ණ ශ්රව්ය ගොනුව ජනනය - ඔබ බලා, පසුව එකවර මුළු වාක්‍යය අසන්න. සැබෑ කාලය TTS ආකෘතිය ඔවුන් නිෂ්පාදනය ලෙස කෙටි ශ්රව්ය චුක් භාවිතා සේවාදායකය-එවන සිදුවීම් (SSE). පරිශීලකයා වචනය ආරම්භය වහාම අසයි, දිගු ආදාන පවා.

Kokoro පෙරනිමි backend වේ - එය නවීන GPU මත සැබෑ කාලයට වඩා දළ වශයෙන් 100x වේගයෙන් ශ්රව්ය ජනනය. අපි උසස් තත්ත්වයේ විකල්පයක් ලෙස MOSS-TTS-Realtime ඒකාබද්ධ කරමින් සිටිති; භාවිතා කරන්නන් නැව් වරක් ඉල්ලීමකට අනුව තෝරා ගැනීමට හැකි වනු ඇත.

Kokoro මත සාමාන්ය පළමු ශ්රව්ය පරතරය 300-800ms මහජන සම්බන්ධතාවක් මත වේ. ජාල වටා-චාරිකාව පසුව පාලනය කරයි. ඔබ එක් එක් ඉල්ලීම කෙතරම් කාලයක් ගත වූයේ ද යන්න හරියටම දැක ගත හැකි වන පරිදි UI හි සජීවී මැන ඇති කාලය-පළමු-ශ්රව්ය පිටුව මතුපිට.

සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්, සන්නිවේදන ක්‍රමවේදයන්,

ඔව්. POST to https://api.tts.ai/v1/tts/stream/ with the same body as the regular /v1/tts/ endpoint. The response isabase64-encoded WAV chunks SSE stream. මෙම නිදහස් ස්ථරය සහාය 10 නිශ්චිත පරිශීලකයෙකු සඳහා දිනකට පරම්පරා; සත්යතාවය තහවුරු පරිශීලකයන් සඳහා ගිණුමකට පූර්ණ චරිත සහන ලබා ගන්න.

Kokoro පෙර පුහුණු හඬ භාවිතා කරන අතර ක්ලෝන නොකරයි. MOSS-TTS-Realtime (සංයුක්ත විට)3තත්පර සාධකයෙන් ශුන්‍ය-ෂොට් හඬ ක්ලෝන සහාය. අද පූර්ණ හඬ ක්ලෝන සඳහා, Chatterbox හෝ GPT-SoVITS සමග නිතිපතා / පෙළ-කතා / පිටුව භාවිතා - එම ශ්රව්ය-සහගත නොවේ නමුත් අභිරුචි හඬ නිෂ්පාදනය.

සාමාන්‍ය TTS අවසන් ස්ථානය ලෙස එම චරිතය පිරිවැය. Kokoro නිදහස්-පන්තියේ (1x පිරිවැය) වේ. MOSS-TTS-Realtime සක්රිය කරන විට සම්මත පන්තිය (2x පිරිවැය) දී ධාවනය වනු ඇත. මෙම ශ්රව්ය ප්රොටෝකෝලය කිසිදු මිලදී ගැනීම් අමතර ගාස්තු එකතු නොකරයි.

ඔව් - දුරකථන ඇමතුමක් බවට සජීවී ශ්රව්ය පෝෂණය කිරීම සඳහා Twilio හඬ webhook සමඟ ශ්රව්ය අවසන් ස්ථානය යුගල. අපගේ හඬ නියෝජිත වේදිකාව දැනටමත් IVR සහ පිටත ඇමතුම් සඳහා මෙය කරයි. දුරකථන ඇමතුමක් මත අවසන්-අවසන් ප්රමාදයක් සාමාන්යයෙන් 1-2 තත්පර STT සහ LLM ප්රතිචාරය ඇතුළු වේ.

ඔබේ ජාලයේ ගමන් බිමන් කොටසක් වැටේ නම්, ප්රවාහනය ක්රීඩකයා වඩා කල් ඉකුත් නොව ඉදිරියට පැන ඇත. හිඩැස් ඉවසාගත නොහැකි යෙදුම් සඳහා, නැවත සාමාන්‍ය නොවන ප්රවාහනය අවසන් ස්ථානයට වැටීම, හෝ ශ්රව්ය 500ms බෆර් ප්රවාහනය ආරම්භ කිරීමට පෙර.
5.0/5 (1)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

තත්කාලීනව කතාබහ ගලායාම

පළමු සඳහා නිදහස් 10 පරම්පරාව දිනකට. පූර්ණ චරිත සහන සහ API ප්රවේශය අගුළු ලීමට ලියාපදිංචි වන්න.