رښتيني مهال TTS

د متن-to-speech سره د فرعي ثانوي لومړۍ غږیز latency سره. د غږ استازو او ژوندۍ غوښتنلیکونو لپاره جوړ شوی.

ليکنه

:دوتنه لېږل
0/5,000 لوښه ~0.3s لومړی غږيز

غږ امستنې &

یوازې د سټریم کولو وړ ماډلونه.

ژوندی ځنډ

د لومړۍ غږيزې ځنډې د اندازه کولو لپاره د ليدنې کېکاږﺉ

وتۍ

غږيز ټوټې به دلته غږول کيږي لکه څنګه چې ورتلل کيږي

0:00
لومړی ټوک:
ټول ټوټې: 0
ټول مهال:

څنګه د TTS کارونه

ليکنه لېږل

د / v1 / tts / جریان / ته د سرور-لېږل شوي پیښو غوښتنې په توګه د متن پوسټ.

2. ماډل توليد

کوکورو متن ټوټې کوي او د غږ نمونې-د-نمونه په GPU کې تولیدوي.

3. د څاڅکو څاڅکي

Base64-encoded WAV ټوټې د SSE څخه راځي او سمدلاسه پیل کوي.

4. ژوندی اورېدل

کاروونکی په یوه ثانیه کې د جملې پیل اوري، حتی په اوږدو انټرنیټونو کې.

کارونې پېښې

چیرې چې د فرعي ثانوي latency نوي تجربې خلاصوي.

غږ استازي

د خبرو اترو بوتونه چې د انسان په څیر ژر ځواب ورکوي.

ژوندی ډبنګ

ژباړه او د ډب په رښتينې وخت کې د يو څاڅکي پرته buffering وقفې.

لوبې

NPC د خبرو اترو چې د لوبغاړي د انتخابونو په سمدستي توګه غبرګون، نه مخکې-rendered VO.

لاسرسی

پرده لوستونکي او مرسته توکي چې د خبرو اترو د پیل په وخت کې د کارونکي کلیک کوي.

رښتينی مهال TTS پلانونه

وړیا پیل کړئ، تازه کړئ کله چې تاسو ډیر اړتیا لرئ

وړیا
  • کوکورو ډرایو (خپلس ماډل)
  • په هر نسل کې 500 لوښه
  • د 10 وړیا جریانونه / ورځ په هر نامعلوم کارونکي
  • لومړۍ غږيزه ځنډول
  • د HTTPS په اړه SSE جریان
تر ټولو مشهور
وړیا ګڼون
  • په راجستر کې 15،000 کرکټرونه
  • 5,000 لوښه په هر ليد
  • د پروګرام لاسرسي لپاره API کيلۍ
  • نسل تاريخ
  • هېڅ ورځنی ليد
په وړیا ډول راجستر شئ
د
  • MOSS-TTS-حقیقي وخت (کله چې ژوندی)
  • هر ليدنې ته ۱۰ لوښه
  • د GPU د اوليت لړۍ
  • د غږ استازی + Twilio ادغام
  • لوړ نرخ حدونه
اوسمهالول

ډېرې پوښتنې

د ریښتیني وخت متن-to-speech د غږ غږونه تولیدوي لکه څنګه چې دوی تولید شوي، د بشپړ جملې لپاره د انتظار کولو پرځای. لومړی غږ نمونې په یوه ثانیه کې راځي، د ژوندي غږ استازو، ډوبنګ، او تعاملي غوښتنلیکونو لپاره مناسب کوي چیرې چې د latency مسلې.

منظم TTS د څه د بیرته ورکولو دمخه بشپړ غږیز فایل رامینځته کوي - تاسو انتظار کوئ، نو په یو وخت کې ټول جملې اوریدل. ریښتیني وخت TTS د سرور-لیږل شوي پیښو (SSE) کاروي ترڅو د ماډل تولید کړي. کاروونکی د جملې پیل تقریبا سمدلاسه اوري، حتی په اوږدو انټرنیټونو کې.

کوکورو د ډیفالټ بکس دی - دا د عصري GPU په اړه د ریښتیني وخت څخه 100x ډیر ګړندی غږ تولیدوي. موږ د MOSS-TTS-Realtime د لوړ کیفیت بدیل په توګه یوځای کوو؛ کاروونکي به وکولی شي په هر غوښتنلیک کې یوځل چې کښتۍ غوره کړي.

د کوکورو په اړه د لومړي آډیو لاټینسي د عامه اړیکو په اړه د 300-800ms دی. د شبکې پړاو سفر وروسته له هغه واکمن دی. پاڼه د UI کې د ژوندي اندازه شوي وخت-تر-پنځم-آډیو سطحه کوي نو تاسو کولی شئ په دقیق ډول وګورئ چې هر غوښتنلیک څومره وخت نیسي.

د غږ استازي چې په خبرو اترو کې ځواب ورکوي، د میډیا د خپرولو لپاره ژوندی ډوبنګ، د تعاملي لوبې NPCs، د لاسرسي لوستونکي چې د کارونکي کلیک کولو پرمهال خبرې پیل کوي، او هر غوښتنلیک چیرې چې د غږ لپاره دوه یا درې ثانیې انتظار به ورو احساس کړي.

هو. د POST ته https://api.tts.ai/v1/tts/stream / د ورته بدن سره لکه د منظم / v1 / tts / پای ټکی. ځواب د base64-encoded WAV chunks SSE جریان دی. وړیا طبقه د هر نامعلوم کارونکي لپاره د 10 نسلونو ملاتړ کوي؛ تصدیق شوي کاروونکي د حساب لپاره د بشپړ شخصیت معاش ترلاسه کوي.

کوکورو دمخه روزل شوي غږونه کاروي او کلون نه کوي. MOSS-TTS-Realtime (کله چې یوځای شي) د 3 ثانیې مراجع څخه د صفر-شوټ غږ کلون کولو ملاتړ کوي. د بشپړ غږ کلون کولو لپاره نن ورځ، د Chatterbox یا GPT-SoVITS سره منظم / متن-to-speech / پاڼه وکاروئ - دا د سټریم کولو وړ ندي مګر د دودیزو غږونو تولید کوي.

د عادي TTS پای ټکي په توګه ورته کرکټر لګښت. کوکورو وړیا دی (1x لګښت). MOSS-TTS-Realtime به په معیاري کچه (2x لګښت) کې چلیږي کله چې فعال شي. د جریان پروتوکول هیڅ قیمت اضافه نه کوي.

هو - د ټلیفون په تماس کې د ژوندی غږ ورکولو لپاره د ټیلیلو غږ ویډیو سره د سټریم پای ټکی یوځای کړئ. زموږ د غږ استازی پلیټ فارم دمخه د IVR او بهر زنګ وهلو لپاره دا کوي. د تلیفون په زنګ کې د پای څخه تر پای پورې د 1-2 ثانیو په شمول د STT او LLM غبرګون شامل دی.

که ستاسو شبکې په انتقال کې یو ټوټه راټیټ شي، د سټریمنګ لوبغاړی به د سټال پرځای مخ ته ولویږي. د غوښتنلیکونو لپاره چې نشي کولی د تشنابونو سره مقاومت وکړي، د منظم غیر سټریمنګ پای ټکي ته بیرته راشي، یا د غږیز 500ms بفر د غږیز پیل کولو دمخه.
5.0/5 (1)

موږ څه کولای شي چې ښه شي؟ ستاسو د نظر موږ سره مرسته کوي د ستونزو د حل.

په رښتينې مهال کې وينا لېږل

د لومړي 10 نسلونو لپاره په ورځ کې وړیا. د بشپړ شخصیت معاش او API لاسرسي خلاصولو لپاره راجستر کړئ.