رښتيني مهال TTS
د متن-to-speech سره د فرعي ثانوي لومړۍ غږیز latency سره. د غږ استازو او ژوندۍ غوښتنلیکونو لپاره جوړ شوی.
څنګه د TTS کارونه
ليکنه لېږل
د / v1 / tts / جریان / ته د سرور-لېږل شوي پیښو غوښتنې په توګه د متن پوسټ.
2. ماډل توليد
کوکورو متن ټوټې کوي او د غږ نمونې-د-نمونه په GPU کې تولیدوي.
3. د څاڅکو څاڅکي
Base64-encoded WAV ټوټې د SSE څخه راځي او سمدلاسه پیل کوي.
4. ژوندی اورېدل
کاروونکی په یوه ثانیه کې د جملې پیل اوري، حتی په اوږدو انټرنیټونو کې.
کارونې پېښې
چیرې چې د فرعي ثانوي latency نوي تجربې خلاصوي.
غږ استازي
د خبرو اترو بوتونه چې د انسان په څیر ژر ځواب ورکوي.
ژوندی ډبنګ
ژباړه او د ډب په رښتينې وخت کې د يو څاڅکي پرته buffering وقفې.
لوبې
NPC د خبرو اترو چې د لوبغاړي د انتخابونو په سمدستي توګه غبرګون، نه مخکې-rendered VO.
لاسرسی
پرده لوستونکي او مرسته توکي چې د خبرو اترو د پیل په وخت کې د کارونکي کلیک کوي.
رښتينی مهال TTS پلانونه
وړیا پیل کړئ، تازه کړئ کله چې تاسو ډیر اړتیا لرئ
- کوکورو ډرایو (خپلس ماډل)
- په هر نسل کې 500 لوښه
- د 10 وړیا جریانونه / ورځ په هر نامعلوم کارونکي
- لومړۍ غږيزه ځنډول
- د HTTPS په اړه SSE جریان
- په راجستر کې 15،000 کرکټرونه
- 5,000 لوښه په هر ليد
- د پروګرام لاسرسي لپاره API کيلۍ
- نسل تاريخ
- هېڅ ورځنی ليد
- MOSS-TTS-حقیقي وخت (کله چې ژوندی)
- هر ليدنې ته ۱۰ لوښه
- د GPU د اوليت لړۍ
- د غږ استازی + Twilio ادغام
- لوړ نرخ حدونه
ډېرې پوښتنې
موږ څه کولای شي چې ښه شي؟ ستاسو د نظر موږ سره مرسته کوي د ستونزو د حل.
په رښتينې مهال کې وينا لېږل
د لومړي 10 نسلونو لپاره په ورځ کې وړیا. د بشپړ شخصیت معاش او API لاسرسي خلاصولو لپاره راجستر کړئ.