VITS

Baker (Chinese)

وړیا چينايي Neutral VITS

.{نوم} د {جنس} AI غږ دی چې د {موډل} ليکنه-په-غږولو موډل لخوا ځواکمن شوی دی. دا {ټېر} غږ { ژبه} خبرې کوي او {کوالي}-کوالي غږيز ترکیب وړاندې کوي د نږدې-ځانګړی د توليد سرعت او د 3/5 د کیفیت درجه سره، {نوم} د general-purpose text-to-speech with natural prosody لپاره ښه مناسب دی. VITS انجن د Jaehyeon Kim et al. under the MIT license لخوا جوړ شوی، چې دا د سوداګريزې کارونې لپاره خوندي کوي. د کلیدي وړتیاوې شامل دي: {خاصیتونه}.

هېڅ کچونه

VITSبېلګه خبرتياوې

بېلګه VITS
پرمخبيونکی Jaehyeon Kim et al.
څرنګوالی
چټکتيا ګړندی
منښتليک MIT
نقلول نه شته
ځناور وړیا (نه کریډیټونه)
پېرامې 25M
معمارۍ VAE + Normalizing Flows + GAN
روزنيز اومتوک 585 ګېنټې
کال 2021

د غوره کارولو قضیې Baker (Chinese)

د دې غږ پر بنسټ سپارښتل شوي کاريالونه

غږيز کتابونه او غږيزې خبرې

{نوم} کاروئ چې د طبیعي پروسيډي او څرګندونې سره اوږده بڼه منځپانګې ووایئ.

ويډيو غږونه

د یوټیوب ویډیوګانو، اعلاناتو او ټولنیزو رسنیو محتوا ته مسلکي کیسه اضافه کړئ.

کاريالونه او لاسرسی

د چټک نسل د ریښتیني وخت غوښتنلیکونو، پرده لوستونکو او لاسرسي وسیلو لپاره دا غږ مثالی کوي.

E- زده کړه او روزنه

د واضح AI کیسې سره د روزنې مواد، کورسونه او تعلیمي مینځپانګې رامینځته کړئ.

نور VITS غږونه

د همدې TTS بېلګه څخه نور غږونه

Default

انګريزي Neutral

ډېرې پوښتنې

VITS (د متن-د-ادب لپاره د مخالف زده کړې سره د بدلونونو استنباط) یو موازي پای-تر-پای TTS میتود دی چې د اوسني دوه مرحلو ماډلونو په پرتله ډیر طبیعي غږیز غږ تولیدوي. دا د بدلونونو استنباط د نورمال جریانونو او د مخالفو روزنې پروسې سره زیاتوي، په طبیعي کې د پام وړ ښه والی ترلاسه کوي.

VITS د Jaehyeon Kim او نورو لخوا رامینځته شوی او د MIT د جواز لاندې خپور شوی، کوم چې د تولید شوي غږ سوداګریز کارولو ته اجازه ورکوي.

VITS 4 ژبې ملاتړ کوي: انګلیسي، چینايي، جاپاني، کوریایي.

VITS په وړيا طبقه کې دی - وړيا - نه د کریډیټ اړتیا. تاسو کولی شئ د بشپړ غږ تولید کولو دمخه د وړیا لپاره د VITS غږ مخکینۍ کتنه وکړئ.

VITS د نسل سرعت خورا چټک دی. دا په نږدې ریښتیني وخت کې چلیږي، د سټریم او تعاملي غوښتنلیکونو لپاره مناسب کوي.

VITS د TTS.ai د غږ د کیفیت لپاره 3/5 درجه ده. دا د ډېرو غوښتنلیکونو لپاره مناسب ښه کیفیت خبرې وړاندې کوي.

نه، VITS د جوړ شوي غږونو ثابت سیټ کاروي. د غږ کلون کولو لپاره، د CosyVoice 2، GPT-SoVITS، یا Chatterbox په څیر ماډلونه هڅه وکړئ.

هو، VITS په ځانګړې توګه د طبیعي prosody سره د عمومي موخې متن-to-نصیب لپاره سپارښتنه کیږي. د هغې د پای-to-پای ترکیب، طبیعي prosody، د چټک استنباط وړتیاوې دا د دې کارولو لپاره یو غوره انتخاب کوي.

هو، VITS د MIT لاندې جواز لري، چې د سوداګریزو کارونې اجازه ورکوي. د VITS غږونو سره تولید شوي غږونه په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو پروژو کې کارول کیدی شي.

هو، د TTS.ai ټول غږونه د سوداګریزو جواز لرونکو خلاص سرچینو ماډلونو (MIT، Apache 2.0) کارولو لپاره کارول کیږي. تولید شوي غږ ستاسو دی چې په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو غوښتنلیکونو کې وکارول شي.

د ماډل نوم او غږ ID سره / api / v1 / tts / ته د POST غوښتنه واستوئ. زموږ د API سندونو پاڼه د Python، JavaScript، Go، او cURL کې د کوډ مثالونو لپاره وګورئ.

هو، په دې مخ کې د لوبې تڼۍ کلیک وکړئ ترڅو یوه نمونه واوریدل شي. تاسو کولی شئ د متن په وینا پاڼه کې د دودیز متن ډول هم وکاروئ او د هرې غږ سره وړیا مخکښ تولید کړئ.

هڅه Baker (Chinese) اوس

کومه ليکنه وليکﺉ او د دې له خوا يې اورﺉ Baker (Chinese). د کارولو لپاره وړيا هېڅ کرېډیټونه اړين نه دي.