VibeVoice

Speaker 4

تلواله انګريزي Neutral VibeVoice

.{نوم} د {جنس} AI غږ دی چې د {موډل} ليکنه-په-غږولو موډل لخوا ځواکمن شوی دی. دا {ټېر} غږ { ژبه} خبرې کوي او {کوالي}-کوالي غږيز ترکیب وړاندې کوي د نږدې-ځانګړی د توليد سرعت او د 5/5 د کیفیت درجه سره، {نوم} د podcasts, dialogues, long-form narration, multi-speaker content لپاره ښه مناسب دی. VibeVoice انجن د Microsoft under the MIT license لخوا جوړ شوی، چې دا د سوداګريزې کارونې لپاره خوندي کوي. د کلیدي وړتیاوې شامل دي: {خاصیتونه}.

هېڅ کچونه

VibeVoiceبېلګه خبرتياوې

بېلګه VibeVoice
پرمخبيونکی Microsoft
څرنګوالی
چټکتيا ګړندی
منښتليک MIT
نقلول نه شته
ځناور معیاري (2 کریډیټونه / 1K کرښې)
پېرامې 1.5B
معمارۍ LLM + DAC
روزنيز اومتوک 100000 ګېنټې
کال 2025

د غوره کارولو قضیې Speaker 4

د دې غږ پر بنسټ سپارښتل شوي کاريالونه

غږيز کتابونه او غږيزې خبرې

{نوم} کاروئ چې د طبیعي پروسيډي او څرګندونې سره اوږده بڼه منځپانګې ووایئ.

ويډيو غږونه

د یوټیوب ویډیوګانو، اعلاناتو او ټولنیزو رسنیو محتوا ته مسلکي کیسه اضافه کړئ.

کاريالونه او لاسرسی

د چټک نسل د ریښتیني وخت غوښتنلیکونو، پرده لوستونکو او لاسرسي وسیلو لپاره دا غږ مثالی کوي.

پوډکاسټونه او خپرونه

د پوډکاسټونو، راډیو، او مسلکي خپرونو لپاره د سټوډیو کیفیت محصول مناسب.

نور VibeVoice غږونه

د همدې TTS بېلګه څخه نور غږونه

Speaker 1

انګريزي Neutral

Speaker 1 (Chinese)

چينايي Neutral

Speaker 2

انګريزي Neutral

Speaker 2 (Chinese)

چينايي Neutral

Speaker 3

انګريزي Neutral

ډېرې پوښتنې

د مایکروسافټ لخوا ویبیویکس په دوه ډولونو کې راځي: د اوږدې مودې لپاره د 1.5B ماډل (د 90 دقیقو پورې، د 4 غږیز غږیز غږ) او د ریښتیني وخت 0.5B ماډل د ~ 200ms لومړني غږیز غږیز غږ سره د سټریم کولو لپاره. د 1.5B ډول په پوډکاسټونو او آډیو کتابونو کې د اوږدو سفرونو په اوږدو کې د غږیز غږیز غږ سره عالي دی. یادونه: مایکروسافټ د TTS کوډ له ریپوټ څخه لرې کړ او تولید شوي غږ شامل دي د اوریدونکي AI انکارونه.

VibeVoice د مایکروسافټ لخوا رامینځته شوی او د MIT (فقط د څیړنې اراده) جواز لاندې خپور شوی، کوم چې د تولید شوي غږ سوداګریز کارولو ته اجازه ورکوي.

VibeVoice ملاتړ 1 ژبه: انګليسي.

VibeVoice په پریم کچه کې دی - 4 کریډیټونه په هر 1,000 کرکټرونو کې. تاسو کولی شئ د بشپړ غږ تولید کولو دمخه د وړیا لپاره کوم VibeVoice غږ وګورئ.

VibeVoice لري منځنۍ نسل سرعت. نسل په عمومي توګه د متن اوږدوالي پورې اړه لري څو ثانیو نیسي.

VibeVoice د TTS.ai د غږ د کیفیت لپاره 5 / 5 درجه ده. دا د سټوډیو-کلاس، د انسان په څیر خبرې وړاندې کوي.

نه، VibeVoice د جوړ شوي غږونو ثابت سیټ کاروي. د غږ کلون کولو لپاره، د CosyVoice 2، GPT-SoVITS، یا Chatterbox په څیر ماډلونه هڅه وکړئ.

هو، VibeVoice په ځانګړې توګه د podcasts، audiobooks، اوږدې بڼې څو-سفیر محتوا لپاره سپارښتنه کیږي. د دې څو-سفیر، تر 90 دقیقو پورې، د podcast نسل وړتیاوې دا د دې کارولو لپاره یو غوره انتخاب کوي.

هو، VibeVoice د MIT (د څیړنې یوازې اراده) لاندې جواز لري، چې د سوداګریزو کارونې اجازه ورکوي. د VibeVoice غږونو سره تولید شوي غږ په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو پروژو کې کارول کیدی شي.

هو، د TTS.ai ټول غږونه د سوداګریزو جواز لرونکو خلاص سرچینو ماډلونو (MIT، Apache 2.0) کارولو لپاره کارول کیږي. تولید شوي غږ ستاسو دی چې په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو غوښتنلیکونو کې وکارول شي.

د ماډل نوم او غږ ID سره / api / v1 / tts / ته د POST غوښتنه واستوئ. زموږ د API سندونو پاڼه د Python، JavaScript، Go، او cURL کې د کوډ مثالونو لپاره وګورئ.

هو، په دې مخ کې د لوبې تڼۍ کلیک وکړئ ترڅو یوه نمونه واوریدل شي. تاسو کولی شئ د متن په وینا پاڼه کې د دودیز متن ډول هم وکاروئ او د هرې غږ سره وړیا مخکښ تولید کړئ.

هڅه Speaker 4 اوس

کومه ليکنه وليکﺉ او د دې له خوا يې اورﺉ Speaker 4. د کارولو لپاره وړيا.