VibeVoice

Speaker 1

تلواله انګريزي Neutral VibeVoice

Speaker 1 is a neutral AI voice powered by the VibeVoice text-to-speech model. This :دوتنه_ voice speaks انګريزي and delivers سټېډيو-quality speech synthesis. With نږدې-ځانګړی generation speed and a quality rating of 5/5, Speaker 1 is well-suited for podcasts, dialogues, long-form narration, multi-speaker content. VibeVoice انجن د Microsoft under the MIT license لخوا جوړ شوی، چې دا د سوداګريزې کارونې لپاره خوندي کوي. Key capabilities include: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

هېڅ کچونه

VibeVoiceبېلګه خبرتياوې

بېلګه VibeVoice
پرمخبيونکی Microsoft
څرنګوالی
چټکتيا ګړندی
منښتليک MIT
نقلول نه شته
ځناور معیاري (2 کریډیټونه / 1K کرښې)
پېرامې 1.5B
معمارۍ LLM + DAC
روزنيز اومتوک 100000 ګېنټې
کال 2025

د غوره کارولو قضیې Speaker 1

د دې غږ پر بنسټ سپارښتل شوي کاريالونه

غږيز کتابونه او غږيزې خبرې

Use Speaker 1 to narrate long-form content with natural prosody and expression.

ويډيو غږونه

د یوټیوب ویډیوګانو، اعلاناتو او ټولنیزو رسنیو محتوا ته مسلکي کیسه اضافه کړئ.

کاريالونه او لاسرسی

د چټک نسل د ریښتیني وخت غوښتنلیکونو، پرده لوستونکو او لاسرسي وسیلو لپاره دا غږ مثالی کوي.

پوډکاسټونه او خپرونه

د پوډکاسټونو، راډیو، او مسلکي خپرونو لپاره د سټوډیو کیفیت محصول مناسب.

نور VibeVoice غږونه

د همدې TTS بېلګه څخه نور غږونه

Speaker 1 (Chinese)

چينايي Neutral

Speaker 2

انګريزي Neutral

Speaker 2 (Chinese)

چينايي Neutral

Speaker 3

انګريزي Neutral

Speaker 4

انګريزي Neutral

ډېرې پوښتنې

د مایکروسافټ لخوا ویبیویکس په دوه ډولونو کې راځي: د اوږدې مودې لپاره د 1.5B ماډل (د 90 دقیقو پورې، د 4 غږیز غږیز غږ) او د ریښتیني وخت 0.5B ماډل د ~ 200ms لومړني غږیز غږیز غږ سره د سټریم کولو لپاره. د 1.5B ډول په پوډکاسټونو او آډیو کتابونو کې د اوږدو سفرونو په اوږدو کې د غږیز غږیز غږ سره عالي دی. یادونه: مایکروسافټ د TTS کوډ له ریپوټ څخه لرې کړ او تولید شوي غږ شامل دي د اوریدونکي AI انکارونه.

VibeVoice د مایکروسافټ لخوا رامینځته شوی او د MIT (فقط د څیړنې اراده) جواز لاندې خپور شوی، کوم چې د تولید شوي غږ سوداګریز کارولو ته اجازه ورکوي.

VibeVoice ملاتړ 1 ژبه: انګليسي.

VibeVoice په پریم کچه کې دی - 4 کریډیټونه په هر 1,000 کرکټرونو کې. تاسو کولی شئ د بشپړ غږ تولید کولو دمخه د وړیا لپاره کوم VibeVoice غږ وګورئ.

VibeVoice لري منځنۍ نسل سرعت. نسل په عمومي توګه د متن اوږدوالي پورې اړه لري څو ثانیو نیسي.

VibeVoice د TTS.ai د غږ د کیفیت لپاره 5 / 5 درجه ده. دا د سټوډیو-کلاس، د انسان په څیر خبرې وړاندې کوي.

نه، VibeVoice د جوړ شوي غږونو ثابت سیټ کاروي. د غږ کلون کولو لپاره، د CosyVoice 2، GPT-SoVITS، یا Chatterbox په څیر ماډلونه هڅه وکړئ.

هو، VibeVoice په ځانګړې توګه د podcasts، audiobooks، اوږدې بڼې څو-سفیر محتوا لپاره سپارښتنه کیږي. د دې څو-سفیر، تر 90 دقیقو پورې، د podcast نسل وړتیاوې دا د دې کارولو لپاره یو غوره انتخاب کوي.

هو، VibeVoice د MIT (د څیړنې یوازې اراده) لاندې جواز لري، چې د سوداګریزو کارونې اجازه ورکوي. د VibeVoice غږونو سره تولید شوي غږ په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو پروژو کې کارول کیدی شي.

هو، د TTS.ai ټول غږونه د سوداګریزو جواز لرونکو خلاص سرچینو ماډلونو (MIT، Apache 2.0) کارولو لپاره کارول کیږي. تولید شوي غږ ستاسو دی چې په ویډیوګانو، پوډکاسټونو، غوښتنلیکونو، لوبو او نورو سوداګریزو غوښتنلیکونو کې وکارول شي.

د ماډل نوم او غږ ID سره / api / v1 / tts / ته د POST غوښتنه واستوئ. زموږ د API سندونو پاڼه د Python، JavaScript، Go، او cURL کې د کوډ مثالونو لپاره وګورئ.

هو، په دې مخ کې د لوبې تڼۍ کلیک وکړئ ترڅو یوه نمونه واوریدل شي. تاسو کولی شئ د متن په وینا پاڼه کې د دودیز متن ډول هم وکاروئ او د هرې غږ سره وړیا مخکښ تولید کړئ.

هڅه Speaker 1 اوس

کومه ليکنه وليکﺉ او د دې له خوا يې اورﺉ Speaker 1. د کارولو لپاره وړيا.