VibeVoice

Speaker 4

معياري انگريزي Neutral VibeVoice

{نام} ھڪ {جنس} AI آواز آھي جنھن کي {موڊل} متن کان ڳالھائڻ واري ماڊل سان طاقت ڏني وئي آھي. ھي {تر} آواز {زبان} ڳالھائيندو آھي ۽ {ڪالائي}-ڪالائي ڳالھائڻ واري سنٿسيٽ مهيا ڪندو آھي. تقريبن هينئر جي پيدائش جي رفتار ۽ 5/5 جي معيار جي تصنيف سان، Speaker 4 podcasts, dialogues, long-form narration, multi-speaker content لاءِ مناسب آھي. VibeVoice انجن Microsoft under the MIT license طرفان تيار ڪيو ويو آھي، جنھن ڪري اھو تجارتي استعمال لاءِ محفوظ آھي. اهم صلاحيتون شامل آهن: {فيچر}.

اڃا ڪو ريٽنگ نه آهي

VibeVoiceماڊل جي معلومات

ماڊل VibeVoice
ڊيولپر Microsoft
معيار
رفتار ٺيڪ
لائسنس MIT
کلوننگ دستياب نه آھي
جانور معياري (2 ڪريڊٽس/1K ڪارٽس)
پيرا ميٽر 1.5B
آرڪيٽيڪچر LLM + DAC
تربيتي ڊيٽا 100000 ڪلاڪ
سال 2025

بهترين استعمال جا ڪيس Speaker 4

ھن آواز تي ٻڌل صلاح ڏنل پروگرام

آڊيو ڪتاب ۽ وڊيو

{نام} استعمال ڪريو ڊگهي فارم جي مواد کي عام پروزوڊ ۽ اظهار سان ٻڌائڻ لاءِ.

وڊيو وڊيو

يوٽيوب وڊيوز، اشتهارن ۽ سماجي ميڊيا مواد ۾ پروفيشنل ڪهاڻيون شامل ڪريو.

رسائي جون ايپليڪيشنون

جلدي پيدا ٿيڻ ڪري هي آواز ريئل-ٽائم ايپليڪيشنن، اسڪرين پڙهندڙن ۽ رسائي جي اوزارن لاءِ مثالي آهي.

پوڊڪاسٽ ۽ برائڊڪاسٽ

پوڊ ڪاسٽ، ريڊيو ۽ پرائيويٽ برائوزنگ لاءِ سسٽم-ڪواليٽي آؤٽپوٽ مناسب.

وڌيڪ VibeVoice آواز

اھڙي TTS ماڊل جا ٻيا آواز

Speaker 1

انگريزي Neutral

Speaker 1 (Chinese)

چيني Neutral

Speaker 2

انگريزي Neutral

Speaker 2 (Chinese)

چيني Neutral

Speaker 3

انگريزي Neutral

گھڻا پڇيا ويندا سوال

مائڪروسافٽ طرفان وييبائيڪ ٻن قسمن ۾ اچي ٿو: هڪ 1.5B ماڊل ڊگهي فارم مواد (90 منٽن تائين، 4 اسپيڪر) ۽ هڪ ريئل ٽائيم 0.5B ماڊل ~200ms پهرين آڊيو لاٽنسي سان اسٽريمنگ لاءِ. 1.5B ماڊل پوڊ ڪاسٽ ۽ آڊيو ڪتابن تي وڏين گذرگاهن تي اسپيڪر جي مطابقت سان بهترين آهي. نوٽ: مائڪروسافٽ TTS ڪوڊ کي رپورٽ مان ڪڍيو ۽ پيدا ڪيل آڊيو ۾ ٻڌل AI disclaimers شامل آهن.

وييبائيس کي مائڪروسافٽ پاران ترقي ڪئي وئي ۽ ايم آءِ ٽي (ريسرچ-آئنٽ-آئنٽ) لائسنس تحت جاري ڪيو ويو آهي، جيڪو پيدا ٿيل آڊيو جي تجارتي استعمال جي اجازت ڏئي ٿو.

وييبائيڪ 1 ٻولي سپورٽ ڪري ٿو: انگريزي.

ويبي واءِس پريميئم درجي ۾ آھي - 4 ڪريڊٽس في 1,000 حروف. توھان ڪنهن به ويبي واءِس آواز کي مڪمل آڊيو پيدا ڪرڻ کان اڳ مفت ۾ ڏسي سگھو ٿا.

ويبي واءِس جي پيدا ڪرڻ جي رفتار وچولي آھي. پيدا ڪرڻ ۾ عام طور تي ڪجهه سيڪنڊ لڳندا آھن، متن جي ڊگھائي تي منحصر آھي.

ويبي واءِس کي TTS.ai تي آڊيو معيار لاءِ 5/5 ڏنل آهي. اهو سٽيڊيو درجي، انسان جهڙي ڳالھائي مهيا ڪري ٿو.

نه، وائيبائيڪ ٺاھيل آوازن جو ٺاھيل مجموعو استعمال ڪندو آھي. آوازن جي کلوننگ لاءِ، CosyVoice 2, GPT-SoVITS, or Chatterbox وانگر ماڊل آزمايو.

ھائو، VibeVoice خاص طور تي پوڊ ڪاسٽ، آڊيو ڪتابن، ڊگهي فارم ملٽي اسپيڪر مواد لاءِ سفارش ڪئي وئي آهي. ان جي ملٽي اسپيڪر، 90 منٽن تائين، پوڊ ڪاسٽ پيدا ڪرڻ جي صلاحيت ان کي هن استعمال جي صورت ۾ هڪ بهترين انتخاب بڻائي ٿي.

ھائو، وائيبائيڪ MIT (رپورٽنگ-آئنٽيٽي) جي لائسنس هيٺ آهي، جيڪو تجارتي استعمال جي اجازت ڏئي ٿو. وائيبائيڪ آوازن سان پيدا ڪيل آڊيو وڊيوز، پوڊ ڪاسٽس، ايپليڪيشنن، راندين ۽ ڪنهن به ٻي تجارتي منصوبي ۾ استعمال ڪري سگهجي ٿو.

ھائو، TTS.ai تي سڀ آواز تجارتي لائسنس ٿيل اوپن سورس ماڊل استعمال ڪن ٿا (MIT، Apache 2.0). پيدا ٿيل آڊيو ويڊيو، پوڊ ڪاسٽ، ايپليڪيشنن، راندين ۽ ٻين تجارتي ايپليڪيشنن ۾ استعمال ڪرڻ لاءِ توهان جو آهي.

/api/v1/tts/ ڏانهن POST درخواست موڪليو ماڊل جي نالي ۽ آواز جي ID سان. Python، JavaScript، Go، ۽ cURL ۾ ڪوڊ جي مثالن لاءِ اسان جي API دستاویز صفحي کي ڏسو.

ھائو، مثال ٻڌڻ لاءِ ھن صفحي تي پلے بٽڻ دٻايو. توھان پنھنجي پسنديده متن کي به لفظن ۾ تبديل ڪرڻ واري صفحي تي لکائي سگھو ٿا ۽ ڪنھن به آواز سان مفت ۾ اڳيون ڏسڻ پيدا ڪري سگھو ٿا.

ڪوشش ڪريو Speaker 4 ھاڻي

ڪو به متن لکو ۽ ٻڌو Speaker 4. استعمال ڪرڻ لاءِ مفت.