VibeVoice

Speaker 1

معياري انگريزي Neutral VibeVoice

Speaker 1 is a neutral AI voice powered by the VibeVoice text-to-speech model. This معياري voice speaks انگريزي and delivers اسٽوڊيو-quality speech synthesis. تقريبن هينئر جي پيدائش جي رفتار ۽ 5/5 جي معيار جي تصنيف سان، Speaker 1 podcasts, dialogues, long-form narration, multi-speaker content لاءِ مناسب آھي. VibeVoice انجن Microsoft under the MIT license طرفان تيار ڪيو ويو آھي، جنھن ڪري اھو تجارتي استعمال لاءِ محفوظ آھي. Key capabilities include: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

اڃا ڪو ريٽنگ نه آهي

VibeVoiceماڊل جي معلومات

ماڊل VibeVoice
ڊيولپر Microsoft
معيار
رفتار ٺيڪ
لائسنس MIT
کلوننگ دستياب نه آھي
جانور معياري (2 ڪريڊٽس/1K ڪارٽس)
پيرا ميٽر 1.5B
آرڪيٽيڪچر LLM + DAC
تربيتي ڊيٽا 100000 ڪلاڪ
سال 2025

بهترين استعمال جا ڪيس Speaker 1

ھن آواز تي ٻڌل صلاح ڏنل پروگرام

آڊيو ڪتاب ۽ وڊيو

Use Speaker 1 to narrate long-form content with natural prosody and expression.

وڊيو وڊيو

يوٽيوب وڊيوز، اشتهارن ۽ سماجي ميڊيا مواد ۾ پروفيشنل ڪهاڻيون شامل ڪريو.

رسائي جون ايپليڪيشنون

جلدي پيدا ٿيڻ ڪري هي آواز ريئل-ٽائم ايپليڪيشنن، اسڪرين پڙهندڙن ۽ رسائي جي اوزارن لاءِ مثالي آهي.

پوڊڪاسٽ ۽ برائڊڪاسٽ

پوڊ ڪاسٽ، ريڊيو ۽ پرائيويٽ برائوزنگ لاءِ سسٽم-ڪواليٽي آؤٽپوٽ مناسب.

وڌيڪ VibeVoice آواز

اھڙي TTS ماڊل جا ٻيا آواز

Speaker 1 (Chinese)

چيني Neutral

Speaker 2

انگريزي Neutral

Speaker 2 (Chinese)

چيني Neutral

Speaker 3

انگريزي Neutral

Speaker 4

انگريزي Neutral

گھڻا پڇيا ويندا سوال

مائڪروسافٽ طرفان وييبائيڪ ٻن قسمن ۾ اچي ٿو: هڪ 1.5B ماڊل ڊگهي فارم مواد (90 منٽن تائين، 4 اسپيڪر) ۽ هڪ ريئل ٽائيم 0.5B ماڊل ~200ms پهرين آڊيو لاٽنسي سان اسٽريمنگ لاءِ. 1.5B ماڊل پوڊ ڪاسٽ ۽ آڊيو ڪتابن تي وڏين گذرگاهن تي اسپيڪر جي مطابقت سان بهترين آهي. نوٽ: مائڪروسافٽ TTS ڪوڊ کي رپورٽ مان ڪڍيو ۽ پيدا ڪيل آڊيو ۾ ٻڌل AI disclaimers شامل آهن.

وييبائيس کي مائڪروسافٽ پاران ترقي ڪئي وئي ۽ ايم آءِ ٽي (ريسرچ-آئنٽ-آئنٽ) لائسنس تحت جاري ڪيو ويو آهي، جيڪو پيدا ٿيل آڊيو جي تجارتي استعمال جي اجازت ڏئي ٿو.

وييبائيڪ 1 ٻولي سپورٽ ڪري ٿو: انگريزي.

ويبي واءِس پريميئم درجي ۾ آھي - 4 ڪريڊٽس في 1,000 حروف. توھان ڪنهن به ويبي واءِس آواز کي مڪمل آڊيو پيدا ڪرڻ کان اڳ مفت ۾ ڏسي سگھو ٿا.

ويبي واءِس جي پيدا ڪرڻ جي رفتار وچولي آھي. پيدا ڪرڻ ۾ عام طور تي ڪجهه سيڪنڊ لڳندا آھن، متن جي ڊگھائي تي منحصر آھي.

ويبي واءِس کي TTS.ai تي آڊيو معيار لاءِ 5/5 ڏنل آهي. اهو سٽيڊيو درجي، انسان جهڙي ڳالھائي مهيا ڪري ٿو.

نه، وائيبائيڪ ٺاھيل آوازن جو ٺاھيل مجموعو استعمال ڪندو آھي. آوازن جي کلوننگ لاءِ، CosyVoice 2, GPT-SoVITS, or Chatterbox وانگر ماڊل آزمايو.

ھائو، VibeVoice خاص طور تي پوڊ ڪاسٽ، آڊيو ڪتابن، ڊگهي فارم ملٽي اسپيڪر مواد لاءِ سفارش ڪئي وئي آهي. ان جي ملٽي اسپيڪر، 90 منٽن تائين، پوڊ ڪاسٽ پيدا ڪرڻ جي صلاحيت ان کي هن استعمال جي صورت ۾ هڪ بهترين انتخاب بڻائي ٿي.

ھائو، وائيبائيڪ MIT (رپورٽنگ-آئنٽيٽي) جي لائسنس هيٺ آهي، جيڪو تجارتي استعمال جي اجازت ڏئي ٿو. وائيبائيڪ آوازن سان پيدا ڪيل آڊيو وڊيوز، پوڊ ڪاسٽس، ايپليڪيشنن، راندين ۽ ڪنهن به ٻي تجارتي منصوبي ۾ استعمال ڪري سگهجي ٿو.

ھائو، TTS.ai تي سڀ آواز تجارتي لائسنس ٿيل اوپن سورس ماڊل استعمال ڪن ٿا (MIT، Apache 2.0). پيدا ٿيل آڊيو ويڊيو، پوڊ ڪاسٽ، ايپليڪيشنن، راندين ۽ ٻين تجارتي ايپليڪيشنن ۾ استعمال ڪرڻ لاءِ توهان جو آهي.

/api/v1/tts/ ڏانهن POST درخواست موڪليو ماڊل جي نالي ۽ آواز جي ID سان. Python، JavaScript، Go، ۽ cURL ۾ ڪوڊ جي مثالن لاءِ اسان جي API دستاویز صفحي کي ڏسو.

ھائو، مثال ٻڌڻ لاءِ ھن صفحي تي پلے بٽڻ دٻايو. توھان پنھنجي پسنديده متن کي به لفظن ۾ تبديل ڪرڻ واري صفحي تي لکائي سگھو ٿا ۽ ڪنھن به آواز سان مفت ۾ اڳيون ڏسڻ پيدا ڪري سگھو ٿا.

ڪوشش ڪريو Speaker 1 ھاڻي

ڪو به متن لکو ۽ ٻڌو Speaker 1. استعمال ڪرڻ لاءِ مفت.