VibeVoice

Speaker 4

معیار انگريزي Neutral VibeVoice

{نام} ایک AI آواز ہے جو کہ {جنس} کے متن سے کلام ماڈل سے طاقتور ہے. یہ آواز {تر} {زبان} بولتی ہے اور {کیفيت} کی کیفیت کی کلام سنتھز فراہم کرتی ہے. قریبی لمحہ کی پیداوار کی رفتار اور 5/5 کی معیار کی درجہ بندی کے ساتھ، Speaker 4 podcasts, dialogues, long-form narration, multi-speaker content کے لیے اچھا ہے. {موڈل} انجن کو {دیولپر}{لايزنس} نے تیار کیا ہے، جس سے یہ تجارتی استعمال کے لیے محفوظ ہے. کلیدی صلاحیتوں میں شامل ہیں: {خاصیت}.

ابھی تک کوئی درجہ بندی نہیں

VibeVoiceماڈل معلومات

ماڈل VibeVoice
ڈیولپر Microsoft
معيار
رفتار ثابت
لائسنس MIT
کلوننگ دستیاب نہیں
تير معیاری (2 کریڈٹ/1K حروف)
پرائمرز 1.5B
فن تعمير LLM + DAC
تربيتي معلومات 100000 گھنٹے
سال 2025

بہترین استعمال کے حالات Speaker 4

اس آواز کی خصوصیات پر مبنی تجويز کردہ ايپليکيشنز

آڈیو کتابیں اور رائے

طويل شکل کے مواد کو فطري نظم اور اظہار کے ساتھ بيان کرنے کے ليے {نام} استعمال کريں

ویڈیو وائٹ اوورس

یو ٹیوب ویڈیوز، اشتہارات اور سوشل میڈیا مواد میں پیشہ ورانہ رائے شامل کریں.

رسائی

تیز پیداوار اس آواز کو ریئل-ٹائم ایپلیکیشنز، اسکرین ریڈرز، اور رسائی ٹولز کے لئے مثالی بناتا ہے۔

پوڈکاسٹ اور براڈکاسٹ

پوڈکاسٹ، ریڈیو اور پیشہ ورانہ نشریات کے لیے سٹوڈیو-کیولٹی آؤٹ پٹ مناسب.

مزید VibeVoice آوازیں

عين TTS ماڈل سے ديگر آوازیں

Speaker 1

انگريزي Neutral

Speaker 1 (Chinese)

چيني Neutral

Speaker 2

انگريزي Neutral

Speaker 2 (Chinese)

چيني Neutral

Speaker 3

انگريزي Neutral

بار بار پوچھے گئے سوالات

مائیکروسافٹ کے وائب وائٹس دو قسموں میں آتا ہے: ایک 1.5B ماڈل طویل فارم مواد کے لئے (90 منٹ تک، 4 اسپیکر) اور ایک ریئل ٹائم 0.5B ماڈل ~200ms پہلے آڈیو لاٹینسی کے ساتھ اسٹریم کے لئے۔ 1.5B ماڈل پوڈکاسٹ اور آڈیو بک میں بلند ہے اور طویل حصوں پر اسپیکر کی ہم آہنگی ہے۔ یاد رکھیں: مائیکروسافٹ نے TTS کوڈ کو ریپائزری سے ہٹا دیا اور پیدا کردہ آڈیو میں سننے والے AI ڈسگریمیشن شامل ہیں۔

وائب وائٹس کو مائیکروسافٹ نے تیار کیا تھا اور ایم آئی ٹی (تحقیق صرف ارادہ) لائسنس کے تحت آزاد کیا گیا ہے، جو پیدا شدہ آڈیو کے تجارتی استعمال کی اجازت دیتا ہے۔

VibeVoice 1 زبان کو مدد دیتا ہے: انگریزی.

VibeVoice پرائمیئم سطح میں ہے - 4 کریڈٹ ہر 1000 حروف میں. آپ مکمل آڈیو پیدا کرنے سے پہلے کوئی بھی VibeVoice آواز مفت میں پیش نگہداشت کر سکتے ہیں.

VibeVoice کی پیدائش کی رفتار متوسط ہے. پیدائش میں عام طور پر چند سیکنڈ لگتے ہیں، جس کا انحصار متن کی لمبائی پر ہوتا ہے.

ویب وائس TTS.ai پر آڈیو کی کیفیت کے لیے 5/5 کی درجہ بندی کی گئی ہے. یہ سٹوڈیو درجے، انسانی جیسے بولنا فراہم کرتا ہے.

نہیں، VibeVoice ایک مقررہ سیٹ بنائے ہوئے آوازوں کا استعمال کرتا ہے آواز کے کلوننگ کے لیے، CosyVoice2، GPT-SoVITS، یا Chatterbox جیسے ماڈلوں کی کوشش کریں.

ہاں، VibeVoice خاص طور پر پوڈکاسٹ، اوڈیو بک، لمبے فارم ملٹی اسپیکر مواد کے لئے سفارش کی جاتی ہے۔ اس کی ملٹی اسپیکر، 90 منٹ تک، پوڈکاسٹ پیدا کرنے کی صلاحیتوں سے یہ اس استعمال کے معاملے کے لئے ایک بہترین انتخاب بنتا ہے۔

جی ہاں، ویب وائٹس کو ایم آئی ٹی کے تحت لائسنس دی گئی ہے (تحقیق کے لئے صرف)، جو تجارتی استعمال کی اجازت دیتا ہے. ویب وائٹس کی آوازوں سے پیدا کی گئی آڈیو ویڈیوز، پوڈکاسٹ، ایپلیکیشنز، گیمز اور دیگر تجارتی پروجیکٹوں میں استعمال کی جاسکتی ہے۔

ہاں، TTS.ai پر تمام آوازیں تجارتی لائسنس کے ساتھ کھلے ذريعے کے ماڈل استعمال کر رہی ہیں (MIT، Apache 2.0)۔ پیدا کی گئی آڈیو آپ کے لئے ویڈیوز، پوڈکاسٹ، ایپس، گیمز اور دیگر تجارتی ایپلیکيشنوں میں استعمال کرنے کے لئے ہے۔

ماڈل نام اور وائٹس آئی ڈی کے ساتھ /api/v1/tts/ کو POST درخواست بھیجیں. پائیٹن، جاواسکریپت، Go اور cURL میں کوڈ مثالوں کے لیے ہماری API ڈکومینیشن صفحہ دیکھیں.

ہاں ، مثال سننے کے ليے اس صفحے پر پلے بٹن کلک کريں آپ متن سے حديث صفحے پر خاص متن بھی ٹائپ کر سکتے هيں اور کوئی آواز کے ليے مفت پيش نما ئي بنا سکتے هيں

کوشش کریں Speaker 4 اب

کوئی متن ٹائپ کريں اور اس کي آواز سنيں Speaker 4. استعمال کے لئے مفت.