StyleTTS 2

Default

پریمیئم انگريزي Neutral StyleTTS 2

{نام} ایک AI آواز ہے جو کہ {جنس} کے متن سے کلام ماڈل سے طاقتور ہے. یہ آواز {تر} {زبان} بولتی ہے اور {کیفيت} کی کیفیت کی کلام سنتھز فراہم کرتی ہے. متوسط کی پیداوار کی رفتار اور 5/5 کی معیار کی درجہ بندی کے ساتھ، Default studio-quality single-speaker synthesis, professional narration کے لیے اچھا ہے. {موڈل} انجن کو {دیولپر}{لايزنس} نے تیار کیا ہے، جس سے یہ تجارتی استعمال کے لیے محفوظ ہے. کلیدی صلاحیتوں میں شامل ہیں: {خاصیت}.

ابھی تک کوئی درجہ بندی نہیں

StyleTTS 2ماڈل معلومات

ماڈل StyleTTS 2
ڈیولپر Columbia University
معيار
رفتار متوسط
لائسنس MIT
کلوننگ دستیاب نہیں
تير پرائمیئم (4 کریڈٹس/1K حروف)
پرائمرز 100M
فن تعمير Style Diffusion + Adversarial Training
تربيتي معلومات 585 گھنٹے
سال 2024

بہترین استعمال کے حالات Default

اس آواز کی خصوصیات پر مبنی تجويز کردہ ايپليکيشنز

آڈیو کتابیں اور رائے

طويل شکل کے مواد کو فطري نظم اور اظہار کے ساتھ بيان کرنے کے ليے {نام} استعمال کريں

ویڈیو وائٹ اوورس

یو ٹیوب ویڈیوز، اشتہارات اور سوشل میڈیا مواد میں پیشہ ورانہ رائے شامل کریں.

پوڈکاسٹ اور براڈکاسٹ

پوڈکاسٹ، ریڈیو اور پیشہ ورانہ نشریات کے لیے سٹوڈیو-کیولٹی آؤٹ پٹ مناسب.

کھیل اور تعاملی میڈیا

گیم ڈائیلاگ، تعاملی کہانیاں، اور تجربات کے لئے پرائمی کیفیت.

بار بار پوچھے گئے سوالات

StyleTTS2 انسان کے سطح پر TTS synthesizing حاصل کرتا ہے بڑے بولنے کے زبان ماڈل استعمال کر کے تنازعہ يي تربيت کے ساتھ انداز انکشاف کو جوڑ کر۔ یہ انسان کی ریکارڈنگ کے مقابلے میں ایک ناطق ماڈل کے درمیان سب سے فطری آواز والی بات پیدا کرتا ہے۔ StyleTTS2 انسانی بولنے کے مختلف اندازوں کو پورے حد تک حاصل کرنے کے ليے انکشاف پر مبنی انداز ماڈلنگ کا استعمال کرتا ہے ۔

سٹیل ٹی ٹی ایس 2 کولومبيا یونیورسٹی نے تیار کیا تھا اور ایم آئی ٹی لائسنس کے تحت آزاد کیا گیا ہے، جو پیدا شدہ آڈیو کے تجارتی استعمال کی اجازت دیتا ہے۔

1 زبان کا 1 انداز

StyleTTS2پریمیئم سطح میں ہے - 4 کریڈٹس پر 1000 حروف آپ مکمل آڈیو پیدا کرنے سے پہلے کوئی بھی StyleTTS2 آواز کو مفت میں پیش نگوئی کر سکتے ہیں

StyleTTS2کے پاس متوسط رفتار کی پیداوار ہے. پیداوار عام طور پر چند سیکنڈ لے لیتی ہے جس کا انحصار متن کی لمبائی پر ہوتا ہے.

StyleTTS2 TTS.ai پر آڈیو کی معيار کے لیے 5/5 درجہ دیا گیا ہے. یہ سٹوڈیو درجے کی، انسانی جیسے بولنا فراہم کرتا ہے.

نہیں، StyleTTS2 اندرونی آوازوں کا ایک مقررہ سیٹ استعمال کرتا ہے آواز کے کلوننگ کے لیے، CosyVoice2، GPT-SoVITS، یا Chatterbox جیسے ماڈلز کا استعمال کریں.

ہاں، StyleTTS 2 خاص طور پر سٹوڈیو-کیو لیتے 싱ل اسپیکر سنتھز، پیشہ ورانہ نریشن کے لئے سفارش کی جاتی ہے. اس کی انسانی سطح، انداز پھیلاؤ، مخالف تربیت کی صلاحیتیں اس استعمال کے معاملے کے لئے ایک بہترین انتخاب بناتی ہیں.

جی ہاں، StyleTTS2 کو MIT کے تحت لائسنس دی گئی ہے جو تجارتی استعمال کی اجازت دیتی ہے۔ StyleTTS2 کے ساتھ پیدا کی گئی آوازوں کو ویڈیوز، پوڈکاسٹ، ایپلیکیشنز، گیمز اور دیگر تجارتی پروجیکٹوں میں استعمال کیا جاسکتا ہے۔

ہاں، TTS.ai پر تمام آوازیں تجارتی لائسنس کے ساتھ کھلے ذريعے کے ماڈل استعمال کر رہی ہیں (MIT، Apache 2.0)۔ پیدا کی گئی آڈیو آپ کے لئے ویڈیوز، پوڈکاسٹ، ایپس، گیمز اور دیگر تجارتی ایپلیکيشنوں میں استعمال کرنے کے لئے ہے۔

ماڈل نام اور وائٹس آئی ڈی کے ساتھ /api/v1/tts/ کو POST درخواست بھیجیں. پائیٹن، جاواسکریپت، Go اور cURL میں کوڈ مثالوں کے لیے ہماری API ڈکومینیشن صفحہ دیکھیں.

ہاں ، مثال سننے کے ليے اس صفحے پر پلے بٹن کلک کريں آپ متن سے حديث صفحے پر خاص متن بھی ٹائپ کر سکتے هيں اور کوئی آواز کے ليے مفت پيش نما ئي بنا سکتے هيں

کوشش کریں Default اب

کوئی متن ٹائپ کريں اور اس کي آواز سنيں Default. استعمال کے لئے مفت.