StyleTTS 2

Default

پريميئم انگريزي Neutral StyleTTS 2

{نام} ھڪ {جنس} AI آواز آھي جنھن کي {موڊل} متن کان ڳالھائڻ واري ماڊل سان طاقت ڏني وئي آھي. ھي {تر} آواز {زبان} ڳالھائيندو آھي ۽ {ڪالائي}-ڪالائي ڳالھائڻ واري سنٿسيٽ مهيا ڪندو آھي. وچولي جي پيدائش جي رفتار ۽ 5/5 جي معيار جي تصنيف سان، Default studio-quality single-speaker synthesis, professional narration لاءِ مناسب آھي. StyleTTS 2 انجن Columbia University under the MIT license طرفان تيار ڪيو ويو آھي، جنھن ڪري اھو تجارتي استعمال لاءِ محفوظ آھي. اهم صلاحيتون شامل آهن: {فيچر}.

اڃا ڪو ريٽنگ نه آهي

StyleTTS 2ماڊل جي معلومات

ماڊل StyleTTS 2
ڊيولپر Columbia University
معيار
رفتار ميڊيا
لائسنس MIT
کلوننگ دستياب نه آھي
جانور پريميئم (4 ڪريڊٽس/1K ڪارٽس)
پيرا ميٽر 100M
آرڪيٽيڪچر Style Diffusion + Adversarial Training
تربيتي ڊيٽا 585 ڪلاڪ
سال 2024

بهترين استعمال جا ڪيس Default

ھن آواز تي ٻڌل صلاح ڏنل پروگرام

آڊيو ڪتاب ۽ وڊيو

{نام} استعمال ڪريو ڊگهي فارم جي مواد کي عام پروزوڊ ۽ اظهار سان ٻڌائڻ لاءِ.

وڊيو وڊيو

يوٽيوب وڊيوز، اشتهارن ۽ سماجي ميڊيا مواد ۾ پروفيشنل ڪهاڻيون شامل ڪريو.

پوڊڪاسٽ ۽ برائڊڪاسٽ

پوڊ ڪاسٽ، ريڊيو ۽ پرائيويٽ برائوزنگ لاءِ سسٽم-ڪواليٽي آؤٽپوٽ مناسب.

رانديون ۽ ميڊيا

راندين جي گفتگو، مداخلت ڪندڙ ڪهاڻيون ۽ اڻ کٽ تجربن لاءِ پرائمري معيار.

گھڻا پڇيا ويندا سوال

StyleTTS 2 انسان جي سطح تي TTS سينڊس کي حاصل ڪري ٿو، وڏين ڳالهائڻ جي ٻولين جا ماڊل استعمال ڪندي، انداز جي پکڙجڻ ۽ مقابلي واري تربيت کي گڏ ڪري. اهو هڪ ڳالهائيندڙ ماڊلن جي وچ ۾ سڀ کان وڌيڪ قدرتي آواز واري ڳالهائڻ پيدا ڪري ٿو، انسان جي رڪارڊنگ جي مقابلي ۾. StyleTTS 2 انسان جي ڳالهائڻ جي مختلفين جي مڪمل حد کي پڪڙڻ لاءِ انداز تي ٻڌل انداز جي ماڊلنگ استعمال ڪري ٿو.

StyleTTS 2 کي کولمبيا يونيورسٽيءَ پاران تيار ڪيو ويو ۽ MIT لائسنس تحت جاري ڪيو ويو، جيڪو پيدا ڪيل آڊيو جي تجارتي استعمال جي اجازت ڏئي ٿو.

StyleTTS 2 1 ٻولي سپورٽ ڪري ٿو: انگريزي.

StyleTTS 2 پريميئم درجي ۾ آهي — 4 ڪريڊٽس هر 1,000 حروف. توهان ڪنهن به StyleTTS 2 آواز کي مڪمل آڊيو پيدا ڪرڻ کان اڳ مفت ۾ ڏسي سگهو ٿا.

StyleTTS 2 جي پيدا ڪرڻ جي رفتار وچولي آهي. پيدا ڪرڻ عام طور تي ڪجهه سيڪنڊن ۾ ٿي ويندو آھي، متن جي ڊگهي تي منحصر آھي.

StyleTTS 2 کي TTS.ai تي آڊيو معيار لاءِ 5/5 ڏنل آهي. اهو سٽيڊيو درجي، انسان جهڙي ڳالھائي مهيا ڪري ٿو.

نه، StyleTTS 2 ٺاھيل آوازن جو ٺاھيل سيٽ استعمال ڪندو آھي. آوازن جي کلوننگ لاءِ، CosyVoice 2, GPT-SoVITS, or Chatterbox وانگر ماڊل آزمايو.

ھائو، StyleTTS 2 خاص طور تي اسٽوڊيو- معياري هڪ- اسپيڪر سنٿس، پرائيويٽ ورڪر جي بيان لاءِ سفارش ڪئي وئي آهي. ان جي انسان جي سطح، انداز جي پکيڙ، مقابلي واري تربيت جي صلاحيت ان کي ان استعمال جي صورت لاءِ هڪ بهترين انتخاب بڻائي ٿي.

ھائو، StyleTTS 2 MIT جي لائسنس هيٺ آهي، جيڪو تجارتي استعمال جي اجازت ڏئي ٿو. StyleTTS 2 سان پيدا ڪيل آڊيو آواز وڊيوز، پوڊ ڪاسٽس، ايپليڪيشنن، راندين ۽ ڪنهن به ٻي تجارتي منصوبي ۾ استعمال ڪري سگهجي ٿو.

ھائو، TTS.ai تي سڀ آواز تجارتي لائسنس ٿيل اوپن سورس ماڊل استعمال ڪن ٿا (MIT، Apache 2.0). پيدا ٿيل آڊيو ويڊيو، پوڊ ڪاسٽ، ايپليڪيشنن، راندين ۽ ٻين تجارتي ايپليڪيشنن ۾ استعمال ڪرڻ لاءِ توهان جو آهي.

/api/v1/tts/ ڏانهن POST درخواست موڪليو ماڊل جي نالي ۽ آواز جي ID سان. Python، JavaScript، Go، ۽ cURL ۾ ڪوڊ جي مثالن لاءِ اسان جي API دستاویز صفحي کي ڏسو.

ھائو، مثال ٻڌڻ لاءِ ھن صفحي تي پلے بٽڻ دٻايو. توھان پنھنجي پسنديده متن کي به لفظن ۾ تبديل ڪرڻ واري صفحي تي لکائي سگھو ٿا ۽ ڪنھن به آواز سان مفت ۾ اڳيون ڏسڻ پيدا ڪري سگھو ٿا.

ڪوشش ڪريو Default ھاڻي

ڪو به متن لکو ۽ ٻڌو Default. استعمال ڪرڻ لاءِ مفت.