GPT-SoVITS

Korean Default

معياري ڪورين Neutral GPT-SoVITS

{نام} ھڪ {جنس} AI آواز آھي جنھن کي {موڊل} متن کان ڳالھائڻ واري ماڊل سان طاقت ڏني وئي آھي. ھي {تر} آواز {زبان} ڳالھائيندو آھي ۽ {ڪالائي}-ڪالائي ڳالھائڻ واري سنٿسيٽ مهيا ڪندو آھي. سست پر اعليٰ درجي جي پيدائش جي رفتار ۽ 5/5 جي معيار جي تصنيف سان، Korean Default voice cloning, singing synthesis, content creator voice replication لاءِ مناسب آھي. GPT-SoVITS انجن RVC-Boss under the MIT license طرفان تيار ڪيو ويو آھي، جنھن ڪري اھو تجارتي استعمال لاءِ محفوظ آھي. اهم صلاحيتون شامل آهن: {فيچر}. GPT-SoVITS ماڊل آواز جي کلوننگ کي به سپورٽ ڪري ٿو - هڪ مختصر آڊيو نمونو اپ لوڊ ڪريو ته جيئن هڪ پسنديده آواز ٺاهيو جيڪو ساڳيون معيار جون خاصيتون رکي.

اڃا ڪو ريٽنگ نه آهي

GPT-SoVITSماڊل جي معلومات

ماڊل GPT-SoVITS
ڊيولپر RVC-Boss
معيار
رفتار ھلڪو
لائسنس MIT
کلوننگ مدد ڏنل
جانور معياري (2 ڪريڊٽس/1K ڪارٽس)
پيرا ميٽر 200M
آرڪيٽيڪچر GPT + SoVITS
سال 2024

بهترين استعمال جا ڪيس Korean Default

ھن آواز تي ٻڌل صلاح ڏنل پروگرام

آڊيو ڪتاب ۽ وڊيو

{نام} استعمال ڪريو ڊگهي فارم جي مواد کي عام پروزوڊ ۽ اظهار سان ٻڌائڻ لاءِ.

وڊيو وڊيو

يوٽيوب وڊيوز، اشتهارن ۽ سماجي ميڊيا مواد ۾ پروفيشنل ڪهاڻيون شامل ڪريو.

پوڊڪاسٽ ۽ برائڊڪاسٽ

پوڊ ڪاسٽ، ريڊيو ۽ پرائيويٽ برائوزنگ لاءِ سسٽم-ڪواليٽي آؤٽپوٽ مناسب.

پسنديده برانڊ آواز

ھڪ منفرد TTS آواز ٺاهڻ لاءِ ھڪ آواز جي شڪل پنھنجي آڊيو سان کلون ڪريو.

وڌيڪ GPT-SoVITS آواز

اھڙي TTS ماڊل جا ٻيا آواز

Default

چيني Neutral

English Default

انگريزي Neutral

Japanese Default

جاپاني Neutral

گھڻا پڇيا ويندا سوال

GPT-SoVITS GPT-style language modeling کي SoVITS (Singing Voice Inference via Translation and Synthesis) سان گڏ ڪري ٿو، جيڪو طاقتور ٿورن شٽن جي آواز جي کلوننگ لاءِ آهي. 5 سيڪنڊن جي حوالي آڊيو سان، اهو صحيح طرح آواز کي کلون ڪري سگهي ٿو ۽ نئين ڳالھه پيدا ڪري سگهي ٿو جڏهن ته ڳالهائيندڙ جي منفرد خاصيتن کي محفوظ ڪري ٿو. اهو ٻنهي ڳالهائڻ ۽ ڳائڻ واري آواز جي سنٿسيٽ ۾ بهترين آهي.

GPT-SoVITS کي RVC-Boss پاران تيار ڪيو ويو ۽ MIT لائسنس تحت جاري ڪيو ويو، جيڪو پيدا ڪيل آڊيو جي تجارتي استعمال جي اجازت ڏئي ٿو.

GPT-SoVITS 4 ٻوليون سپورٽ ڪري ٿو: انگريزي، چيني، جاپاني، ڪورين.

GPT-SoVITS معياري درجي ۾ آھي — 2 ڪريڊٽس في 1,000 حروف. توھان پوري آڊيو پيدا ڪرڻ کان اڳ GPT-SoVITS جي ڪنھن به آواز کي مفت ۾ ڏسي سگھوٿا.

GPT-SoVITS جي پيدا ڪرڻ جي رفتار سست آهي (ڪواليٽي کي ترجيح ڏيئي). اهو هر پيدا ڪرڻ ۾ وڌيڪ وقت وٺندو آهي پر وڌيڪ وفاداري آءوٽپوٽ پيدا ڪندو آهي.

GPT-SoVITS کي TTS.ai تي آڊيو معيار لاءِ 5/5 ڏنل آهي. اهو سٽيو-گريڊ، انسان جهڙي ڳالھائي مهيا ڪري ٿو.

ھائو، GPT-SoVITS zero-shot آواز جي کلوننگ کي مدد ڏئي ٿو. 5-30 سيڪنڊن جي حوالي آڊيو کي اپ لوڊ ڪريو ته جيئن پسنديده آواز ٺاهيو وڃي.

ها، GPT-SoVITS آواز جي کلوننگ، ڳائڻ جي سنٿس، مواد ٺاهيندڙ آواز جي نقل لاءِ خاص طور تي سفارش ڪئي وئي آهي. ان جي 5 سيڪنڊن جي کلوننگ، ڳائڻ جي آواز، ٿورڙي شوٽ سکڻ جي صلاحيت ان کي هن استعمال جي صورت ۾ هڪ بهترين انتخاب بڻائي ٿي.

ھائو، GPT-SoVITS MIT جي لائسنس هيٺ آهي، جيڪو تجارتي استعمال جي اجازت ڏئي ٿو. GPT-SoVITS آوازن سان پيدا ڪيل آڊيو وڊيوز، پوڊ ڪاسٽس، ايپليڪيشنن، راندين ۽ ڪنهن به ٻئي تجارتي منصوبي ۾ استعمال ڪري سگهجي ٿو.

ھائو، TTS.ai تي سڀ آواز تجارتي لائسنس ٿيل اوپن سورس ماڊل استعمال ڪن ٿا (MIT، Apache 2.0). پيدا ٿيل آڊيو ويڊيو، پوڊ ڪاسٽ، ايپليڪيشنن، راندين ۽ ٻين تجارتي ايپليڪيشنن ۾ استعمال ڪرڻ لاءِ توهان جو آهي.

/api/v1/tts/ ڏانهن POST درخواست موڪليو ماڊل جي نالي ۽ آواز جي ID سان. Python، JavaScript، Go، ۽ cURL ۾ ڪوڊ جي مثالن لاءِ اسان جي API دستاویز صفحي کي ڏسو.

ھائو، مثال ٻڌڻ لاءِ ھن صفحي تي پلے بٽڻ دٻايو. توھان پنھنجي پسنديده متن کي به لفظن ۾ تبديل ڪرڻ واري صفحي تي لکائي سگھو ٿا ۽ ڪنھن به آواز سان مفت ۾ اڳيون ڏسڻ پيدا ڪري سگھو ٿا.

ڪوشش ڪريو Korean Default ھاڻي

ڪو به متن لکو ۽ ٻڌو Korean Default. استعمال ڪرڻ لاءِ مفت.