GPT-SoVITS

Default

စံ တရုတ် Neutral GPT-SoVITS

Default သည် GPT-SoVITS စာသားမှစကားပြောသည့် ပုံစံဖြင့် စွမ်းဆောင်ထားသော neutral AI အသံဖြစ်သည်။ ဤ စံအဆင့် အသံသည် တရုတ် ကိုပြောဆိုပြီး စတူဒီယို-အရည်အသွေးရှိသော စကားပြောပေါင်းစပ်မှုကို ပေးပို့သည်။ နှေးသော်လည်း မြင့်မားသော-ယုံကြည်မှု generation အမြန်နှုန်းနှင့် 5 /5၏အရည်အသွေး rating ဖြင့် Default သည် voice cloning, singing synthesis, content creator voice replication အတွက်သင့်လျော်သည်။ GPT-SoVITS အင်ဂျင်ကို RVC-Boss under the MIT license မှ ဖွံ့ဖြိုးစေပြီး စီးပွားရေးလုပ်ငန်းအတွက် လုံခြုံစေသည်။ အဓိကစွမ်းဆောင်ရည်များပါဝင်သည်: 5-second cloning, singing voice, few-shot learning, high fidelity, cross-lingual ။ GPT-SoVITS ပုံစံသည်အသံကို clone လုပ်ခြင်းကိုပါထောက်ခံသည် - အလားတူအရည်အသွေးအရည်အသွေးများကိုထိန်းသိမ်းထားသည့်ကိုယ်ပိုင်အသံတစ်ခုကိုဖန်တီးရန်အသံနမူနာတိုကို upload လုပ်ပါ။

စံသတ်မှတ်ချက်မရှိ

GPT-SoVITSမော်ဒယ်အချက်အလက်များ

မော်ဒယ် GPT-SoVITS
ဖန်တီးသူ RVC-Boss
အရည်အသွေး
အမြန်နှုန်း နှေး
လိုင်စင် MIT
ကူးယူခြင်း ထောက်ခံသည်
အမျိုးအစား စံ (2x အက္ခရာများ)
သတ်မှတ်ချက်များ 200M
ဗိသုကာပညာ GPT + SoVITS
နှစ် 2024

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Default

ဤအသံ၏ ဂုဏ်သတ္တိများအပေါ် အခြေခံ၍ အကြံပြုထားသော အပလီကေးရှင်းများ

အသံစာအုပ်များ & ပြောပြချက်

သဘာဝ prosody နှင့် expression များဖြင့်ရှည်လျားသောပုံစံအကြောင်းအရာများကိုပြောပြရန် Default ကိုအသုံးပြုပါ။

ရုပ်သံ အသံသွင်း

YouTube ဗီဒီယိုများ, ကြော်ငြာများ, နှင့်လူမှုမီဒီယာအကြောင်းအရာများအတွက်ပရော်ဖက်ရှင်နယ်ပြောဆိုမှုထည့်သွင်းပါ။

Podcasts & ထုတ်လွှင့်

podcasts, ရေဒီယို, နှင့်ပရော်ဖက်ရှင်နယ်ထုတ်လွှင့်မှုများအတွက်သင့်လျော်သောစတူဒီယို-အရည်အသွေး output ကို။

Custom Brand အသံ

ထူးခြားသော Branded TTS အသံကိုဖန်တီးရန်သင်၏ကိုယ်ပိုင်အသံနှင့်အတူဤအသံစတိုင်ကို clone လုပ်ပါ။

ပိုမို GPT-SoVITS အသံများ

အလားတူ TTS ပုံစံမှ အခြားအသံများ

English Default

အင်္ဂလိပ် Neutral

Japanese Default

ဂျပန် Neutral

Korean Default

ကိုရီးယား Neutral

မေးလေ့ရှိသောမေးခွန်းများ

GPT-SoVITS သည် SoVITS (ဘာသာပြန်ခြင်းနှင့်ပေါင်းစပ်ခြင်းမှတဆင့်သီချင်းဆိုခြင်း) နှင့်အတူ GPT-style ဘာသာစကားပုံစံများကိုပေါင်းစပ်သည်။ စွမ်းအားရှိသောအနည်းငယ်-ရိုက်ချက်အသံဖမ်းယူမှုအတွက်ဖြစ်သည်။ 5စက္ကန့်သာကြာသော reference audio ဖြင့်၎င်းသည်အသံကိုတိကျစွာဖမ်းယူနိုင်ပြီးပြောဆိုသူ၏ထူးခြားသောလက္ခဏာများကိုထိန်းသိမ်းထားသည့်အကြားအသံသစ်ကိုထုတ်လုပ်နိုင်သည်။ ၎င်းသည်စကားပြောခြင်းနှင့်သီချင်းဆိုခြင်းအသံဖမ်းယူမှုနှစ်ခုစလုံးတွင်ထူးချွန်သည်။

GPT-SoVITS ကို RVC-Boss မှ ထုတ်လုပ်ခဲ့ပြီး MIT လိုင်စင်အောက်တွင် ထုတ်ဝေထားသည်။

GPT-SoVITS ထောက်ခံ4ဘာသာစကားများ: အင်္ဂလိပ်, တရုတ်, ဂျပန်, ကိုရီးယား.

GPT-SoVITS ၏စတိုင်တန်းတွင်ဖြစ်ပါသည် —2တစ်ဦးချင်းစီကိုခရက်ဒစ် 1,000 စာလုံးများ. သင်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီအခမဲ့အဘို့အမည်သည့် GPT-SoVITS အသံကို preview လုပ်နိုင်ပါတယ်.

GPT-SoVITS သည်နှေးသည် (အရည်အသွေးကို ဦး စားပေး) generation မြန်နှုန်းရှိသည်။ မျိုးဆက်တစ်မျိုးဆက်လျှင်ပိုကြာသော်လည်းမြင့်မားသောယုံကြည်စိတ်ချရမှု output ကိုထုတ်လုပ်သည်။

GPT-Sovits အပေါ်အသံအရည်အသွေးအတွက် TTS.ai အပေါ် rating 5/5 ဖြစ်ပါတယ်။ ဒါဟာစတူဒီယို-အဆင့်, လူသား-like စကားပြောပေးပို့.

ဟုတ်ကဲ့, GPT-SoVITS Zero-shot အသံ clone ကိုထောက်ခံ. တစ်ဦး custom အသံဖန်တီးရန်အညွှန်းအသံ၏ Upload 5-30 စက္ကန့်.

ဟုတ်ကဲ့, GPT-SoVITS အသံ clone, သီချင်းဆို synthesizing, အကြောင်းအရာဖန်တီးသူအသံတုံ့ပြန်မှုများအတွက်အထူးအကြံပြုထားသည်။ ၎င်း၏5စက္ကန့် clone, သီချင်းဆိုအသံ, အနည်းငယ်-ရိုက်ချက်သင်ယူမှုစွမ်းရည်သည်ဤအသုံးပြုမှုအတွက်ကောင်းမွန်သောရွေးချယ်မှုဖြစ်စေသည်။

ဟုတ်ကဲ့, GPT-SoVITS MIT ၏အောက်တွင်လိုင်စင်ရ, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြုသော. GPT-SoVITS အသံများနှင့်အတူထုတ်လုပ်သောအသံဗီဒီယိုများတွင်အသုံးပြုနိုင်သည်, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများ.

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

စမ်းကြည့်ပါ Default အခု

မည်သည့်စာသားကိုမဆို ရိုက်နှိပ်ပြီး ၎င်းကိုပြောဆိုသည်ကို ကြားရမည် Default. အသုံးပြုရန်အခမဲ့.