VITS

Default

လွတ်လပ်မှု အင်္ဂလိပ် Neutral VITS

Default သည် VITS စာသားမှစကားပြောသည့် ပုံစံဖြင့် စွမ်းဆောင်ထားသော neutral AI အသံဖြစ်သည်။ ဤ အလွှာ အသံသည် အင်္ဂလိပ် ကိုပြောဆိုပြီး ကောင်းတယ်-အရည်အသွေးရှိသော စကားပြောပေါင်းစပ်မှုကို ပေးပို့သည်။ ချက်ချင်း generation အမြန်နှုန်းနှင့် 3 /5၏အရည်အသွေး rating ဖြင့် Default သည် general-purpose text-to-speech with natural prosody အတွက်သင့်လျော်သည်။ VITS အင်ဂျင်ကို Jaehyeon Kim et al. under the MIT license မှ ဖွံ့ဖြိုးစေပြီး စီးပွားရေးလုပ်ငန်းအတွက် လုံခြုံစေသည်။ အဓိကစွမ်းဆောင်ရည်များပါဝင်သည်: end-to-end synthesis, natural prosody, fast inference, multiple speakers ။

စံသတ်မှတ်ချက်မရှိ

VITSမော်ဒယ်အချက်အလက်များ

မော်ဒယ် VITS
ဖန်တီးသူ Jaehyeon Kim et al.
အရည်အသွေး
အမြန်နှုန်း မြန်နှုန်းမြင့်
လိုင်စင် MIT
ကူးယူခြင်း မရနိုင်ပါ
အမျိုးအစား လွတ်လပ်သော (အက္ခရာများအသုံးပြုခြင်းမရှိ)
သတ်မှတ်ချက်များ 25M
ဗိသုကာပညာ VAE + Normalizing Flows + GAN
လေ့ကျင့်ရေး အချက်အလက်များ 585 နာရီ
နှစ် 2021

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Default

ဤအသံ၏ ဂုဏ်သတ္တိများအပေါ် အခြေခံ၍ အကြံပြုထားသော အပလီကေးရှင်းများ

အသံစာအုပ်များ & ပြောပြချက်

သဘာဝ prosody နှင့် expression များဖြင့်ရှည်လျားသောပုံစံအကြောင်းအရာများကိုပြောပြရန် Default ကိုအသုံးပြုပါ။

ရုပ်သံ အသံသွင်း

YouTube ဗီဒီယိုများ, ကြော်ငြာများ, နှင့်လူမှုမီဒီယာအကြောင်းအရာများအတွက်ပရော်ဖက်ရှင်နယ်ပြောဆိုမှုထည့်သွင်းပါ။

အက်ပလီကေးရှင်းများနှင့် အသုံးပြုနိုင်မှု

မြန်ဆန်သောမျိုးဆက်သည်ဤအသံကိုလက်တွေ့အချိန် app များ၊ မျက်နှာပြင်ဖတ်သူများနှင့်အသုံးပြုနိုင်သောကိရိယာများအတွက်အလွန်သင့်လျော်စေသည်။

E-သင်ယူမှုနှင့်လေ့ကျင့်ရေး

ရှင်းလင်း AI ပြောပြချက်နှင့်အတူအပြန်အလှန်လေ့ကျင့်ရေးပစ္စည်းများ, သင်တန်းများ, နှင့်ပညာရေးဆိုင်ရာအကြောင်းအရာဖန်တီးပါ။

ပိုမို VITS အသံများ

အလားတူ TTS ပုံစံမှ အခြားအသံများ

Baker (Chinese)

တရုတ် Neutral

မေးလေ့ရှိသောမေးခွန်းများ

VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော

VITS ကို Jaehyeon Kim et al. က ဖွံ့ဖြိုးစေခဲ့ပြီး ထုတ်လုပ်ထားသော အသံကို စီးပွားရေး အသုံးပြုခွင့်ပေးသည့် MIT လိုင်စင်အောက်တွင် ထုတ်ဝေထားသည်။

VITS ထောက်ခံ4ဘာသာစကားများ: အင်္ဂလိပ်, တရုတ်, ဂျပန်, ကိုရီးယား.

VITS ၏အခမဲ့အဆင့်မှာဖြစ်ပါတယ် — အခမဲ့ — လိုအပ်သောမရှိသောခရက်ဒစ်. သင်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီအခမဲ့အဘို့အဘယ်သူမျှမ VITS အသံကို preview လုပ်နိုင်ပါတယ်.

VITS အလွန်မြန်ဆန်သောမျိုးဆက်အမြန်နှုန်းရှိပါတယ်. ဒါဟာ streaming နှင့်အပြန်အလှန် applications များများအတွက်သင့်လျော်စေခြင်းငှါ, အနီးရှိလက်တွေ့အချိန်တွင် run သည်။

VITS TTS.ai အပေါ်အသံအရည်အသွေးအတွက် 3/5 သတ်မှတ်ထားသည်။ အများစု application များအတွက်သင့်လျော်သောကောင်းမွန်သောအရည်အသွေးရှိသောစကားပြောကိုပေးသည်။

VITS သည် built-in အသံများဖြင့် တည်ငြိမ်သော set ကို အသုံးပြုသည်။ အသံဖမ်းယူခြင်းအတွက် CosyVoice 2, GPT-SoVITS, or Chatterbox ကဲ့သို့သော ပုံစံများကို အသုံးပြုပါ။

ဟုတ်ကဲ့, VITS သဘာဝ prosody နှင့်အတူယေဘုယျရည်ရွယ်ချက်စာသား-to-စကားပြောများအတွက်အထူးအကြံပြုထားသည်။ ၎င်း၏ end-to-end ပေါင်းစပ်, သဘာဝ prosody, အမြန်ဆုံးအယူအဆစွမ်းရည်များဤအသုံးပြုမှုအတွက်ကောင်းမွန်သောရွေးချယ်မှုဖြစ်စေသည်။

ဟုတ်ကဲ့, VITS MIT ၏အောက်တွင်လိုင်စင်ရ, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. VITS အသံများနှင့်အတူထုတ်လုပ်သောအသံဗီဒီယိုများတွင်အသုံးပြုနိုင်သည်, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများ.

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

စမ်းကြည့်ပါ Default အခု

မည်သည့်စာသားကိုမဆို ရိုက်နှိပ်ပြီး ၎င်းကိုပြောဆိုသည်ကို ကြားရမည် Default. အသုံးပြုရန်အခမဲ့ အက္ခရာများ မလိုအပ်ပါ.