VITS

Baker (Chinese)

လွတ်လပ်မှု တရုတ် Neutral VITS

Baker (Chinese) သည် VITS စာသားမှစကားပြောသည့် ပုံစံဖြင့် စွမ်းဆောင်ထားသော neutral AI အသံဖြစ်သည်။ ဤ အလွှာ အသံသည် တရုတ် ကိုပြောဆိုပြီး ကောင်းတယ်-အရည်အသွေးရှိသော စကားပြောပေါင်းစပ်မှုကို ပေးပို့သည်။ ချက်ချင်း generation အမြန်နှုန်းနှင့် 3 /5၏အရည်အသွေး rating ဖြင့် Baker (Chinese) သည် general-purpose text-to-speech with natural prosody အတွက်သင့်လျော်သည်။ VITS အင်ဂျင်ကို Jaehyeon Kim et al. under the MIT license မှ ဖွံ့ဖြိုးစေပြီး စီးပွားရေးလုပ်ငန်းအတွက် လုံခြုံစေသည်။ အဓိကစွမ်းဆောင်ရည်များပါဝင်သည်: end-to-end synthesis, natural prosody, fast inference, multiple speakers ။

စံသတ်မှတ်ချက်မရှိ

VITSမော်ဒယ်အချက်အလက်များ

မော်ဒယ် VITS
ဖန်တီးသူ Jaehyeon Kim et al.
အရည်အသွေး
အမြန်နှုန်း မြန်နှုန်းမြင့်
လိုင်စင် MIT
ကူးယူခြင်း မရနိုင်ပါ
အမျိုးအစား လွတ်လပ်သော (အက္ခရာများအသုံးပြုခြင်းမရှိ)
သတ်မှတ်ချက်များ 25M
ဗိသုကာပညာ VAE + Normalizing Flows + GAN
လေ့ကျင့်ရေး အချက်အလက်များ 585 နာရီ
နှစ် 2021

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Baker (Chinese)

ဤအသံ၏ ဂုဏ်သတ္တိများအပေါ် အခြေခံ၍ အကြံပြုထားသော အပလီကေးရှင်းများ

အသံစာအုပ်များ & ပြောပြချက်

သဘာဝ prosody နှင့် expression များဖြင့်ရှည်လျားသောပုံစံအကြောင်းအရာများကိုပြောပြရန် Baker (Chinese) ကိုအသုံးပြုပါ။

ရုပ်သံ အသံသွင်း

YouTube ဗီဒီယိုများ, ကြော်ငြာများ, နှင့်လူမှုမီဒီယာအကြောင်းအရာများအတွက်ပရော်ဖက်ရှင်နယ်ပြောဆိုမှုထည့်သွင်းပါ။

အက်ပလီကေးရှင်းများနှင့် အသုံးပြုနိုင်မှု

မြန်ဆန်သောမျိုးဆက်သည်ဤအသံကိုလက်တွေ့အချိန် app များ၊ မျက်နှာပြင်ဖတ်သူများနှင့်အသုံးပြုနိုင်သောကိရိယာများအတွက်အလွန်သင့်လျော်စေသည်။

E-သင်ယူမှုနှင့်လေ့ကျင့်ရေး

ရှင်းလင်း AI ပြောပြချက်နှင့်အတူအပြန်အလှန်လေ့ကျင့်ရေးပစ္စည်းများ, သင်တန်းများ, နှင့်ပညာရေးဆိုင်ရာအကြောင်းအရာဖန်တီးပါ။

ပိုမို VITS အသံများ

အလားတူ TTS ပုံစံမှ အခြားအသံများ

Default

အင်္ဂလိပ် Neutral

မေးလေ့ရှိသောမေးခွန်းများ

VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော

VITS ကို Jaehyeon Kim et al. က ဖွံ့ဖြိုးစေခဲ့ပြီး ထုတ်လုပ်ထားသော အသံကို စီးပွားရေး အသုံးပြုခွင့်ပေးသည့် MIT လိုင်စင်အောက်တွင် ထုတ်ဝေထားသည်။

VITS ထောက်ခံ4ဘာသာစကားများ: အင်္ဂလိပ်, တရုတ်, ဂျပန်, ကိုရီးယား.

VITS ၏အခမဲ့အဆင့်မှာဖြစ်ပါတယ် — အခမဲ့ — လိုအပ်သောမရှိသောခရက်ဒစ်. သင်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီအခမဲ့အဘို့အဘယ်သူမျှမ VITS အသံကို preview လုပ်နိုင်ပါတယ်.

VITS အလွန်မြန်ဆန်သောမျိုးဆက်အမြန်နှုန်းရှိပါတယ်. ဒါဟာ streaming နှင့်အပြန်အလှန် applications များများအတွက်သင့်လျော်စေခြင်းငှါ, အနီးရှိလက်တွေ့အချိန်တွင် run သည်။

VITS TTS.ai အပေါ်အသံအရည်အသွေးအတွက် 3/5 သတ်မှတ်ထားသည်။ အများစု application များအတွက်သင့်လျော်သောကောင်းမွန်သောအရည်အသွေးရှိသောစကားပြောကိုပေးသည်။

VITS သည် built-in အသံများဖြင့် တည်ငြိမ်သော set ကို အသုံးပြုသည်။ အသံဖမ်းယူခြင်းအတွက် CosyVoice 2, GPT-SoVITS, or Chatterbox ကဲ့သို့သော ပုံစံများကို အသုံးပြုပါ။

ဟုတ်ကဲ့, VITS သဘာဝ prosody နှင့်အတူယေဘုယျရည်ရွယ်ချက်စာသား-to-စကားပြောများအတွက်အထူးအကြံပြုထားသည်။ ၎င်း၏ end-to-end ပေါင်းစပ်, သဘာဝ prosody, အမြန်ဆုံးအယူအဆစွမ်းရည်များဤအသုံးပြုမှုအတွက်ကောင်းမွန်သောရွေးချယ်မှုဖြစ်စေသည်။

ဟုတ်ကဲ့, VITS MIT ၏အောက်တွင်လိုင်စင်ရ, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. VITS အသံများနှင့်အတူထုတ်လုပ်သောအသံဗီဒီယိုများတွင်အသုံးပြုနိုင်သည်, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများ.

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

စမ်းကြည့်ပါ Baker (Chinese) အခု

မည်သည့်စာသားကိုမဆို ရိုက်နှိပ်ပြီး ၎င်းကိုပြောဆိုသည်ကို ကြားရမည် Baker (Chinese). အသုံးပြုရန်အခမဲ့ အက္ခရာများ မလိုအပ်ပါ.