Question 1

VITS TTS ဆိုတာဘာလဲ?

Accepted Answer

VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော

Question 2

VITS ကို ဘယ်သူက ထုတ်လုပ်ခဲ့သလဲ။

Accepted Answer

VITS ကို Jaehyeon Kim et al. က ဖွံ့ဖြိုးစေခဲ့ပြီး ထုတ်လုပ်ထားသော အသံကို စီးပွားရေး အသုံးပြုခွင့်ပေးသည့် MIT လိုင်စင်အောက်တွင် ထုတ်ဝေထားသည်။

Question 3

VITS က မည်သည့်ဘာသာစကားများကို ထောက်ပံ့ပေးသနည်း။

Accepted Answer

VITS ထောက်ခံ4ဘာသာစကားများ: အင်္ဂလိပ်, တရုတ်, ဂျပန်, ကိုရီးယား.

Question 4

VITS အသံများကို အသုံးပြုရန် ကုန်ကျစရိတ်က ဘယ်လောက်လဲ။

Accepted Answer

VITS ၏အခမဲ့အဆင့်မှာဖြစ်ပါတယ် — အခမဲ့ — လိုအပ်သောမရှိသောခရက်ဒစ်. သင်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီအခမဲ့အဘို့အဘယ်သူမျှမ VITS အသံကို preview လုပ်နိုင်ပါတယ်.

Question 5

VITS က စကားပြောခြင်းကို ဘယ်လိုမြန်မြန်ဆန်ဆန်လုပ်နိုင်သလဲ။

Accepted Answer

VITS အလွန်မြန်ဆန်သောမျိုးဆက်အမြန်နှုန်းရှိပါတယ်. ဒါဟာ streaming နှင့်အပြန်အလှန် applications များများအတွက်သင့်လျော်စေခြင်းငှါ, အနီးရှိလက်တွေ့အချိန်တွင် run သည်။

Question 6

VITS ၏ အသံအရည်အသွေးကဘာလဲ။

Accepted Answer

VITS TTS.ai အပေါ်အသံအရည်အသွေးအတွက် 3/5 သတ်မှတ်ထားသည်။ အများစု application များအတွက်သင့်လျော်သောကောင်းမွန်သောအရည်အသွေးရှိသောစကားပြောကိုပေးသည်။

Question 7

VITS ဖြင့် အသံကို ကူးယူနိုင်မလား။

Accepted Answer

VITS သည် built-in အသံများဖြင့် တည်ငြိမ်သော set ကို အသုံးပြုသည်။ အသံဖမ်းယူခြင်းအတွက် CosyVoice 2, GPT-SoVITS, or Chatterbox ကဲ့သို့သော ပုံစံများကို အသုံးပြုပါ။

Question 8

VITS သည် သဘာဝကျသော ဘာသာစကားဖြင့် အများသုံး ရည်ရွယ်ချက်များအတွက် စာသားမှစကားပြောရန် သင့်တော်ပါသလား။

Accepted Answer

ဟုတ်ကဲ့, VITS သဘာဝ prosody နှင့်အတူယေဘုယျရည်ရွယ်ချက်စာသား-to-စကားပြောများအတွက်အထူးအကြံပြုထားသည်။ ၎င်း၏ end-to-end ပေါင်းစပ်, သဘာဝ prosody, အမြန်ဆုံးအယူအဆစွမ်းရည်များဤအသုံးပြုမှုအတွက်ကောင်းမွန်သောရွေးချယ်မှုဖြစ်စေသည်။

Question 9

VITS အသံများကို စီးပွားရေးအတွက် အသုံးပြုနိုင်မလား။

Accepted Answer

ဟုတ်ကဲ့, VITS MIT ၏အောက်တွင်လိုင်စင်ရ, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. VITS အသံများနှင့်အတူထုတ်လုပ်သောအသံဗီဒီယိုများတွင်အသုံးပြုနိုင်သည်, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများ.

Question 10

ဒီအသံကို စီးပွားရေးလုပ်ငန်းများအတွက် သုံးလို့ရလား။

Accepted Answer

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

Question 11

API မှတဆင့် ဒီအသံကို ဘယ်လိုသုံးမလဲ?

Accepted Answer

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

Question 12

ထုတ်လုပ်မည့်အချိန်တွင် အသံကို ကြိုတင်ကြည့်ရှုနိုင်မလား။

Accepted Answer

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

မော်ဒယ်	VITS
ဖန်တီးသူ	Jaehyeon Kim et al.
အရည်အသွေး
အမြန်နှုန်း	မြန်နှုန်းမြင့်
လိုင်စင်	MIT
ကူးယူခြင်း	မရနိုင်ပါ
အမျိုးအစား	လွတ်လပ်သော (အက္ခရာများအသုံးပြုခြင်းမရှိ)
သတ်မှတ်ချက်များ	25M
ဗိသုကာပညာ	VAE + Normalizing Flows + GAN
လေ့ကျင့်ရေး အချက်အလက်များ	585 နာရီ
နှစ်	2021

Baker (Chinese)

မော်ဒယ်အချက်အလက်များ

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Baker (Chinese)

အသံစာအုပ်များ & ပြောပြချက်

ရုပ်သံ အသံသွင်း

အက်ပလီကေးရှင်းများနှင့် အသုံးပြုနိုင်မှု

E-သင်ယူမှုနှင့်လေ့ကျင့်ရေး

ပိုမို VITS အသံများ

Default

မေးလေ့ရှိသောမေးခွန်းများ

စမ်းကြည့်ပါ Baker (Chinese) အခု