VibeVoice

Speaker 1

စံ အင်္ဂလိပ် Neutral VibeVoice

Speaker 1 သည် VibeVoice စာသားမှစကားပြောသည့် ပုံစံဖြင့် စွမ်းဆောင်ထားသော neutral AI အသံဖြစ်သည်။ ဤ စံအဆင့် အသံသည် အင်္ဂလိပ် ကိုပြောဆိုပြီး စတူဒီယို-အရည်အသွေးရှိသော စကားပြောပေါင်းစပ်မှုကို ပေးပို့သည်။ ချက်ချင်း generation အမြန်နှုန်းနှင့် 5 /5၏အရည်အသွေး rating ဖြင့် Speaker 1 သည် podcasts, dialogues, long-form narration, multi-speaker content အတွက်သင့်လျော်သည်။ VibeVoice အင်ဂျင်ကို Microsoft under the MIT license မှ ဖွံ့ဖြိုးစေပြီး စီးပွားရေးလုပ်ငန်းအတွက် လုံခြုံစေသည်။ အဓိကစွမ်းဆောင်ရည်များပါဝင်သည်: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency ။

စံသတ်မှတ်ချက်မရှိ

VibeVoiceမော်ဒယ်အချက်အလက်များ

မော်ဒယ် VibeVoice
ဖန်တီးသူ Microsoft
အရည်အသွေး
အမြန်နှုန်း မြန်နှုန်းမြင့်
လိုင်စင် MIT
ကူးယူခြင်း မရနိုင်ပါ
အမျိုးအစား စံ (2x အက္ခရာများ)
သတ်မှတ်ချက်များ 1.5B
ဗိသုကာပညာ LLM + DAC
လေ့ကျင့်ရေး အချက်အလက်များ 100000 နာရီ
နှစ် 2025

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Speaker 1

ဤအသံ၏ ဂုဏ်သတ္တိများအပေါ် အခြေခံ၍ အကြံပြုထားသော အပလီကေးရှင်းများ

အသံစာအုပ်များ & ပြောပြချက်

သဘာဝ prosody နှင့် expression များဖြင့်ရှည်လျားသောပုံစံအကြောင်းအရာများကိုပြောပြရန် Speaker 1 ကိုအသုံးပြုပါ။

ရုပ်သံ အသံသွင်း

YouTube ဗီဒီယိုများ, ကြော်ငြာများ, နှင့်လူမှုမီဒီယာအကြောင်းအရာများအတွက်ပရော်ဖက်ရှင်နယ်ပြောဆိုမှုထည့်သွင်းပါ။

အက်ပလီကေးရှင်းများနှင့် အသုံးပြုနိုင်မှု

မြန်ဆန်သောမျိုးဆက်သည်ဤအသံကိုလက်တွေ့အချိန် app များ၊ မျက်နှာပြင်ဖတ်သူများနှင့်အသုံးပြုနိုင်သောကိရိယာများအတွက်အလွန်သင့်လျော်စေသည်။

Podcasts & ထုတ်လွှင့်

podcasts, ရေဒီယို, နှင့်ပရော်ဖက်ရှင်နယ်ထုတ်လွှင့်မှုများအတွက်သင့်လျော်သောစတူဒီယို-အရည်အသွေး output ကို။

ပိုမို VibeVoice အသံများ

အလားတူ TTS ပုံစံမှ အခြားအသံများ

Speaker 1 (Chinese)

တရုတ် Neutral

Speaker 2

အင်္ဂလိပ် Neutral

Speaker 2 (Chinese)

တရုတ် Neutral

Speaker 3

အင်္ဂလိပ် Neutral

Speaker 4

အင်္ဂလိပ် Neutral

မေးလေ့ရှိသောမေးခွန်းများ

VibeVoice by Microsoft အားဖြင့်နှစ်ခုကွဲပြားခြားနားသောလာ: အရှည်-ပုံစံအကြောင်းအရာများအတွက် 1.5B ပုံစံ (အထိ 90 မိနစ်,4ပြောဆိုသူ) နှင့် ~ 200ms ပထမဦးဆုံးအသံ latency နှင့်အတူ streaming များအတွက် Realtime 0.5B ပုံစံ. အဆိုပါ 1.5B မျိုးကွဲ podcasts နှင့်အသံစာအုပ်များမှာရှည်လျားသော passages ကျော်ပြောဆိုသူတည်ငြိမ်မှုနှင့်အတူ excels. မှတ်ချက်: Microsoft က repository မှ TTS code ကိုဖယ်ရှားပစ်ပြီးထုတ်လုပ်အသံကြားနိုင် AI တာဝန်ယူမှုငြင်းပယ်မှုများပါဝင်သည်.

VibeVoice ကို Microsoft က ထုတ်လုပ်ခဲ့ပြီး MIT (research-only intent) license ဖြင့် ထုတ်ဝေထားပြီး ထုတ်လုပ်ထားသော အသံများကို စီးပွားရေး လုပ်ငန်းများတွင် အသုံးပြုခွင့်ပြုထားသည်။

VibeVoice supports 1 language: မြန်မာ.

VibeVoice ၏ပရီမီယံအဆင့်တွင်ဖြစ်ပါသည် —4တစ်ဦးချင်းစီကိုခရက်ဒစ် 1,000 စာလုံးများ. သင်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီအခမဲ့အဘို့အမည်သည့် VibeVoice အသံကို preview လုပ်နိုင်ပါတယ်.

VibeVoice သည်အဆင်ပြေသောမျိုးဆက်အမြန်နှုန်းရှိသည်။ မျိုးဆက်သည်ပုံမှန်အားဖြင့်စာသားအရှည်ပေါ် မူတည်၍ စက္ကန့်အနည်းငယ်ကြာသည်။

VibeVoice အပေါ်အသံအရည်အသွေးအတွက် TTS.ai အပေါ် rating 5/5 ဖြစ်ပါတယ်။ ဒါဟာစတူဒီယို-အဆင့်, လူသား-like စကားပြောပေးပို့.

VibeVoice သည် built-in voices များ တည်ငြိမ်စွာ အသုံးပြုနိုင်သည်။ Voice Cloning အတွက် CosyVoice 2, GPT-SoVITS, or Chatterbox ကဲ့သို့သော ပုံစံများကို အသုံးပြုနိုင်သည်။

ဟုတ်ကဲ့, VibeVoice podcasts များအတွက်အထူးအကြံပြုသည်, audiobooks, ရှည်လျားသောပုံစံ multi-speaker အကြောင်းအရာ. ၎င်း၏ multi-speaker, အထိ 90 မိနစ်, podcast မျိုးဆက်စွမ်းရည်ကဤအသုံးပြုမှုအတွက်အလွန်ကောင်းသောရွေးချယ်မှုဖြစ်စေ.

ဟုတ်ကဲ့, VibeVoice MIT ၏အောက်တွင်လိုင်စင်ရ (သုတေသန-သာရည်ရွယ်ချက်), စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. VibeVoice အသံများနှင့်အတူ generated audio ကိုဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများတွင်အသုံးပြုနိုင်သည်။

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

စမ်းကြည့်ပါ Speaker 1 အခု

မည်သည့်စာသားကိုမဆို ရိုက်နှိပ်ပြီး ၎င်းကိုပြောဆိုသည်ကို ကြားရမည် Speaker 1. အသုံးပြုရန်အခမဲ့.