Dia 2

Default

စံ အင်္ဂလိပ် Neutral Dia 2

Default သည် Dia 2 စာသားမှစကားပြောသည့် ပုံစံဖြင့် စွမ်းဆောင်ထားသော neutral AI အသံဖြစ်သည်။ ဤ စံအဆင့် အသံသည် အင်္ဂလိပ် ကိုပြောဆိုပြီး မြင့်မား-အရည်အသွေးရှိသော စကားပြောပေါင်းစပ်မှုကို ပေးပို့သည်။ ချက်ချင်း generation အမြန်နှုန်းနှင့် 4 /5၏အရည်အသွေး rating ဖြင့် Default သည် real-time voice agents, dialogue generation, streaming applications အတွက်သင့်လျော်သည်။ Dia 2 အင်ဂျင်ကို Nari Labs under the Apache 2.0 license မှ ဖွံ့ဖြိုးစေပြီး စီးပွားရေးလုပ်ငန်းအတွက် လုံခြုံစေသည်။ အဓိကစွမ်းဆောင်ရည်များပါဝင်သည်: streaming output, multi-speaker, low latency, paralinguistic cues, up to 2 min output ။

စံသတ်မှတ်ချက်မရှိ

Dia 2မော်ဒယ်အချက်အလက်များ

မော်ဒယ် Dia 2
ဖန်တီးသူ Nari Labs
အရည်အသွေး
အမြန်နှုန်း မြန်နှုန်းမြင့်
လိုင်စင် Apache 2.0
ကူးယူခြင်း မရနိုင်ပါ
အမျိုးအစား စံ (2x အက္ခရာများ)
သတ်မှတ်ချက်များ 2B
ဗိသုကာပညာ Streaming Transformer
နှစ် 2025

များအတွက်အကောင်းဆုံးအသုံးပြုမှုကဏ္ဍများ Default

ဤအသံ၏ ဂုဏ်သတ္တိများအပေါ် အခြေခံ၍ အကြံပြုထားသော အပလီကေးရှင်းများ

အသံစာအုပ်များ & ပြောပြချက်

သဘာဝ prosody နှင့် expression များဖြင့်ရှည်လျားသောပုံစံအကြောင်းအရာများကိုပြောပြရန် Default ကိုအသုံးပြုပါ။

ရုပ်သံ အသံသွင်း

YouTube ဗီဒီယိုများ, ကြော်ငြာများ, နှင့်လူမှုမီဒီယာအကြောင်းအရာများအတွက်ပရော်ဖက်ရှင်နယ်ပြောဆိုမှုထည့်သွင်းပါ။

အက်ပလီကေးရှင်းများနှင့် အသုံးပြုနိုင်မှု

မြန်ဆန်သောမျိုးဆက်သည်ဤအသံကိုလက်တွေ့အချိန် app များ၊ မျက်နှာပြင်ဖတ်သူများနှင့်အသုံးပြုနိုင်သောကိရိယာများအတွက်အလွန်သင့်လျော်စေသည်။

E-သင်ယူမှုနှင့်လေ့ကျင့်ရေး

ရှင်းလင်း AI ပြောပြချက်နှင့်အတူအပြန်အလှန်လေ့ကျင့်ရေးပစ္စည်းများ, သင်တန်းများ, နှင့်ပညာရေးဆိုင်ရာအကြောင်းအရာဖန်တီးပါ။

မေးလေ့ရှိသောမေးခွန်းများ

Nari Labs ရဲ့ Dia2 ဟာ 1B နဲ့ 2B parameter variants တွေမှာရရှိနိုင်တဲ့ Dia ရဲ့ streaming-first upgrade တစ်ခုဖြစ်ပါတယ်။ ဒါဟာ ပထမဆုံး tokens အနည်းငယ်ကနေ audio ကို synthesizing စတင်ပါတယ်။ ဒါဟာ အစစ်အမှန်အချိန် voice agents တွေနဲ့ speech-to-speech pipelines များအတွက် အသင့်တော်ဆုံးဖြစ်စေပါတယ်။ [S1]/[S2] tags နဲ့ paralinguistic cues တွေနဲ့ multi-speaker dialogue ကို support လုပ်ပါတယ်။ (ရယ်သံများ), (ချောင်းဆိုးသံ)

Dia2ကို Nari Labs မှ ထုတ်လုပ်ခဲ့ပြီး Apache 2.0 လိုင်စင်ဖြင့် ထုတ်ဝေထားသည်။

Dia2supports 1 ဘာသာစကား: အင်္ဂလိပ်.

Dia2Standard tier တွင်ဖြစ်သည် —2credits per 1,000 characters. သင်မည်သည့် Dia2အသံကိုအခမဲ့အတွက်အပြည့်အဝအသံထုတ်လုပ်မတိုင်မီ preview လုပ်နိုင်သည်။

Dia2အလွန်မြန်ဆန်သောမျိုးဆက်အမြန်နှုန်းရှိပါတယ်. ဒါဟာ streaming နှင့်အပြန်အလှန် applications များများအတွက်သင့်လျော်စေခြင်းငှါ, အနီးရှိလက်တွေ့အချိန်တွင် run သည်။

Dia2TTS.ai အပေါ်အသံအရည်အသွေးအတွက် 4/5 သတ်မှတ်ထားသည်။ ၎င်းသည်အရည်အသွေးမြင့်ထုတ်လုပ်သည်၊ သဘာဝအသံထွက်စကားပြောဆိုမှု။

ဟုတ်ကဲ့, Dia2 built-in အသံများ၏ခိုင်မာတဲ့စုဆောင်းအသုံးပြုသည်။ အသံကို clone အတွက်, CosyVoice ကဲ့သို့မော်ဒယ်များကြိုးစားပါ2, GPT-SoVITS, သို့မဟုတ် Chatterbox.

ဟုတ်ကဲ့, Dia2အမှန်တကယ်အချိန်အသံအရာရှိများ, စကားပြောမျိုးဆက်, streaming applications များများအတွက်အထူးအကြံပြုထားသည်။ ၎င်း၏ streaming output ကို, multi-speaker, အနည်းငယ် latency စွမ်းဆောင်ရည်ကဤအသုံးပြုမှုအတွက်ကောင်းမွန်သောရွေးချယ်မှုဖြစ်စေသည်။

ဟုတ်ကဲ့, Dia2Apache 2.0 အောက်တွင်လိုင်စင်ရ, စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. Dia2အသံများနှင့်အတူထုတ်လုပ်သောအသံဗီဒီယိုများတွင်အသုံးပြုနိုင်သည်, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်းစီမံကိန်းများ.

ဟုတ်ကဲ့, အပေါ်အားလုံးအသံများ TTS.ai စီးပွားရေးလုပ်ငန်းလိုင်စင်ရ open-source မော်ဒယ်များအသုံးပြုခြင်း (MIT, Apache 2.0). ထုတ်လုပ်အသံဗီဒီယိုများ, podcasts, apps များ, ဂိမ်းများ, နှင့်အခြားစီးပွားရေးလုပ်ငန်း application များအသုံးပြုရန်သင့်ရဲ့ဖြစ်ပါသည်.

ပုံစံအမည်နှင့်အသံ ID ကိုနှင့်အတူ /api/v1/tts/ သို့ POST ကိုတောင်းဆိုချက်ကိုပို့ပါ။ Python, JavaScript, Go, နှင့် cURL တွင်ကုဒ်ဥပမာများအတွက်ကျွန်ုပ်တို့၏ API မှတ်တမ်းစာမျက်နှာကိုကြည့်ပါ။

ဟုတ်ကဲ့, နမူနာတစ်ခုကိုကြားရန်ဤစာမျက်နှာပေါ်တွင် play button ကိုနှိပ်ပါ. သင်သည်လည်းစကားပြောစာသားစာမျက်နှာပေါ်တွင် custom text ကိုရိုက်ထည့်နိုင်ပြီးမည်သည့်အသံနှင့်အတူအခမဲ့ preview ကို generate.

စမ်းကြည့်ပါ Default အခု

မည်သည့်စာသားကိုမဆို ရိုက်နှိပ်ပြီး ၎င်းကိုပြောဆိုသည်ကို ကြားရမည် Default. အသုံးပြုရန်အခမဲ့.