စကားပြောမှစကားပြော

ပြောင်းလဲပြောဆိုအသံ - အသံ, ခံစားချက်, ဘာသာစကား, နှင့်မူရင်းအကြောင်းအရာကိုထိန်းသိမ်းထားစဉ်စတိုင်ပြောင်းလဲ။

ကျွန်တော်တို့ဟာသင့်ရဲ့ဘာသာစကားအတွက် TTS အသံတွေမရှိသေးပါဘူး. ကျွန်တော်တို့ကိုသင့်ရဲ့ add ကူညီပါ! သင့်အသံကိုရောင်း

အသံရင်းမြစ်

ဖိုင်ကိုဒီနေရာသို့ဆွဲချပါ၊ သို့မဟုတ် ရှာဖွေ

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— ဒါမှမဟုတ်သင့် အသံကို မှတ်တမ်းတင်ပါ —
00:00

ပြောင်းလဲမှု သတ်မှတ်ချက်များ

ဖိုင်ကိုဒီနေရာသို့ဆွဲချပါ၊ သို့မဟုတ် ရှာဖွေ

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

ရလဒ်

ဘာသာစကားအသံကို Upload, သင်၏ပြောင်းလဲမှုရွေးချယ်, နှင့်စတင်ရန်ပြောင်းလဲပစ်ကိုကလစ်နှိပ်ပါ

စကားပြောခြင်းကို ပြောင်းလဲနေသည်... နည်းနည်းကြာနိုင်သည်

မူရင်း

အသွင်ပြောင်းချက်

အလုပ်လုပ်ပုံ

1. တင်သွင်းစကားပြော

ပြောင်းလဲလိုသော အသံဖိုင်ကို မှတ်တမ်းတင်ပါ

2. ပြောင်းပြန်ရွေးပါ

အသံပြောင်းခြင်း၊ ပုံစံပြောင်းခြင်း၊ ဘာသာစကားပြောင်းခြင်းကို ရွေးချယ်ပါ

3. AI ပြောင်းလဲ

AI processes audio end-to-end စကားပြောအကြောင်းအရာကိုထိန်းသိမ်း

4. ဒေါင်းလုပ်

ရလဒ်ကိုနားထောင်ပြီးပြောင်းလဲထားသောအသံဖိုင်ကိုဒေါင်းလုပ်လုပ်ပါ

အသုံးပြုမှု

အကြောင်းအရာများ၊ အသုံးပြုနိုင်မှုနှင့် ဖန်တီးမှုဆိုင်ရာ ပရောဂျက်များအတွက် စကားပြောမှစကားပြော

ရုပ်သံ ကူးယူခြင်း

မူရင်းပြောသူ၏ အသံလက္ခဏာများကို ထိန်းသိမ်းထားစဉ် အခြားဘာသာစကားများသို့ ဗီဒီယိုများကို ကူးယူပါ။

ခံစားမှု ချိန်ညှိခြင်း

မှတ်တမ်းတင်မှု၏စိတ်ခံစားမှုအသံကိုပြောင်းလဲပါ - ငြိမ်သက်သောစကားပြောခြင်းကိုစိတ်လှုပ်ရှားစေပါ၊ သို့မဟုတ် ငြိမ်းချမ်းသောစကားပြောခြင်းကို နွေးထွေးပြီး ဖော်ရွေစေပါ။

အသံလွှင့်ထုတ်လုပ်မှု

အသံအမျိုးမျိုးနှင့်စတိုင်များဖြင့်အသံမှတ်တမ်းများကိုအလှဆင်ထားသော voiceovers များသို့ပြောင်းလဲပါ။

အသံအမည်မဲ့

လျှို့ဝှက်သတင်းပေးခြင်း သို့မဟုတ် သီးသန့်လုံခြုံရေးအတွက် စကားလုံးတိုင်းကို ထိန်းသိမ်းထားစဉ် စကားပြောသူ၏ ကိုယ်ရေးအချက်အလက်ကို ဖုံးကွယ်ပါ။

စကားပြောမှစကားပြောမော်ဒယ်များ

OpenVoice

granular စတိုင်ထိန်းချုပ်မှုနှင့်အတူမြန်ဆန်တဲ့ voice conversion ကို။ voice အမည်, အမြန်နှုန်းကိုပြောင်းလဲ, နှင့်စက္ကန့်အတွင်းစိတ်ခံစားမှု။

  • မြန်နှုန်းမြင့်စီမံခန့်ခွဲမှု
  • ပုံစံ လွှဲပြောင်းခြင်း
  • ဘာသာစကားပေါင်းစုံ

Chatterbox

Resemble AI မှ fine-grained စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ Zero-shot အသံ cloning ။

  • စိတ်ခံစားမှု ထိန်းချုပ်မှု
  • Zero-shot ကူးယူခြင်း
  • အရည်အသွေးမြင့်

CosyVoice 2

သဘာဝ prosody နှင့် streaming ထောက်ခံမှုနှင့်အတူ 8 ဘာသာစကားများအကြား Cross-ဘာသာစကားအသံ cloning ။

  • 8 ဘာသာစကားများ
  • အသံခိုးယူခြင်း
  • စီးဆင်းမှု

မေးလေ့ရှိသောမေးခွန်းများ

Speech to speech (STS) AI သည် ဘာသာစကားတစ်ခုမှ အခြားဘာသာစကားတစ်ခုသို့ ပြောင်းလဲ ပေးနိုင်သည်။ အသံ၊ ပုံစံ၊ စိတ်ခံစားမှု၊ ဘာသာစကား ပြောင်းလဲပေးခြင်းဖြင့် မူရင်းစကားလုံးများနှင့် အချိန်ကို ထိန်းသိမ်းပေးနိုင်သည်။

စကားပြောရန်စာသားသည်စာသားကိုအသံသို့ပြောင်းလဲသည်။ စကားပြောရန်စကားပြောသည်အသံကို input အဖြစ်ရှိပြီးသားအသံကိုယူပြီးအသစ်သောအသံသို့တိုက်ရိုက်ပြောင်းလဲသည်။ သဘာဝအသံစဉ်ကိုထိန်းသိမ်းခြင်း၊ ရပ်တန့်ခြင်း၊ အဓိကထားခြင်းနှင့်မူရင်းမှတ်တမ်းတင်ခြင်း၏စိတ်ခံစားမှုသည်စာသားမှစကားပြောခြင်းထက်ပိုမိုကောင်းမွန်သည်။

အများအားဖြင့် အသုံးပြုလေ့ရှိသော အသုံးအနှုန်းများမှာ ဗီဒီယိုများကို အခြားဘာသာစကားများသို့ ဘာသာပြန်ဆိုခြင်း၊ မှတ်တမ်းတင်ခြင်းတွင် ဟောပြောသူ၏ အသံကို ပြောင်းလဲခြင်း၊ ရှိနေပြီးသား အသံ၏ ခံစားချက် သို့မဟုတ် အသံနူးညံ့မှုကို ချိန်ညှိခြင်း၊ မှတ်တမ်းတင်ခြင်းမှ အသံဖမ်းခြင်းကို ဖန်တီးခြင်းနှင့် အကြောင်းအရာကို ထိန်းသိမ်းထားစဉ် အသံဖမ်းခြင်းကို အမည်မဲ့ ပြုလုပ်ခြင်းတို့ ဖြစ်သည်။

OpenVoice နှင့် RVC ကဲ့သို့သောအသံပြောင်းလဲမှုမော်ဒယ်များသည်အသံမှအသံသို့ပြောင်းလဲခြင်းကိုကိုင်တွယ်နိုင်သည်။ စကားပြောမှစကားပြောရန် Cross-language speech အတွက် CosyVoice2နှင့် GPT-SoVITS တို့သည်ကွဲပြားသောဘာသာစကားတစ်ခုတွင် clone နှင့် re-synthesize နိုင်သည်။ Chatterbox သည် reference-audio-based synthesis ကိုပါထောက်ပံ့သည်။

ဟုတ်ကဲ့. အသံ clone မော်ဒယ်များအသုံးပြုခြင်း, သင်သည်သင်၏ကိုယ်ပိုင်အသံလက္ခဏာများကိုထိန်းသိမ်းထားစဉ်ကွဲပြားခြားနားသောဘာသာစကားသို့သင်၏စကားပြောပြောင်းလဲနိုင်ပါတယ်. အဆိုပါ AI ကိုသင်၏အသံအမည်ကို extracts နှင့်ရည်မှန်းချက်ဘာသာစကားသို့မဟုတ်စတိုင်၌အသံကို re-synthesizes.

ဤသည်ပိုက်လိုင်းပထမဦးဆုံးသင်၏စကားပြော transcribes, ရည်မှန်းချက်ဘာသာစကားသို့စာသားကိုဘာသာပြန်ဆို, ထို့နောက်သင်၏မူရင်းအသံထဲမှာဘာသာပြန်စာသားကို synthesize ရန်အသံ cloning ကိုအသုံးပြု. CosyVoice ကဲ့သို့သောမော်ဒယ်များ2cross-ဘာသာစကား synthesis အတွက် 8 ဘာသာစကားများထောက်ခံ.

MP3, OGG, M4A, နှင့် WEBM လည်းလက်ခံကြသည်. ရှင်းရှင်းလင်းလင်းစကားပြောဆိုမှုအများဆုံးတိကျတဲ့ပြောင်းလဲမှုထုတ်လုပ်.

နီးနီးကပ်ကပ်-real-time processing ကိုကျွန်တော်တို့ရဲ့ API ကိုအသုံးပြုခြင်းအားဖြင့်ရရှိနိုင်သည် Kokoro ကဲ့သို့သောအမြန်မော်ဒယ်များ synthesization အတွက်နှင့်အသိအမှတ်ပြုမှုအတွက် Faster Whisper. Latency ပုံစံနှင့်အသံအရှည်ပေါ်တွင်မူတည်သည်, ဒါပေမယ့်အောက်-3-စက္ကန့် turn-arounds အတိုပြောဆိုချက်များအတွက်ရရှိနိုင်ဖြစ်ကြသည်။

ဟုတ်ကဲ့. Chatterbox ကဲ့သို့သောမော်ဒယ်များ, Spark TTS, နှင့် IndexTTS-2 စိတ်ခံစားမှုနှင့်စတိုင်ထိန်းချုပ်မှုထောက်ခံ. သငျသညျအလားတူစကားလုံးများနှင့်ပြောဆိုသူကိုယ်ပိုင်အမည်ကိုထိန်းသိမ်းထားစဉ်ပျော်ရွှင်ပျော်ရွှင်, ပျော်ရွှင်ပျော်ရွှင်, သို့မဟုတ်ဇာတ်လမ်းတွဲထဲသို့ငြိမ်သက်စကားပြောပြောင်းလဲနိုင်သည်.

စကားပြောစကားပြောအသိအမှတ်ပြုခြင်းနှင့်ပေါင်းစပ်စာလုံးများ။ တစ်ဦးပုံမှန် 1-မိနစ်ပြောင်းလဲမှုရွေးချယ်ထားသောမော်ဒယ်ပေါ် မူတည်. 3,000-8,000 စာလုံးများကိုအသုံးပြုသည်။ Kokoro ကဲ့သို့သောအခမဲ့-tier မော်ဒယ်များ Zero ကုန်ကျစရိတ်တွင်ပေါင်းစပ်ခြေလှမ်းများအတွက်အသုံးပြုနိုင်သည်။

အခမဲ့အသုံးပြုသူများသည် 1 မိနစ်အထိအသံကိုစီမံခန့်ခွဲနိုင်သည်. ပေးဆောင်အစီအစဉ်များ 10 မိနစ်အထိဖိုင်များကိုထောက်ခံသည်. ပိုမိုကြာရှည်မှတ်တမ်းတင်မှုများအတွက်, အပိုင်းပိုင်းသို့အသံ split သို့မဟုတ်အရှည်ကန့်သတ်ချက်မရှိဘဲ batch စီမံခန့်ခွဲမှုအတွက်ကျွန်တော်တို့ရဲ့ API ကိုအသုံးပြု.

ဟုတ်ကဲ့, အားလုံး uploaded audio ကိုကျွန်တော်တို့ရဲ့လုံခြုံ GPU ဆာဗာများပေါ်တွင်စီမံခန့်ခွဲနှင့်အလိုအလျောက်အတွင်းမှဖျက်ပစ် 24 နာရီ. ကျွန်တော်တို့မော်ဒယ်များလေ့ကျင့်သင်ကြားဖို့သင့်ရဲ့ audio ကိုမသုံးပါ. အားလုံးလွှဲပြောင်းမှု encrypted connections ကိုအသုံးပြုပြီး server-to-server ဆက်သွယ်ရေးကိုစစ်ဆေးသည်။
5.0/5 (1)

ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။

AI နှင့်အတူမည်သည့်စကားပြောကိုမဆိုပြောင်းလဲပါ

အသံပြောင်းလဲ, စိတ်ခံစားမှု, ဘာသာစကား, နှင့်စတိုင်. အခမဲ့မှတ်ပုံတင်ပြီးရယူပါ 50 စတင်ရန်ခရက်ဒစ်.