တကယ့်အချိန် TTS
sub-second ပထမဦးဆုံး-audio latency နှင့်အတူစာသား-to-စကားပြော streaming ။ အသံအေးဂျင့်များနှင့်တိုက်ရိုက် application များအတွက်တည်ဆောက်ထားသည်။
စာသား
စီးဆင်းနေသည်အသံ သတ်မှတ်ချက်များ
ဘယ်လို Streaming TTS အလုပ်လုပ်တယ်
1. စာသားပို့
POST ကိုစာသားကို /v1/tts/stream/ အဖြစ် Server-Sent အဖြစ်အပျက်များကိုတောင်းဆို.
2. မော်ဒယ်ထုတ်လုပ်
Kokoro သည် စာသားကို ပိုင်းဖြတ်ပြီး GPU ပေါ်တွင် အသံနမူနာ-တစ်-နမူနာ-တစ်-ကို ထုတ်လုပ်သည်။
3. စီးဆင်းမှုချောင်းများ
Base64-encoded WAV chunks SSE ကျော်ရောက်ရှိနှင့်ချက်ချင်းကစားစတင်.
4. သက်တမ်းတိုးနားထောင်
အသုံးပြုသူတစ်စက္ကန့်အောက်မှာဝါကျ၏အစကိုကြားရ, ပင်ရှည် inputs များအပေါ်.
အသုံးပြုမှု
sub-second latency အတွေ့အကြုံအသစ်များကိုဖွင့်လှစ်သောနေရာ။
အသံဆိုင်ရာ အရာရှိများ
လူသားတစ်ယောက်လို မြန်မြန်ဆန်ဆန်တုံ့ပြန်နိုင်တဲ့ စကားပြော bots တွေ။
ရုပ်သံ ကူးယူခြင်း
ဘာသာပြန်နှင့် buffering ရပ်နားခြင်းမရှိဘဲအစစ်အမှန်အချိန်တွင်စီးဆင်းမှု dub ။
ဂိမ်းများ
ကစားသမားရွေးချယ်မှုချက်ချင်းတုံ့ပြန် NPC အပြန်အလှန်ဆွေးနွေးပွဲ, မ pre-rendered VO.
အသုံးပြုနိုင်စွမ်း
အသုံးပြုသူတစ်ဦးကလစ်နှိပ်သောအခါစကားပြောစတင်သော screen reader နှင့်ထောက်ပံ့ရေး tools များ။
တကယ့်အချိန် TTS အစီအစဉ်များ
သင်ပိုမိုလိုအပ်တဲ့အခါအခမဲ့စတင်, upgrade
- Kokoro streaming (အခမဲ့မော်ဒယ်)
- မျိုးဆက်တစ်ဦးလျှင် 500 စာလုံး
- 10 အခမဲ့စီးကြောင်း / တစ်နေ့လျှင်အမည်မဲ့အသုံးပြုသူတစ်ဦး
- စက္ကန့်ပိုင်း ပထမဆုံး အသံ စောင့်ဆိုင်းမှု
- HTTPS ကျော် SSE စီးဆင်းမှု
- 15,000 signup မှာစာလုံးများ
- 5,000 chars တစ်စီးရီး
- ပရိုဂရမ်မက် ဝင်ရောက်ခွင့်အတွက် API ကီး
- မျိုးဆက်သမိုင်း
- နေ့စဉ်စီးဆင်းမှုအမြင့်ဆုံးမရှိ
- MOSS-TTS-Realtime (အသက်ရှင်နေစဉ်)
- 100,000 chars တစ်စီးရီး
- GPU အဆင့်ဆင့်
- Voice agent + Twilio ပေါင်းစည်းမှု
- အမြင့်ဆုံးနှုန်း ကနိမ့်ဆုံးနှုန်း
မေးလေ့ရှိသောမေးခွန်းများ
ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။
ချက်ချင်းစကားပြော
ပထမဦးဆုံးများအတွက်အခမဲ့ 10 တစ်နေ့တစ်မျိုးဆက်. အပြည့်အဝစာလုံးထောက်ပံ့မှုနှင့် API ကို access ကိုဖွင့်ဖို့ sign up.