လွတ်လပ်သော AI စာသားမှစကားပြော
33+ open-source မော်ဒယ်များ, 273+ အသံများ, 33+ ဘာသာစကားများ. အဘယ်သူမျှမအကောင့်လိုအပ်.
Voice AI အတွက်လိုအပ်သောအရာအားလုံး
30+ open-source AI မော်ဒယ်များမှ powered tools များ
33+ AI အသံပုံစံများ
တစ်ခုတည်းသော platform တွင်ပွင့်လင်း-source TTS ပုံစံများ၏အကြီးဆုံးအစုံ
Kokoro လွတ်လပ်မှု
Kokoro သည်၎င်း၏အလေးချိန်အတန်းထက်ကောင်းစွာထိုးသွင်းသော 82 သန်း parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်း၏သေးငယ်သောအရွယ်အစားကိုပင်ဖြစ်စေ၊ ၎င်းသည်ထူးခြားစွာသဘာဝနှင့်အသံထွက်ပြောဆိုမှုကိုထုတ်လုပ်သည်။ Kokoro သည်အင်္ဂလိပ်၊ ဂျပန်၊ တရုတ်နှင့်ကမ္ဘာ့ဘာသာစကားများစွာကိုထောက်ခံသည်။
အကောင်းဆုံး: အနည်းဆုံး latency နှင့်အတူအရည်အသွေးမြင့် TTS, streaming applications များ
အခမဲ့စမ်းကြည့်ပါ
Piper လွတ်လပ်မှု
Piper သည် VITS နှင့် larynx architectures ကိုအသုံးပြုသော Rhasspy မှတီထွင်ထားသော အလေးချိန်သက်သာသော text-to-speech engine တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်လုံးဝလည်ပတ်ပြီး Edge Devices, အိမ်သုံးစက်ကိရိယာများနှင့် offline TTS ကိုလိုအပ်သော application များအတွက်အလွန်သင့်လျော်သည်။ 30+ ဘာသာစကားများအကြား 100 အသံများဖြင့် Piper သည် Raspberry Pi တွင်ပင်အမှန်တကယ်အချိန်အမြန်နှုန်းဖြင့်သဘာဝအသံထွက်စကားပြောဆိုမှုပေးသည်။ 4.
အကောင်းဆုံး: မြန်ဆန်သော နမူနာများ၊ အသုံးပြုနိုင်မှုနှင့် ထည့်သွင်းထားသော အက်ပလီကေးရှင်းများ
အခမဲ့စမ်းကြည့်ပါ
VITS လွတ်လပ်မှု
VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော
အကောင်းဆုံး: သဘာဝကျသော ဘာသာစကားဖြင့် အများသုံး စာသားမှစကားပြော
အခမဲ့စမ်းကြည့်ပါ
MeloTTS လွတ်လပ်မှု
MeloTTS by MyShell.ai is an multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
အကောင်းဆုံး: ထုတ်လုပ်မှု applications များလိုအပ်ချက်မြန်, ဘာသာစကားစုံ TTS
အခမဲ့စမ်းကြည့်ပါ
Kani TTS 2 လွတ်လပ်မှု
Kani-TTS-2 by NineNineSix is an ultra-lightweight 400M parameter model built onaLiquid AI LFM2 backbone with NVIDIA NanoCodec. It runs in just 3GB VRAM and produces ~10 seconds of speech in ~2 seconds on an A100 (RTF 0.2).
အကောင်းဆုံး: အမြန်အင်္ဂလိပ်မျိုးဆက်အနည်းငယ်-VRAM ဟာ့ဒ်ဝဲ, မြန်ဆန် previews
အခမဲ့စမ်းကြည့်ပါ
OuteTTS လွတ်လပ်မှု
OuteTTS မူရင်းဗိသုကာကိုထိန်းသိမ်းထားစဉ်စာသား-to-စကားပြောစွမ်းရည်များနှင့်အတူကြီးမားသောဘာသာစကားမော်ဒယ်များတိုးချဲ့. ဒါဟာ llama.cpp (CPU / GPU) အပါအဝင် backends များစွာကိုထောက်ခံ, Hugging မျက်နှာ Transformers, ExLlamaV2, VLLM, နှင့် Transformers.js ကနေတဆင့်ဘရောက်ဆာကိုပင်ကောက်ချက်ချ. JSON အဖြစ်သိမ်းဆည်းထားသော Speaker profiles များမှတဆင့် zero-shot အသံ cloning features.
အကောင်းဆုံး: Edge ဖြန့်ချိ, browser ကိုအခြေခံ TTS, အနည်းငယ်-resource ပတ်ဝန်းကျင်
အခမဲ့စမ်းကြည့်ပါ
Pocket TTS လွတ်လပ်မှု
Kyutai (Moshi ၏ဖန်တီးသူများ) က Pocket TTS သည်၎င်း၏အလေးချိန်ထက်ကောင်းစွာထိုးသွင်းသော compact 100M parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်ထိရောက်စွာလည်ပတ်ပြီးတစ်ဦးတည်းသော audio sample မှ zero-shot voice clone ကိုထောက်ပံ့ပြီးသဘာဝ-အသံထွက်စကားပြောဆိုမှုကိုထုတ်လုပ်သည်။
အကောင်းဆုံး: အလေးချိန်နည်းသော ဖြန့်ချိမှု၊ CPU-only ပတ်ဝန်းကျင်၊ အမြန်အသံ ကူးယူခြင်း
အခမဲ့စမ်းကြည့်ပါ
Kitten TTS လွတ်လပ်မှု
KittenML က Kitten TTS ONNX ပေါ်တွင်တည်ဆောက်အလွန်အလင်း-အလေးချိန်စာသား-to-စကားပြောမော်ဒယ်တစ်ခုဖြစ်ပါသည်. 15M မှ 80M parameters တွေကို (25-80 MB ကို disk ကိုပေါ်တွင်) မှကွဲပြားခြားနားသော, ဒါဟာ GPU ကိုမလိုအပ်ဘဲ CPU ကိုအပေါ်အရည်အသွေးမြင့်စကားသံ synthesizing ပေးပို့. Features 8 built-in အသံများ, ချိန်ညှိနိုင်သောစကားပြောအမြန်နှုန်း, နှင့်နံပါတ်များ, ငွေကြေး, နှင့်ယူနစ်များအတွက် built-in ကိုစာသား preprocessing. edge ဖြန့်ချိနှင့်အနည်းငယ်-latency applications များများအတွက်အလွန်အစွမ်းထက်တဲ့.
အကောင်းဆုံး: မြန်မြန်ဆန်ဆန်အလေးချိန်ပေါ့ပါး TTS, edge ဖြန့်ချိ, အနည်းငယ်- latency applications များ
အခမဲ့စမ်းကြည့်ပါ
Ming-Omni TTS လွတ်လပ်မှု
inclusionAI အားဖြင့် Ming-omni-tts-0.5B သည် Patch-by-Patch စီးဆင်းမှု-ကိုက်ညီသော audio decoder နှင့်အတူ BailingMM ၏ထူထပ်သော backbone ပေါ်တွင်တည်ဆောက်ထားသော compact omni-modal စကားပြောပုံစံတစ်ခုဖြစ်သည်။ 44.1kHz output ကို (CD အရည်အသွေးအနီး) ပေးပို့သည်။ 3+ စက္ကန့်အညွှန်းမှ zero-shot voice clone ကိုထောက်ပံ့ပေးပြီး JSON အမိန့်များမှတဆင့် built-in ခံစားမှု / ဘာသာစကား / BGM ထိန်းချုပ်မှုပါဝင်သည်။
အကောင်းဆုံး: မြင့်မားသောယုံကြည်မှုနှစ်ဘာသာပြောဆိုမှု, စိတ်ခံစားမှုထိန်းချုပ်အသံသရုပ်ဆောင်, တရုတ်အသံစာအုပ်အကြောင်းအရာ
အခမဲ့စမ်းကြည့်ပါ
MOSS-TTS Nano လွတ်လပ်မှု
MOSS-TTS-Nano-100M သည် MOSS-TTS မိသားစု၏ OpenMOSS ၏ compact 100M-parameter variant ဖြစ်ပြီး, ကြာချိန်-transformer architecture ကိုမျှဝေသည်။ ~ 80x အသေးစားအလေးချိန်နှင့်အလွန်အမင်းနိမ့်သောတစ်ဦးချင်းစီ-request VRAM အတွက် 8B ပုံစံ၏အမြင့်ဆုံးအရည်အသွေးကိုရောင်းချသည်။ အခမဲ့-tier နှင့်မြင့်မားသော-throughput ဖြန့်ချိမှုများအတွက်သင့်လျော်စေသည်။ တူညီသော 20-language reach ။
အကောင်းဆုံး: အခမဲ့-tier TTS, မြင့်မားသော-အရွယ်အစားထုတ်လုပ်မှု, အနည်းငယ်-latency ကိုတုံ့ပြန်အသုံးပြုမှု
အခမဲ့စမ်းကြည့်ပါ
Bark စံ
အမှန်တကယ်စကားပြောဆိုမှု၊ ဂီတနှင့် အသံသက်ရောက်မှုများကို ထုတ်လုပ်ပေးသော Transformer-based text-to-audio ပုံစံ။
ဖန်တီးသူ - Suno · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Bark Small စံ
မြန်နှုန်းမြင့် inference နှင့်အောက်ခြေမှတ်ဉာဏ်အသုံးပြုမှုနှင့်အတူ Bark ၏အလင်း version ကို။
ဖန်တီးသူ - Suno · လိုင်စင် - MIT
စမ်းကြည့်ပါ
CosyVoice 2 စံ
Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။
ဖန်တီးသူ - Alibaba (Tongyi Lab) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Dia TTS စံ
ထုတ်လွှင့်သူအကြားသဘာဝစကားပြောဆိုမှုဖန်တီးသော multi-ထုတ်လွှင့်သူစကားပြောခန်းမျိုးဆက်မော်ဒယ်။
ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Parler TTS စံ
သင်လိုချင်တဲ့အသံကိုသဘာဝဘာသာစကားနဲ့ဖော်ပြပြီး Parler ကလိုက်ဖက်တဲ့စကားပြောကိုထုတ်လုပ်ပါတယ်။
ဖန်တီးသူ - Hugging Face · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
IndexTTS-2 စံ
မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS
ဖန်တီးသူ - Index Team · လိုင်စင် - Bilibili Model License
စမ်းကြည့်ပါ
Spark TTS စံ
Voice cloning TTS with controlable emotion and speaking style via prompts.
ဖန်တီးသူ - SparkAudio · လိုင်စင် - CC BY-NC-SA 4.0
စမ်းကြည့်ပါ
GPT-SoVITS စံ
အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.
ဖန်တီးသူ - RVC-Boss · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Orpheus စံ
လူ့-အဆင့်ခံစားချက် TTS ပုံစံစကားပြောဒေတာ 100K နာရီအပေါ်လေ့ကျင့်.
ဖန်တီးသူ - Canopy Labs · လိုင်စင် - Llama 3.2 Community
စမ်းကြည့်ပါ
Qwen3 TTS စံ
Alibaba ၏စာသားမှ preset အသံများနှင့်အသံဒီဇိုင်းနှင့်အတူဘာသာစကားများစွာ TTS.
ဖန်တီးသူ - Alibaba (Qwen) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
VieNeu-TTS-v2 စံ
ဗီယက်နမ် + အင်္ဂလိပ်7preset အသံများနှင့် Zero-shot အသံ cloning နှင့်အတူ code-switching TTS. CPU-သာ, GPU ကိုလိုအပ်ပါတယ်မဟုတ်.
ဖန်တီးသူ - Phạm Nguyễn Ngọc Bảo · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Chatterbox Turbo စံ
ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.
ဖန်တီးသူ - Resemble AI · လိုင်စင် - MIT
စမ်းကြည့်ပါ
VoxCPM စံ
Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.
ဖန်တီးသူ - OpenBMB · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
VibeVoice စံ
podcasts နှင့်အသံစာအုပ်များကဲ့သို့သောရှည်လျားသောပုံစံ multi-speaker အကြောင်းအရာများအတွက် Microsoft ရဲ့မော်ဒယ်။
ဖန်တီးသူ - Microsoft · လိုင်စင် - MIT
စမ်းကြည့်ပါ
CosyVoice3 စံ
bi-streaming, ခံစားမှုထိန်းချုပ်မှုနှင့် zero-shot အသံ cloning နှင့်အတူနောက်ဆုံးပေါ်မျိုးဆက်ဘာသာစကားများစွာ TTS ။
ဖန်တီးသူ - Alibaba (FunAudioLLM) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
NAMAA Saudi TTS စံ
ပထမဦးဆုံးဖွင့်လှစ်သမ္မတနိုင်ငံ-အရပ်ဘက် TTS. Chatterbox-အရည်အသွေးအသံ cloning နှင့်အတူမိခင်သမ္မတနိုင်ငံဘာသာစကား.
ဖန်တီးသူ - NAMAA Space · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Darwin TTS စံ
ဘာသာစကားပေါင်းစုံကို ကူးယူခြင်းအတွက် Qwen3-1.7B ဘာသာစကား ပုံစံမှ ပေါင်းစပ်ထားသော FFN ချိန်ခွင်လျှာများပါရှိသော Cross-modal Qwen3-TTS အမျိုးအစား။
ဖန်တီးသူ - FINAL-Bench · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
MOSS-TTSD စံ
Multi-speaker စကားပြောဆက်လက်မော်ဒယ် - အထိ5ပြောဆိုသူများနှင့်အတူ podcast-style စကားပြောဆိုမှုများကိုထုတ်လုပ် 60 ပေါင်းစပ်အသံ၏မိနစ်။
ဖန်တီးသူ - OpenMOSS · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
CosyVoice 2
Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။
ဘာသာစကားများ - en, zh, ja, ko, fr, de, it, es
အသံကို ကူးယူပါ
IndexTTS-2
မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
Spark TTS
Voice cloning TTS with controlable emotion and speaking style via prompts.
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
GPT-SoVITS
အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.
ဘာသာစကားများ - en, zh, ja, ko
အသံကို ကူးယူပါ
Chatterbox
Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
Tortoise TTS
အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
OpenVoice
ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။
ဘာသာစကားများ - en, zh, ja, ko, fr, es
အသံကို ကူးယူပါ
VieNeu-TTS-v2
ဗီယက်နမ် + အင်္ဂလိပ်7preset အသံများနှင့် Zero-shot အသံ cloning နှင့်အတူ code-switching TTS. CPU-သာ, GPU ကိုလိုအပ်ပါတယ်မဟုတ်.
ဘာသာစကားများ - vi, en
အသံကို ကူးယူပါ
Chatterbox Turbo
ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
VoxCPM
Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
OuteTTS
LLM-based TTS ဟာ CPU, GPU, llama.cpp နဲ့ Transformers.js ကနေတဆင့် browser ပေါ်မှာ run တဲ့။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
Pocket TTS
တစ်ခုတည်းသောနမူနာမှအသံ clone နှင့်အတူ Kyutai အားဖြင့်အလေးချိန် 100M parameter ကိုမော်ဒယ်။
ဘာသာစကားများ - en, fr
အသံကို ကူးယူပါ
CosyVoice3
bi-streaming, ခံစားမှုထိန်းချုပ်မှုနှင့် zero-shot အသံ cloning နှင့်အတူနောက်ဆုံးပေါ်မျိုးဆက်ဘာသာစကားများစွာ TTS ။
ဘာသာစကားများ - en, zh, ja, ko, de, es, fr, it, ru
အသံကို ကူးယူပါ
NAMAA Saudi TTS
ပထမဦးဆုံးဖွင့်လှစ်သမ္မတနိုင်ငံ-အရပ်ဘက် TTS. Chatterbox-အရည်အသွေးအသံ cloning နှင့်အတူမိခင်သမ္မတနိုင်ငံဘာသာစကား.
ဘာသာစကားများ - ar
အသံကို ကူးယူပါ
Darwin TTS
ဘာသာစကားပေါင်းစုံကို ကူးယူခြင်းအတွက် Qwen3-1.7B ဘာသာစကား ပုံစံမှ ပေါင်းစပ်ထားသော FFN ချိန်ခွင်လျှာများပါရှိသော Cross-modal Qwen3-TTS အမျိုးအစား။
ဘာသာစကားများ - en, ko, ja, zh
အသံကို ကူးယူပါ
MOSS-TTSD
Multi-speaker စကားပြောဆက်လက်မော်ဒယ် - အထိ5ပြောဆိုသူများနှင့်အတူ podcast-style စကားပြောဆိုမှုများကိုထုတ်လုပ် 60 ပေါင်းစပ်အသံ၏မိနစ်။
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
Ming-Omni TTS
မြင့်မားသောယုံကြည်စိတ်ချရမှု 44.1kHz output နဲ့ zero-shot voice cloning တွေနဲ့ inclusionAI မှ compact 0.5B omni-modal စကားပြောမော်ဒယ်။
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
MOSS-TTS Nano
Tiny 100M MOSS-TTS မျိုးကွဲ - တူညီတဲ့ဗိသုကာ, 80x သေးငယ်တဲ့, အခမဲ့-tier latency ကို။
ဘာသာစကားများ - en, zh, de, es, fr, ja, it, ko, ru, ar, pt
အသံကို ကူးယူပါDeveloper-First API
OpenAI-ကိုက်ညီ REST API ကို။ တစ်ဦး endpoint, 22+ မော်ဒယ်များ။ အစစ်အမှန်အချိန် application များအတွက် streaming ထောက်ခံမှု။
- OpenAI-ကိုက်ညီသော ပုံစံ
- အစစ်အမှန်အချိန် အက်ပလီကေးရှင်းများအတွက် TTS စီးဆင်းမှု
- ကြီးမားသောအလုပ်များအတွက် batch စီမံခန့်ခွဲမှု
- Webhook အသိပေးချက်များ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ရိုးရှင်းသော, ပွင့်လင်းမြင်သာသောစျေးနှုန်း
အခမဲ့စတင်ပါ. သင်ကြီးထွားအဖြစ်စကေး.
အခမဲ့
15,000 စာလုံး + 5,000/နေ့
- 7 Kokoro အပါအဝင်အခမဲ့မော်ဒယ်များ
- 5,000 chars တစ်မျိုးဆက်
- API ဝင်ရောက်ခွင့်ပါဝင်သည်
စတင်သူ
500 ခရက်ဒစ် / လ
- အားလုံး 22+ မော်ဒယ်များ
- မျိုးဆက်တစ်ဦးလျှင် 100,000 chars
- အသံခိုးယူခြင်း
ပရော်ဖက်ရှင်နယ်
2,000 ခရက်ဒစ် / လ
- Starter တွင်ရှိသောအရာအားလုံး
- API ဝင်ရောက်ခွင့်
- အရေးအကြီးဆုံး လုပ်ဆောင်ချက်
စီးပွားရေး
10,000 ခရက်ဒစ် / လ
- Pro တွင်အားလုံး
- အများသုံး API
- ရှေ့တန်းတင် တန်းစီ
မေးလေ့ရှိသောမေးခွန်းများ
ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။
AI Voice ကို ယနေ့စတင်အသုံးပြုပါ
ဖန်တီးသူများ, developer များ, နှင့်အသုံးပြုခြင်း TTS.ai စီးပွားရေးလုပ်ငန်းများ join