လွတ်လပ်သော AI စာသားမှစကားပြော
31+ open-source မော်ဒယ်များ, 231+ အသံများ, 34+ ဘာသာစကားများ. အဘယ်သူမျှမအကောင့်လိုအပ်.
Voice AI အတွက်လိုအပ်သောအရာအားလုံး
30+ open-source AI မော်ဒယ်များမှ powered tools များ
31+ AI အသံပုံစံများ
တစ်ခုတည်းသော platform တွင်ပွင့်လင်း-source TTS ပုံစံများ၏အကြီးဆုံးအစုံ
Kokoro Free
Kokoro သည်၎င်း၏အလေးချိန်အတန်းထက်ကောင်းစွာထိုးသွင်းသော 82 သန်း parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်း၏သေးငယ်သောအရွယ်အစားကိုပင်ဖြစ်စေ၊ ၎င်းသည်ထူးခြားစွာသဘာဝနှင့်အသံထွက်ပြောဆိုမှုကိုထုတ်လုပ်သည်။ Kokoro သည်အင်္ဂလိပ်၊ ဂျပန်၊ တရုတ်နှင့်ကမ္ဘာ့ဘာသာစကားများစွာကိုထောက်ခံသည်။
အကောင်းဆုံး: အနည်းဆုံး latency နှင့်အတူအရည်အသွေးမြင့် TTS, streaming applications များ
အခမဲ့စမ်းကြည့်ပါ
Piper Free
Piper သည် VITS နှင့် larynx architectures ကိုအသုံးပြုသော Rhasspy မှတီထွင်ထားသော အလေးချိန်သက်သာသော text-to-speech engine တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်လုံးဝလည်ပတ်ပြီး Edge Devices, အိမ်သုံးစက်ကိရိယာများနှင့် offline TTS ကိုလိုအပ်သော application များအတွက်အလွန်သင့်လျော်သည်။ 30+ ဘာသာစကားများအကြား 100 အသံများဖြင့် Piper သည် Raspberry Pi တွင်ပင်အမှန်တကယ်အချိန်အမြန်နှုန်းဖြင့်သဘာဝအသံထွက်စကားပြောဆိုမှုပေးသည်။ 4.
အကောင်းဆုံး: မြန်ဆန်သော နမူနာများ၊ အသုံးပြုနိုင်မှုနှင့် ထည့်သွင်းထားသော အက်ပလီကေးရှင်းများ
အခမဲ့စမ်းကြည့်ပါ
VITS Free
VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော
အကောင်းဆုံး: သဘာဝကျသော ဘာသာစကားဖြင့် အများသုံး စာသားမှစကားပြော
အခမဲ့စမ်းကြည့်ပါ
MeloTTS Free
MeloTTS by MyShell.ai is an multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
အကောင်းဆုံး: ထုတ်လုပ်မှု applications များလိုအပ်ချက်မြန်, ဘာသာစကားစုံ TTS
အခမဲ့စမ်းကြည့်ပါ
OuteTTS Free
OuteTTS မူရင်းဗိသုကာကိုထိန်းသိမ်းထားစဉ်စာသား-to-စကားပြောစွမ်းရည်များနှင့်အတူကြီးမားသောဘာသာစကားမော်ဒယ်များတိုးချဲ့. ဒါဟာ llama.cpp (CPU / GPU) အပါအဝင် backends များစွာကိုထောက်ခံ, Hugging မျက်နှာ Transformers, ExLlamaV2, VLLM, နှင့် Transformers.js ကနေတဆင့်ဘရောက်ဆာကိုပင်ကောက်ချက်ချ. JSON အဖြစ်သိမ်းဆည်းထားသော Speaker profiles များမှတဆင့် zero-shot အသံ cloning features.
အကောင်းဆုံး: Edge ဖြန့်ချိ, browser ကိုအခြေခံ TTS, အနည်းငယ်-resource ပတ်ဝန်းကျင်
အခမဲ့စမ်းကြည့်ပါ
Pocket TTS Free
Kyutai (Moshi ၏ဖန်တီးသူများ) က Pocket TTS သည်၎င်း၏အလေးချိန်ထက်ကောင်းစွာထိုးသွင်းသော compact 100M parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်ထိရောက်စွာလည်ပတ်ပြီးတစ်ဦးတည်းသော audio sample မှ zero-shot voice clone ကိုထောက်ပံ့ပြီးသဘာဝ-အသံထွက်စကားပြောဆိုမှုကိုထုတ်လုပ်သည်။
အကောင်းဆုံး: အလေးချိန်နည်းသော ဖြန့်ချိမှု၊ CPU-only ပတ်ဝန်းကျင်၊ အမြန်အသံ ကူးယူခြင်း
အခမဲ့စမ်းကြည့်ပါ
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
အကောင်းဆုံး: Fast lightweight TTS, edge deployment, low-latency applications
အခမဲ့စမ်းကြည့်ပါ
Bark Standard
အမှန်တကယ်စကားပြောဆိုမှု၊ ဂီတနှင့် အသံသက်ရောက်မှုများကို ထုတ်လုပ်ပေးသော Transformer-based text-to-audio ပုံစံ။
ဖန်တီးသူ - Suno · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Bark Small Standard
မြန်နှုန်းမြင့် inference နှင့်အောက်ခြေမှတ်ဉာဏ်အသုံးပြုမှုနှင့်အတူ Bark ၏အလင်း version ကို။
ဖန်တီးသူ - Suno · လိုင်စင် - MIT
စမ်းကြည့်ပါ
CosyVoice 2 Standard
Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။
ဖန်တီးသူ - Alibaba (Tongyi Lab) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Dia TTS Standard
ထုတ်လွှင့်သူအကြားသဘာဝစကားပြောဆိုမှုဖန်တီးသော multi-ထုတ်လွှင့်သူစကားပြောခန်းမျိုးဆက်မော်ဒယ်။
ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Parler TTS Standard
သင်လိုချင်တဲ့အသံကိုသဘာဝဘာသာစကားနဲ့ဖော်ပြပြီး Parler ကလိုက်ဖက်တဲ့စကားပြောကိုထုတ်လုပ်ပါတယ်။
ဖန်တီးသူ - Hugging Face · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
GLM-TTS Standard
ပွင့်လင်း-ရင်းမြစ် TTS ပုံစံများအကြားအနည်းဆုံးစာလုံးအမှားနှုန်းကိုရရှိသည်။
ဖန်တီးသူ - Zhipu AI · လိုင်စင် - GLM-4 License
စမ်းကြည့်ပါ
IndexTTS-2 Standard
မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS
ဖန်တီးသူ - Index Team · လိုင်စင် - Bilibili Model License
စမ်းကြည့်ပါ
Spark TTS Standard
Voice cloning TTS with controlable emotion and speaking style via prompts.
ဖန်တီးသူ - SparkAudio · လိုင်စင် - CC BY-NC-SA 4.0
စမ်းကြည့်ပါ
GPT-SoVITS Standard
အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.
ဖန်တီးသူ - RVC-Boss · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Orpheus Standard
လူ့-အဆင့်ခံစားချက် TTS ပုံစံစကားပြောဒေတာ 100K နာရီအပေါ်လေ့ကျင့်.
ဖန်တီးသူ - Canopy Labs · လိုင်စင် - Llama 3.2 Community
စမ်းကြည့်ပါ
Qwen3 TTS Standard
Alibaba ၏ဘာသာစကားများစွာ TTS အသံ clone, preset အသံများ, နှင့်စာသားမှအသံဒီဇိုင်းနှင့်အတူ။
ဖန်တီးသူ - Alibaba (Qwen) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
Chatterbox Turbo Standard
ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.
ဖန်တီးသူ - Resemble AI · လိုင်စင် - MIT
စမ်းကြည့်ပါ
Dia 2 Standard
multi-ပြောဆိုသူစကားပြောနှင့် paralinguistic အချက်ပြမှုများနှင့်အတူ streaming-ပထမဦးဆုံးစကားပြော TTS.
ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
VoxCPM Standard
Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.
ဖန်တီးသူ - OpenBMB · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
TADA Standard
စာသား-acoustic dual alignment နဲ့ Zero-အမြင်အာရုံ TTS, 5x နှိုင်းယှဉ် LLM TTS ထက်ပိုမြန်.
ဖန်တီးသူ - Hume AI · လိုင်စင် - MIT
စမ်းကြည့်ပါ
VibeVoice Standard
podcasts နှင့်အသံစာအုပ်များကဲ့သို့သောရှည်လျားသောပုံစံ multi-speaker အကြောင်းအရာများအတွက် Microsoft ရဲ့မော်ဒယ်။
ဖန်တီးသူ - Microsoft · လိုင်စင် - MIT
စမ်းကြည့်ပါ
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ဖန်တီးသူ - Alibaba (FunAudioLLM) · လိုင်စင် - Apache 2.0
စမ်းကြည့်ပါ
CosyVoice 2
Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။
ဘာသာစကားများ - en, zh, ja, ko, fr, de, it, es
အသံကို ကူးယူပါ
GLM-TTS
ပွင့်လင်း-ရင်းမြစ် TTS ပုံစံများအကြားအနည်းဆုံးစာလုံးအမှားနှုန်းကိုရရှိသည်။
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
IndexTTS-2
မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
Spark TTS
Voice cloning TTS with controlable emotion and speaking style via prompts.
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
GPT-SoVITS
အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.
ဘာသာစကားများ - en, zh, ja, ko
အသံကို ကူးယူပါ
Chatterbox
Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
Tortoise TTS
အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
OpenVoice
ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။
ဘာသာစကားများ - en, zh, ja, ko, fr, de, es, it
အသံကို ကူးယူပါ
Qwen3 TTS
Alibaba ၏ဘာသာစကားများစွာ TTS အသံ clone, preset အသံများ, နှင့်စာသားမှအသံဒီဇိုင်းနှင့်အတူ။
ဘာသာစကားများ - en, zh, ja, ko, de, fr, ru, pt, es, it
အသံကို ကူးယူပါ
Chatterbox Turbo
ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
VoxCPM
Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါ
OuteTTS
LLM-based TTS ဟာ CPU, GPU, llama.cpp နဲ့ Transformers.js ကနေတဆင့် browser ပေါ်မှာ run တဲ့။
ဘာသာစကားများ - en
အသံကို ကူးယူပါ
Pocket TTS
တစ်ခုတည်းသောနမူနာမှအသံ clone နှင့်အတူ Kyutai အားဖြင့်အလေးချိန် 100M parameter ကိုမော်ဒယ်။
ဘာသာစကားများ - en, fr
အသံကို ကူးယူပါ
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ဘာသာစကားများ - en, zh, ja, ko, de, es, fr, it, ru
အသံကို ကူးယူပါ
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ဘာသာစကားများ - en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
အသံကို ကူးယူပါ
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ဘာသာစကားများ - en, zh
အသံကို ကူးယူပါDeveloper-First API
OpenAI-ကိုက်ညီ REST API ကို။ တစ်ဦး endpoint, 22+ မော်ဒယ်များ။ အစစ်အမှန်အချိန် application များအတွက် streaming ထောက်ခံမှု။
- OpenAI-ကိုက်ညီသော ပုံစံ
- အစစ်အမှန်အချိန် အက်ပလီကေးရှင်းများအတွက် TTS စီးဆင်းမှု
- ကြီးမားသောအလုပ်များအတွက် batch စီမံခန့်ခွဲမှု
- Webhook အသိပေးချက်များ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ရိုးရှင်းသော, ပွင့်လင်းမြင်သာသောစျေးနှုန်း
အခမဲ့စတင်ပါ. သင်ကြီးထွားအဖြစ်စကေး.
အခမဲ့
15 ခရက်ဒစ်
- Kokoro, Piper, VITS, MeloTTS
- 500 အက္ခရာ အမြင့်ဆုံး
- 3 gen / နာရီ (အကောင့်မရှိ)
စတင်သူ
500 ခရက်ဒစ် / လ
- အားလုံး 22+ မော်ဒယ်များ
- မျိုးဆက်တစ်ဦးလျှင် 100,000 chars
- အသံခိုးယူခြင်း
ပရော်ဖက်ရှင်နယ်
2,000 ခရက်ဒစ် / လ
- Starter တွင်ရှိသောအရာအားလုံး
- API ဝင်ရောက်ခွင့်
- အရေးအကြီးဆုံး လုပ်ဆောင်ချက်
စီးပွားရေး
10,000 ခရက်ဒစ် / လ
- Pro တွင်အားလုံး
- အများသုံး API
- ရှေ့တန်းတင် တန်းစီ
မေးလေ့ရှိသောမေးခွန်းများ
ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။
AI Voice ကို ယနေ့စတင်အသုံးပြုပါ
ဖန်တီးသူများ, developer များ, နှင့်အသုံးပြုခြင်း TTS.ai စီးပွားရေးလုပ်ငန်းများ join