လွတ်လပ်သော AI စာသားမှစကားပြော

33+ open-source မော်ဒယ်များ, 273+ အသံများ, 33+ ဘာသာစကားများ. အဘယ်သူမျှမအကောင့်လိုအပ်.

17K+
ဖန်တီးသူများ
70K+
မျိုးဆက်များ
33+
AI ပုံစံများ
273+
အသံများ
TTS.ai ကိုချစ်ပါသလား?

Voice AI အတွက်လိုအပ်သောအရာအားလုံး

30+ open-source AI မော်ဒယ်များမှ powered tools များ

33+ AI အသံပုံစံများ

တစ်ခုတည်းသော platform တွင်ပွင့်လင်း-source TTS ပုံစံများ၏အကြီးဆုံးအစုံ

KokoroKokoro လွတ်လပ်မှု

Kokoro သည်၎င်း၏အလေးချိန်အတန်းထက်ကောင်းစွာထိုးသွင်းသော 82 သန်း parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်း၏သေးငယ်သောအရွယ်အစားကိုပင်ဖြစ်စေ၊ ၎င်းသည်ထူးခြားစွာသဘာဝနှင့်အသံထွက်ပြောဆိုမှုကိုထုတ်လုပ်သည်။ Kokoro သည်အင်္ဂလိပ်၊ ဂျပန်၊ တရုတ်နှင့်ကမ္ဘာ့ဘာသာစကားများစွာကိုထောက်ခံသည်။

အကောင်းဆုံး: အနည်းဆုံး latency နှင့်အတူအရည်အသွေးမြင့် TTS, streaming applications များ

အခမဲ့စမ်းကြည့်ပါ

PiperPiper လွတ်လပ်မှု

Piper သည် VITS နှင့် larynx architectures ကိုအသုံးပြုသော Rhasspy မှတီထွင်ထားသော အလေးချိန်သက်သာသော text-to-speech engine တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်လုံးဝလည်ပတ်ပြီး Edge Devices, အိမ်သုံးစက်ကိရိယာများနှင့် offline TTS ကိုလိုအပ်သော application များအတွက်အလွန်သင့်လျော်သည်။ 30+ ဘာသာစကားများအကြား 100 အသံများဖြင့် Piper သည် Raspberry Pi တွင်ပင်အမှန်တကယ်အချိန်အမြန်နှုန်းဖြင့်သဘာဝအသံထွက်စကားပြောဆိုမှုပေးသည်။ 4.

အကောင်းဆုံး: မြန်ဆန်သော နမူနာများ၊ အသုံးပြုနိုင်မှုနှင့် ထည့်သွင်းထားသော အက်ပလီကေးရှင်းများ

အခမဲ့စမ်းကြည့်ပါ

VITSVITS လွတ်လပ်မှု

VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော

အကောင်းဆုံး: သဘာဝကျသော ဘာသာစကားဖြင့် အများသုံး စာသားမှစကားပြော

အခမဲ့စမ်းကြည့်ပါ

MeloTTSMeloTTS လွတ်လပ်မှု

MeloTTS by MyShell.ai is an multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

အကောင်းဆုံး: ထုတ်လုပ်မှု applications များလိုအပ်ချက်မြန်, ဘာသာစကားစုံ TTS

အခမဲ့စမ်းကြည့်ပါ

Kani TTS 2Kani TTS 2 လွတ်လပ်မှု

Kani-TTS-2 by NineNineSix is an ultra-lightweight 400M parameter model built onaLiquid AI LFM2 backbone with NVIDIA NanoCodec. It runs in just 3GB VRAM and produces ~10 seconds of speech in ~2 seconds on an A100 (RTF 0.2).

အကောင်းဆုံး: အမြန်အင်္ဂလိပ်မျိုးဆက်အနည်းငယ်-VRAM ဟာ့ဒ်ဝဲ, မြန်ဆန် previews

အခမဲ့စမ်းကြည့်ပါ

OuteTTSOuteTTS လွတ်လပ်မှု

OuteTTS မူရင်းဗိသုကာကိုထိန်းသိမ်းထားစဉ်စာသား-to-စကားပြောစွမ်းရည်များနှင့်အတူကြီးမားသောဘာသာစကားမော်ဒယ်များတိုးချဲ့. ဒါဟာ llama.cpp (CPU / GPU) အပါအဝင် backends များစွာကိုထောက်ခံ, Hugging မျက်နှာ Transformers, ExLlamaV2, VLLM, နှင့် Transformers.js ကနေတဆင့်ဘရောက်ဆာကိုပင်ကောက်ချက်ချ. JSON အဖြစ်သိမ်းဆည်းထားသော Speaker profiles များမှတဆင့် zero-shot အသံ cloning features.

အကောင်းဆုံး: Edge ဖြန့်ချိ, browser ကိုအခြေခံ TTS, အနည်းငယ်-resource ပတ်ဝန်းကျင်

အခမဲ့စမ်းကြည့်ပါ

Pocket TTSPocket TTS လွတ်လပ်မှု

Kyutai (Moshi ၏ဖန်တီးသူများ) က Pocket TTS သည်၎င်း၏အလေးချိန်ထက်ကောင်းစွာထိုးသွင်းသော compact 100M parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်ထိရောက်စွာလည်ပတ်ပြီးတစ်ဦးတည်းသော audio sample မှ zero-shot voice clone ကိုထောက်ပံ့ပြီးသဘာဝ-အသံထွက်စကားပြောဆိုမှုကိုထုတ်လုပ်သည်။

အကောင်းဆုံး: အလေးချိန်နည်းသော ဖြန့်ချိမှု၊ CPU-only ပတ်ဝန်းကျင်၊ အမြန်အသံ ကူးယူခြင်း

အခမဲ့စမ်းကြည့်ပါ

Kitten TTSKitten TTS လွတ်လပ်မှု

KittenML က Kitten TTS ONNX ပေါ်တွင်တည်ဆောက်အလွန်အလင်း-အလေးချိန်စာသား-to-စကားပြောမော်ဒယ်တစ်ခုဖြစ်ပါသည်. 15M မှ 80M parameters တွေကို (25-80 MB ကို disk ကိုပေါ်တွင်) မှကွဲပြားခြားနားသော, ဒါဟာ GPU ကိုမလိုအပ်ဘဲ CPU ကိုအပေါ်အရည်အသွေးမြင့်စကားသံ synthesizing ပေးပို့. Features 8 built-in အသံများ, ချိန်ညှိနိုင်သောစကားပြောအမြန်နှုန်း, နှင့်နံပါတ်များ, ငွေကြေး, နှင့်ယူနစ်များအတွက် built-in ကိုစာသား preprocessing. edge ဖြန့်ချိနှင့်အနည်းငယ်-latency applications များများအတွက်အလွန်အစွမ်းထက်တဲ့.

အကောင်းဆုံး: မြန်မြန်ဆန်ဆန်အလေးချိန်ပေါ့ပါး TTS, edge ဖြန့်ချိ, အနည်းငယ်- latency applications များ

အခမဲ့စမ်းကြည့်ပါ

Ming-Omni TTSMing-Omni TTS လွတ်လပ်မှု

inclusionAI အားဖြင့် Ming-omni-tts-0.5B သည် Patch-by-Patch စီးဆင်းမှု-ကိုက်ညီသော audio decoder နှင့်အတူ BailingMM ၏ထူထပ်သော backbone ပေါ်တွင်တည်ဆောက်ထားသော compact omni-modal စကားပြောပုံစံတစ်ခုဖြစ်သည်။ 44.1kHz output ကို (CD အရည်အသွေးအနီး) ပေးပို့သည်။ 3+ စက္ကန့်အညွှန်းမှ zero-shot voice clone ကိုထောက်ပံ့ပေးပြီး JSON အမိန့်များမှတဆင့် built-in ခံစားမှု / ဘာသာစကား / BGM ထိန်းချုပ်မှုပါဝင်သည်။

အကောင်းဆုံး: မြင့်မားသောယုံကြည်မှုနှစ်ဘာသာပြောဆိုမှု, စိတ်ခံစားမှုထိန်းချုပ်အသံသရုပ်ဆောင်, တရုတ်အသံစာအုပ်အကြောင်းအရာ

အခမဲ့စမ်းကြည့်ပါ

MOSS-TTS NanoMOSS-TTS Nano လွတ်လပ်မှု

MOSS-TTS-Nano-100M သည် MOSS-TTS မိသားစု၏ OpenMOSS ၏ compact 100M-parameter variant ဖြစ်ပြီး, ကြာချိန်-transformer architecture ကိုမျှဝေသည်။ ~ 80x အသေးစားအလေးချိန်နှင့်အလွန်အမင်းနိမ့်သောတစ်ဦးချင်းစီ-request VRAM အတွက် 8B ပုံစံ၏အမြင့်ဆုံးအရည်အသွေးကိုရောင်းချသည်။ အခမဲ့-tier နှင့်မြင့်မားသော-throughput ဖြန့်ချိမှုများအတွက်သင့်လျော်စေသည်။ တူညီသော 20-language reach ။

အကောင်းဆုံး: အခမဲ့-tier TTS, မြင့်မားသော-အရွယ်အစားထုတ်လုပ်မှု, အနည်းငယ်-latency ကိုတုံ့ပြန်အသုံးပြုမှု

အခမဲ့စမ်းကြည့်ပါ

BarkBark စံ

အမှန်တကယ်စကားပြောဆိုမှု၊ ဂီတနှင့် အသံသက်ရောက်မှုများကို ထုတ်လုပ်ပေးသော Transformer-based text-to-audio ပုံစံ။

ဖန်တီးသူ - Suno · လိုင်စင် - MIT

စမ်းကြည့်ပါ

Bark SmallBark Small စံ

မြန်နှုန်းမြင့် inference နှင့်အောက်ခြေမှတ်ဉာဏ်အသုံးပြုမှုနှင့်အတူ Bark ၏အလင်း version ကို။

ဖန်တီးသူ - Suno · လိုင်စင် - MIT

စမ်းကြည့်ပါ

CosyVoice 2CosyVoice 2 စံ

Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။

ဖန်တီးသူ - Alibaba (Tongyi Lab) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Dia TTSDia TTS စံ

ထုတ်လွှင့်သူအကြားသဘာဝစကားပြောဆိုမှုဖန်တီးသော multi-ထုတ်လွှင့်သူစကားပြောခန်းမျိုးဆက်မော်ဒယ်။

ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Parler TTSParler TTS စံ

သင်လိုချင်တဲ့အသံကိုသဘာဝဘာသာစကားနဲ့ဖော်ပြပြီး Parler ကလိုက်ဖက်တဲ့စကားပြောကိုထုတ်လုပ်ပါတယ်။

ဖန်တီးသူ - Hugging Face · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

IndexTTS-2IndexTTS-2 စံ

မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS

ဖန်တီးသူ - Index Team · လိုင်စင် - Bilibili Model License

စမ်းကြည့်ပါ

Spark TTSSpark TTS စံ

Voice cloning TTS with controlable emotion and speaking style via prompts.

ဖန်တီးသူ - SparkAudio · လိုင်စင် - CC BY-NC-SA 4.0

စမ်းကြည့်ပါ

GPT-SoVITSGPT-SoVITS စံ

အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.

ဖန်တီးသူ - RVC-Boss · လိုင်စင် - MIT

စမ်းကြည့်ပါ

OrpheusOrpheus စံ

လူ့-အဆင့်ခံစားချက် TTS ပုံစံစကားပြောဒေတာ 100K နာရီအပေါ်လေ့ကျင့်.

ဖန်တီးသူ - Canopy Labs · လိုင်စင် - Llama 3.2 Community

စမ်းကြည့်ပါ

Qwen3 TTSQwen3 TTS စံ

Alibaba ၏စာသားမှ preset အသံများနှင့်အသံဒီဇိုင်းနှင့်အတူဘာသာစကားများစွာ TTS.

ဖန်တီးသူ - Alibaba (Qwen) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

VieNeu-TTS-v2VieNeu-TTS-v2 စံ

ဗီယက်နမ် + အင်္ဂလိပ်7preset အသံများနှင့် Zero-shot အသံ cloning နှင့်အတူ code-switching TTS. CPU-သာ, GPU ကိုလိုအပ်ပါတယ်မဟုတ်.

ဖန်တီးသူ - Phạm Nguyễn Ngọc Bảo · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Chatterbox TurboChatterbox Turbo စံ

ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.

ဖန်တီးသူ - Resemble AI · လိုင်စင် - MIT

စမ်းကြည့်ပါ

VoxCPMVoxCPM စံ

Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.

ဖန်တီးသူ - OpenBMB · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

VibeVoiceVibeVoice စံ

podcasts နှင့်အသံစာအုပ်များကဲ့သို့သောရှည်လျားသောပုံစံ multi-speaker အကြောင်းအရာများအတွက် Microsoft ရဲ့မော်ဒယ်။

ဖန်တီးသူ - Microsoft · လိုင်စင် - MIT

စမ်းကြည့်ပါ

CosyVoice3CosyVoice3 စံ

bi-streaming, ခံစားမှုထိန်းချုပ်မှုနှင့် zero-shot အသံ cloning နှင့်အတူနောက်ဆုံးပေါ်မျိုးဆက်ဘာသာစကားများစွာ TTS ။

ဖန်တီးသူ - Alibaba (FunAudioLLM) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

NAMAA Saudi TTSNAMAA Saudi TTS စံ

ပထမဦးဆုံးဖွင့်လှစ်သမ္မတနိုင်ငံ-အရပ်ဘက် TTS. Chatterbox-အရည်အသွေးအသံ cloning နှင့်အတူမိခင်သမ္မတနိုင်ငံဘာသာစကား.

ဖန်တီးသူ - NAMAA Space · လိုင်စင် - MIT

စမ်းကြည့်ပါ

Darwin TTSDarwin TTS စံ

ဘာသာစကားပေါင်းစုံကို ကူးယူခြင်းအတွက် Qwen3-1.7B ဘာသာစကား ပုံစံမှ ပေါင်းစပ်ထားသော FFN ချိန်ခွင်လျှာများပါရှိသော Cross-modal Qwen3-TTS အမျိုးအစား။

ဖန်တီးသူ - FINAL-Bench · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

MOSS-TTSDMOSS-TTSD စံ

Multi-speaker စကားပြောဆက်လက်မော်ဒယ် - အထိ5ပြောဆိုသူများနှင့်အတူ podcast-style စကားပြောဆိုမှုများကိုထုတ်လုပ် 60 ပေါင်းစပ်အသံ၏မိနစ်။

ဖန်တီးသူ - OpenMOSS · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

ChatterboxChatterbox ပရော်မီယံ

Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။

အရည်အသွေး -

စမ်းကြည့်ပါ

Tortoise TTSTortoise TTS ပရော်မီယံ

အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။

အရည်အသွေး -

စမ်းကြည့်ပါ

StyleTTS 2StyleTTS 2 ပရော်မီယံ

ပုံစံဖြန့်ချိခြင်းနှင့် ရန်သူ့ဘက်မှ လေ့ကျင့်ခြင်းမှတစ်ဆင့် လူ့အဆင့် စာသားမှစကားပြောခြင်း။

အရည်အသွေး -

စမ်းကြည့်ပါ

OpenVoiceOpenVoice ပရော်မီယံ

ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။

အရည်အသွေး -

စမ်းကြည့်ပါ

Sesame CSMSesame CSM ပရော်မီယံ

သင့်လျော်သောအချိန်နှင့်စိတ်ခံစားမှုနှင့်အတူသဘာဝစကားပြောဆိုမှုထုတ်လုပ် Conversational စကားပြောပုံစံ။

အရည်အသွေး -

စမ်းကြည့်ပါ

CosyVoice 2CosyVoice 2

Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။

ဘာသာစကားများ - en, zh, ja, ko, fr, de, it, es

အသံကို ကူးယူပါ

IndexTTS-2IndexTTS-2

မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

Spark TTSSpark TTS

Voice cloning TTS with controlable emotion and speaking style via prompts.

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

GPT-SoVITSGPT-SoVITS

အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.

ဘာသာစကားများ - en, zh, ja, ko

အသံကို ကူးယူပါ

ChatterboxChatterbox

Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

Tortoise TTSTortoise TTS

အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

OpenVoiceOpenVoice

ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။

ဘာသာစကားများ - en, zh, ja, ko, fr, es

အသံကို ကူးယူပါ

VieNeu-TTS-v2VieNeu-TTS-v2

ဗီယက်နမ် + အင်္ဂလိပ်7preset အသံများနှင့် Zero-shot အသံ cloning နှင့်အတူ code-switching TTS. CPU-သာ, GPU ကိုလိုအပ်ပါတယ်မဟုတ်.

ဘာသာစကားများ - vi, en

အသံကို ကူးယူပါ

Chatterbox TurboChatterbox Turbo

ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

VoxCPMVoxCPM

Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

OuteTTSOuteTTS

LLM-based TTS ဟာ CPU, GPU, llama.cpp နဲ့ Transformers.js ကနေတဆင့် browser ပေါ်မှာ run တဲ့။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

Pocket TTSPocket TTS

တစ်ခုတည်းသောနမူနာမှအသံ clone နှင့်အတူ Kyutai အားဖြင့်အလေးချိန် 100M parameter ကိုမော်ဒယ်။

ဘာသာစကားများ - en, fr

အသံကို ကူးယူပါ

CosyVoice3CosyVoice3

bi-streaming, ခံစားမှုထိန်းချုပ်မှုနှင့် zero-shot အသံ cloning နှင့်အတူနောက်ဆုံးပေါ်မျိုးဆက်ဘာသာစကားများစွာ TTS ။

ဘာသာစကားများ - en, zh, ja, ko, de, es, fr, it, ru

အသံကို ကူးယူပါ

NAMAA Saudi TTSNAMAA Saudi TTS

ပထမဦးဆုံးဖွင့်လှစ်သမ္မတနိုင်ငံ-အရပ်ဘက် TTS. Chatterbox-အရည်အသွေးအသံ cloning နှင့်အတူမိခင်သမ္မတနိုင်ငံဘာသာစကား.

ဘာသာစကားများ - ar

အသံကို ကူးယူပါ

Darwin TTSDarwin TTS

ဘာသာစကားပေါင်းစုံကို ကူးယူခြင်းအတွက် Qwen3-1.7B ဘာသာစကား ပုံစံမှ ပေါင်းစပ်ထားသော FFN ချိန်ခွင်လျှာများပါရှိသော Cross-modal Qwen3-TTS အမျိုးအစား။

ဘာသာစကားများ - en, ko, ja, zh

အသံကို ကူးယူပါ

MOSS-TTSDMOSS-TTSD

Multi-speaker စကားပြောဆက်လက်မော်ဒယ် - အထိ5ပြောဆိုသူများနှင့်အတူ podcast-style စကားပြောဆိုမှုများကိုထုတ်လုပ် 60 ပေါင်းစပ်အသံ၏မိနစ်။

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

Ming-Omni TTSMing-Omni TTS

မြင့်မားသောယုံကြည်စိတ်ချရမှု 44.1kHz output နဲ့ zero-shot voice cloning တွေနဲ့ inclusionAI မှ compact 0.5B omni-modal စကားပြောမော်ဒယ်။

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS မျိုးကွဲ - တူညီတဲ့ဗိသုကာ, 80x သေးငယ်တဲ့, အခမဲ့-tier latency ကို။

ဘာသာစကားများ - en, zh, de, es, fr, ja, it, ko, ru, ar, pt

အသံကို ကူးယူပါ

Developer-First API

OpenAI-ကိုက်ညီ REST API ကို။ တစ်ဦး endpoint, 22+ မော်ဒယ်များ။ အစစ်အမှန်အချိန် application များအတွက် streaming ထောက်ခံမှု။

  • OpenAI-ကိုက်ညီသော ပုံစံ
  • အစစ်အမှန်အချိန် အက်ပလီကေးရှင်းများအတွက် TTS စီးဆင်းမှု
  • ကြီးမားသောအလုပ်များအတွက် batch စီမံခန့်ခွဲမှု
  • Webhook အသိပေးချက်များ
API စာရွက်စာတမ်းများကြည့်ရှု
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ရိုးရှင်းသော, ပွင့်လင်းမြင်သာသောစျေးနှုန်း

အခမဲ့စတင်ပါ. သင်ကြီးထွားအဖြစ်စကေး.

အခမဲ့

$0

15,000 စာလုံး + 5,000/နေ့

  • 7 Kokoro အပါအဝင်အခမဲ့မော်ဒယ်များ
  • 5,000 chars တစ်မျိုးဆက်
  • API ဝင်ရောက်ခွင့်ပါဝင်သည်
အခမဲ့ Sign Up

စတင်သူ

$9/မတ်လ

500 ခရက်ဒစ် / လ

  • အားလုံး 22+ မော်ဒယ်များ
  • မျိုးဆက်တစ်ဦးလျှင် 100,000 chars
  • အသံခိုးယူခြင်း
စတင်ပါ
အကြိုက်ဆုံး

ပရော်ဖက်ရှင်နယ်

$29/မတ်လ

2,000 ခရက်ဒစ် / လ

  • Starter တွင်ရှိသောအရာအားလုံး
  • API ဝင်ရောက်ခွင့်
  • အရေးအကြီးဆုံး လုပ်ဆောင်ချက်
Pro ကို Get

စီးပွားရေး

$99/မတ်လ

10,000 ခရက်ဒစ် / လ

  • Pro တွင်အားလုံး
  • အများသုံး API
  • ရှေ့တန်းတင် တန်းစီ
စီးပွားရေးလုပ်ငန်း Get

စာလုံးအစုံများအပါအဝင် အစီအစဉ်အားလုံးကိုကြည့်ပါ →

မေးလေ့ရှိသောမေးခွန်းများ

TTS.ai သည် 22+ text-to-speech models, voice cloning, speech-to-text, နှင့် audio tools များကို ပေးစွမ်းနိုင်သော အလွန်ကျယ်ပြန့်သော AI voice platform တစ်ခုဖြစ်သည်။ အားလုံးသော model များသည် ရောင်းချသူ lock-in မရှိဘဲ open source များဖြစ်သည်။

ဟုတ်ကဲ့! TTS.ai Kokoro, Piper, VITS နှင့် MeloTTS မော်ဒယ်များနှင့်အတူအခမဲ့စာသား-to-စကားပြောကိုပေးသည်။ အကောင့်လိုအပ်ခြင်းမရှိပါ။ 15,000 အခမဲ့စာလုံးများနှင့်မော်ဒယ်အားလုံးကိုဝင်ရောက်ခွင့်ရရန်မှတ်ပုံတင်ပါ။ ပေးချေထားသောအစီအစဉ်များသည် $9 / လတွင်စတင်သည်။

အမြန်နှုန်းအတွက်, Kokoro သို့မဟုတ် Piper ကိုသုံးပါ. အရည်အသွေးအတွက်, CosyVoice ကို2သို့မဟုတ် StyleTTS ကို2စမ်း. အသံကို clone များအတွက်, Chatterbox ကိုသုံးပါသို့မဟုတ် GPT-SoVITS. စကားပြောများအတွက်, Dia TTS ကိုသုံးပါ. စာသားတူတူကိုနှိုင်းယှဉ်ရန်အမျိုးမျိုးသောပုံစံများကိုစမ်း.

ဟုတ်ကဲ့. TTS အတွက် OpenAI-ကိုက်ညီ REST API ကို, STT, အသံကို cloning, နှင့်အသံ tools တွေကို. အခမဲ့အပါအဝင်အားလုံးအစီအစဉ်ပေါ်တွင်ပါဝင်သည်, အဆင့်အားဖြင့် scale နှုန်းကန့်သတ်ချက်နှင့်အတူ (အခမဲ့: 10 req / min, Lite ကို: 20, Starter ကို: 30, Pro ကို: 60, စီးပွားရေးလုပ်ငန်း: 300). tts.ai/api/ မှာစာရွက်စာတမ်းများကိုကြည့်ရှု.

CosyVoice 2, StyleTTS 2, နှင့် Chatterbox ကဲ့သို့သောပရီမီယံမော်ဒယ်များသည်သဘာဝအသံထွက်နှင့်စိတ်ခံစားမှုနှင့်အတူလူသားအရည်အသွေးရှိသောစကားပြောခြင်းကိုထုတ်လုပ်သည်။ Kokoro ကဲ့သို့သောအခမဲ့မော်ဒယ်များသည်အများဆုံးအသုံးပြုမှုအတွက်အရည်အသွေးကောင်းများကိုပေးသည်။

TTS.ai ၎င်း၏ပုံစံစာကြည့်တိုက်အနှံ့ 30+ ဘာသာစကားများထောက်ခံ. အင်္ဂလိပ်ဘာသာစကားသည်အကြီးဆုံးပုံစံထောက်ခံမှုရှိပါတယ်, ဒါပေမယ့် CosyVoice ကဲ့သို့သောပုံစံများ2တရုတ်, ဂျပန်, နှင့်ကမ္ဘာ့ဖလားကိုဖုံးလွှမ်း; GPT-SoVITS တရုတ်, ဂျပန်, ကိုရီးယား, နှင့်အင်္ဂလိပ်စကားပြောကိုင်တွယ်; နှင့် MeloTTS အင်္ဂလိပ်, စပိန်, ပြင်သစ်, တရုတ်, ဂျပန်, နှင့်ကမ္ဘာ့ဖလားကိုထောက်ခံ.

ဟုတ်ကဲ့. အားလုံး processing ကျွန်တော်တို့ရဲ့ရည်ရွယ် GPU ဆာဗာများပေါ်တွင်ဖြစ်ပျက်. ကျနော်တို့သင်၏စာသား input ကိုသို့မဟုတ်ပေးပို့ပြီးနောက် generated audio ကိုသိမ်းဆည်းမထား. ကူးယူအတွက် uploaded အသံနမူနာလက်ရှိ session ကိုအတွက်သာအသုံးပြုကြပြီးထိန်းသိမ်းထားကြသည်မဟုတ်. ကျနော်တို့တတိယပါတီများနှင့်အတူသင်၏ဒေတာမျှဝေသို့မဟုတ်မော်ဒယ်များလေ့ကျင့်ဖို့အသုံးပြုခြင်းမပြု.

ဟုတ်ကဲ့. အပေါ် generated အားလုံးအသံ TTS.ai စီးပွားရေးလုပ်ငန်းသုံးဖို့သင့်ရဲ့ဖြစ်ပါသည်, YouTube ကိုဗီဒီယိုများအတွက်အပါအဝင်, podcasts, audiobooks, apps များ, ကြော်ငြာများ, နှင့်ထုတ်ကုန်များ. ကျွန်တော်တို့ရဲ့မော်ဒယ်များခွင့်ပြုလိုင်စင်အောက်တွင်ဖွင့်အရင်းအမြစ်ဖြစ်ကြသည် (MIT, Apache 2.0). royalties သို့မဟုတ် attribution လိုအပ်.

TTS.ai အမြင့်ဆုံးအရည်အသွေးအတွက် default အားဖြင့် WAV format နဲ့အသံဖိုင်များကို generates. သင် MP3 သို့ပြောင်းနိုင်ပါတယ်, FLAC, OGG, သို့မဟုတ်ကျွန်တော်တို့ရဲ့အခမဲ့ Audio Converter tool ကိုအသုံးပြုပြီး M4A. အဆိုပါ API ကိုတောင်းဆိုချက်မှာတိုက်ရိုက်သင့်ရဲ့အလိုရှိ output ကို format ကိုသတ်မှတ်ထောက်ခံ.

တိုတောင်းတဲ့ အသံနမူနာတစ်ခုကို တင်သွင်းပါ (5 စက္ကန့်လောက်ပဲ) သင် ကူးယူလိုတဲ့ အသံကို ရိုက်ထည့်ပါ၊ ထို့နောက် ထိုအသံတွင် စကားပြောရန် မည်သည့် စာသားကိုမဆို ရိုက်ထည့်ပါ။ Chatterbox, GPT-Sovits, နှင့် CosyVoice2ကဲ့သို့သော ပုံစံများဖြင့် ကူးယူနိုင်ပါသည်။ ကူးယူထားသော အသံသည် အသံအသံ၊ အသံထွက်နှင့် စကားပြောပုံကို ရိုက်ယူနိုင်ပါသည်။

အခမဲ့မော်ဒယ်များ (Kokoro, Piper, VITS, MeloTTS) အကောင့်မရှိလိုအပ်ပြီးကုန်ကျစရိတ် Zero characters များ. စံမော်ဒယ်များ (2,000 characters/1K input) Bark, CosyVoice 2, F5-TTS, နှင့် Dia ပါဝင်သည်။ ပရီမီယံမော်ဒယ်များ (4,000 characters/1K input) OpenVoice, Chatterbox, StyleTTS 2, နှင့် Tortoise ပါဝင်သည်။ ပေးဆောင်မော်ဒယ်များအများအားဖြင့်အရည်အသွေးပိုမိုမြင့်မားပေး, ပိုမိုအသံများ, နှင့်အသံ clone ကဲ့သို့အပိုဆောင်း features များကို.

ဟုတ်ကဲ့. အဆိုပါ API ကိုစကားပြောဖို့စာသား၏ကြီးမားတဲ့အရေအတွက်ကိုပြောင်းလဲဖို့အတွက် batch processing ကိုထောက်ခံ. များစွာသောတောင်းဆိုမှုများကိုတင်သွင်းနှင့်အလုပ် UUIDs ကိုအသုံးပြုခြင်းဖြင့် asynchronously ရလဒ်များကိုရယူ. စီးပွားရေးလုပ်ငန်းအစီအစဉ် ($99 / လ) နှင့်အထက်ပိုမိုမြန်ဆန် batch processing အတွက်အလိုအလျောက်တန်းဝင်ရောက်ခွင့်ပါဝင်သည်. အသံစာအုပ်ထုတ်လုပ်မှုအတွက်အလွန်ကောင်းသော, သင်တန်းအကြောင်းအရာ, နှင့်ကြီးမားတဲ့-scale voiceover စီမံကိန်းများ.
4.1/5 (42)

ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။

AI Voice ကို ယနေ့စတင်အသုံးပြုပါ

ဖန်တီးသူများ, developer များ, နှင့်အသုံးပြုခြင်း TTS.ai စီးပွားရေးလုပ်ငန်းများ join