လွတ်လပ်သော AI စာသားမှစကားပြော

31+ open-source မော်ဒယ်များ, 231+ အသံများ, 34+ ဘာသာစကားများ. အဘယ်သူမျှမအကောင့်လိုအပ်.

8K+
ဖန်တီးသူများ
30K+
မျိုးဆက်များ
31+
AI ပုံစံများ
231+
အသံများ
0/500 အက္ခရာများ · Sign up for 5,000 per generation → အခမဲ့
TTS.ai ကိုချစ်ပါသလား?

Voice AI အတွက်လိုအပ်သောအရာအားလုံး

30+ open-source AI မော်ဒယ်များမှ powered tools များ

31+ AI အသံပုံစံများ

တစ်ခုတည်းသော platform တွင်ပွင့်လင်း-source TTS ပုံစံများ၏အကြီးဆုံးအစုံ

KokoroKokoro Free

Kokoro သည်၎င်း၏အလေးချိန်အတန်းထက်ကောင်းစွာထိုးသွင်းသော 82 သန်း parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်း၏သေးငယ်သောအရွယ်အစားကိုပင်ဖြစ်စေ၊ ၎င်းသည်ထူးခြားစွာသဘာဝနှင့်အသံထွက်ပြောဆိုမှုကိုထုတ်လုပ်သည်။ Kokoro သည်အင်္ဂလိပ်၊ ဂျပန်၊ တရုတ်နှင့်ကမ္ဘာ့ဘာသာစကားများစွာကိုထောက်ခံသည်။

အကောင်းဆုံး: အနည်းဆုံး latency နှင့်အတူအရည်အသွေးမြင့် TTS, streaming applications များ

အခမဲ့စမ်းကြည့်ပါ

PiperPiper Free

Piper သည် VITS နှင့် larynx architectures ကိုအသုံးပြုသော Rhasspy မှတီထွင်ထားသော အလေးချိန်သက်သာသော text-to-speech engine တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်လုံးဝလည်ပတ်ပြီး Edge Devices, အိမ်သုံးစက်ကိရိယာများနှင့် offline TTS ကိုလိုအပ်သော application များအတွက်အလွန်သင့်လျော်သည်။ 30+ ဘာသာစကားများအကြား 100 အသံများဖြင့် Piper သည် Raspberry Pi တွင်ပင်အမှန်တကယ်အချိန်အမြန်နှုန်းဖြင့်သဘာဝအသံထွက်စကားပြောဆိုမှုပေးသည်။ 4.

အကောင်းဆုံး: မြန်ဆန်သော နမူနာများ၊ အသုံးပြုနိုင်မှုနှင့် ထည့်သွင်းထားသော အက်ပလီကေးရှင်းများ

အခမဲ့စမ်းကြည့်ပါ

VITSVITS Free

VITS (end-to-end Text-to-Speech အတွက် adversarial သင်ယူမှုနှင့်အတူ Variation Inference) ဟာလက်ရှိနှစ်ဆင့်မော်ဒယ်များထက်ပိုမိုသဘာဝကျကျအသံထွက်သောအသံကိုထုတ်လုပ်ပေးသောပထမဆုံးအဆင့်မှအဆုံးသတ် TTS နည်းလမ်းတစ်ခုဖြစ်သည်။ သဘာဝကျကျအရည်အသွေးမြင့်မားစေရန်အတွက် သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော သဘာဝကျကျဖြစ်ပေါ်လာသော

အကောင်းဆုံး: သဘာဝကျသော ဘာသာစကားဖြင့် အများသုံး စာသားမှစကားပြော

အခမဲ့စမ်းကြည့်ပါ

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is an multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

အကောင်းဆုံး: ထုတ်လုပ်မှု applications များလိုအပ်ချက်မြန်, ဘာသာစကားစုံ TTS

အခမဲ့စမ်းကြည့်ပါ

OuteTTSOuteTTS Free

OuteTTS မူရင်းဗိသုကာကိုထိန်းသိမ်းထားစဉ်စာသား-to-စကားပြောစွမ်းရည်များနှင့်အတူကြီးမားသောဘာသာစကားမော်ဒယ်များတိုးချဲ့. ဒါဟာ llama.cpp (CPU / GPU) အပါအဝင် backends များစွာကိုထောက်ခံ, Hugging မျက်နှာ Transformers, ExLlamaV2, VLLM, နှင့် Transformers.js ကနေတဆင့်ဘရောက်ဆာကိုပင်ကောက်ချက်ချ. JSON အဖြစ်သိမ်းဆည်းထားသော Speaker profiles များမှတဆင့် zero-shot အသံ cloning features.

အကောင်းဆုံး: Edge ဖြန့်ချိ, browser ကိုအခြေခံ TTS, အနည်းငယ်-resource ပတ်ဝန်းကျင်

အခမဲ့စမ်းကြည့်ပါ

Pocket TTSPocket TTS Free

Kyutai (Moshi ၏ဖန်တီးသူများ) က Pocket TTS သည်၎င်း၏အလေးချိန်ထက်ကောင်းစွာထိုးသွင်းသော compact 100M parameter text-to-speech model တစ်ခုဖြစ်သည်။ ၎င်းသည် CPU ပေါ်တွင်ထိရောက်စွာလည်ပတ်ပြီးတစ်ဦးတည်းသော audio sample မှ zero-shot voice clone ကိုထောက်ပံ့ပြီးသဘာဝ-အသံထွက်စကားပြောဆိုမှုကိုထုတ်လုပ်သည်။

အကောင်းဆုံး: အလေးချိန်နည်းသော ဖြန့်ချိမှု၊ CPU-only ပတ်ဝန်းကျင်၊ အမြန်အသံ ကူးယူခြင်း

အခမဲ့စမ်းကြည့်ပါ

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

အကောင်းဆုံး: Fast lightweight TTS, edge deployment, low-latency applications

အခမဲ့စမ်းကြည့်ပါ

BarkBark Standard

အမှန်တကယ်စကားပြောဆိုမှု၊ ဂီတနှင့် အသံသက်ရောက်မှုများကို ထုတ်လုပ်ပေးသော Transformer-based text-to-audio ပုံစံ။

ဖန်တီးသူ - Suno · လိုင်စင် - MIT

စမ်းကြည့်ပါ

Bark SmallBark Small Standard

မြန်နှုန်းမြင့် inference နှင့်အောက်ခြေမှတ်ဉာဏ်အသုံးပြုမှုနှင့်အတူ Bark ၏အလင်း version ကို။

ဖန်တီးသူ - Suno · လိုင်စင် - MIT

စမ်းကြည့်ပါ

CosyVoice 2CosyVoice 2 Standard

Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။

ဖန်တီးသူ - Alibaba (Tongyi Lab) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Dia TTSDia TTS Standard

ထုတ်လွှင့်သူအကြားသဘာဝစကားပြောဆိုမှုဖန်တီးသော multi-ထုတ်လွှင့်သူစကားပြောခန်းမျိုးဆက်မော်ဒယ်။

ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Parler TTSParler TTS Standard

သင်လိုချင်တဲ့အသံကိုသဘာဝဘာသာစကားနဲ့ဖော်ပြပြီး Parler ကလိုက်ဖက်တဲ့စကားပြောကိုထုတ်လုပ်ပါတယ်။

ဖန်တီးသူ - Hugging Face · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

GLM-TTSGLM-TTS Standard

ပွင့်လင်း-ရင်းမြစ် TTS ပုံစံများအကြားအနည်းဆုံးစာလုံးအမှားနှုန်းကိုရရှိသည်။

ဖန်တီးသူ - Zhipu AI · လိုင်စင် - GLM-4 License

စမ်းကြည့်ပါ

IndexTTS-2IndexTTS-2 Standard

မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS

ဖန်တီးသူ - Index Team · လိုင်စင် - Bilibili Model License

စမ်းကြည့်ပါ

Spark TTSSpark TTS Standard

Voice cloning TTS with controlable emotion and speaking style via prompts.

ဖန်တီးသူ - SparkAudio · လိုင်စင် - CC BY-NC-SA 4.0

စမ်းကြည့်ပါ

GPT-SoVITSGPT-SoVITS Standard

အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.

ဖန်တီးသူ - RVC-Boss · လိုင်စင် - MIT

စမ်းကြည့်ပါ

OrpheusOrpheus Standard

လူ့-အဆင့်ခံစားချက် TTS ပုံစံစကားပြောဒေတာ 100K နာရီအပေါ်လေ့ကျင့်.

ဖန်တီးသူ - Canopy Labs · လိုင်စင် - Llama 3.2 Community

စမ်းကြည့်ပါ

Qwen3 TTSQwen3 TTS Standard

Alibaba ၏ဘာသာစကားများစွာ TTS အသံ clone, preset အသံများ, နှင့်စာသားမှအသံဒီဇိုင်းနှင့်အတူ။

ဖန်တီးသူ - Alibaba (Qwen) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

Chatterbox TurboChatterbox Turbo Standard

ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.

ဖန်တီးသူ - Resemble AI · လိုင်စင် - MIT

စမ်းကြည့်ပါ

Dia 2Dia 2 Standard

multi-ပြောဆိုသူစကားပြောနှင့် paralinguistic အချက်ပြမှုများနှင့်အတူ streaming-ပထမဦးဆုံးစကားပြော TTS.

ဖန်တီးသူ - Nari Labs · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

VoxCPMVoxCPM Standard

Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.

ဖန်တီးသူ - OpenBMB · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

TADATADA Standard

စာသား-acoustic dual alignment နဲ့ Zero-အမြင်အာရုံ TTS, 5x နှိုင်းယှဉ် LLM TTS ထက်ပိုမြန်.

ဖန်တီးသူ - Hume AI · လိုင်စင် - MIT

စမ်းကြည့်ပါ

VibeVoiceVibeVoice Standard

podcasts နှင့်အသံစာအုပ်များကဲ့သို့သောရှည်လျားသောပုံစံ multi-speaker အကြောင်းအရာများအတွက် Microsoft ရဲ့မော်ဒယ်။

ဖန်တီးသူ - Microsoft · လိုင်စင် - MIT

စမ်းကြည့်ပါ

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ဖန်တီးသူ - Alibaba (FunAudioLLM) · လိုင်စင် - Apache 2.0

စမ်းကြည့်ပါ

ChatterboxChatterbox Premium

Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။

အရည်အသွေး -

စမ်းကြည့်ပါ

Tortoise TTSTortoise TTS Premium

အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။

အရည်အသွေး -

စမ်းကြည့်ပါ

StyleTTS 2StyleTTS 2 Premium

ပုံစံဖြန့်ချိခြင်းနှင့် ရန်သူ့ဘက်မှ လေ့ကျင့်ခြင်းမှတစ်ဆင့် လူ့အဆင့် စာသားမှစကားပြောခြင်း။

အရည်အသွေး -

စမ်းကြည့်ပါ

OpenVoiceOpenVoice Premium

ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။

အရည်အသွေး -

စမ်းကြည့်ပါ

Sesame CSMSesame CSM Premium

သင့်လျော်သောအချိန်နှင့်စိတ်ခံစားမှုနှင့်အတူသဘာဝစကားပြောဆိုမှုထုတ်လုပ် Conversational စကားပြောပုံစံ။

အရည်အသွေး -

စမ်းကြည့်ပါ

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

အရည်အသွေး -

စမ်းကြည့်ပါ

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

အရည်အသွေး -

စမ်းကြည့်ပါ

CosyVoice 2CosyVoice 2

Alibaba ၏လူသား-အညီအမျှသဘာဝနှင့်နီးကပ်သော-ဇယား latency နှင့်အတူ scaleable streaming TTS ။

ဘာသာစကားများ - en, zh, ja, ko, fr, de, it, es

အသံကို ကူးယူပါ

GLM-TTSGLM-TTS

ပွင့်လင်း-ရင်းမြစ် TTS ပုံစံများအကြားအနည်းဆုံးစာလုံးအမှားနှုန်းကိုရရှိသည်။

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

IndexTTS-2IndexTTS-2

မြင့်မားသော ထုတ်ဖော်ပြောဆိုမှုနှင့် ခံစားမှုထိန်းချုပ်မှုဖြင့် Zero-shot TTS

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

Spark TTSSpark TTS

Voice cloning TTS with controlable emotion and speaking style via prompts.

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

GPT-SoVITSGPT-SoVITS

အနည်းငယ်-ရိုက်ချက်အသံကို cloning TTS တစ်ခုတည်းအသံမှမည်သည့်အသံကို replicates5အသံ၏စက္ကန့်.

ဘာသာစကားများ - en, zh, ja, ko

အသံကို ကူးယူပါ

ChatterboxChatterbox

Resemble AI မှ စိတ်ခံစားမှုထိန်းချုပ်မှုနှင့်အတူ ခေတ်မီသော zero-shot အသံကူးယူခြင်း။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

Tortoise TTSTortoise TTS

အမျိုးမျိုးသောအသံများဖြင့် စာသားမှစကားပြောခြင်းသည် autoregressive architecture နှင့်အတူအရည်အသွေးကိုအာရုံစိုက်သည်။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

OpenVoiceOpenVoice

ပုံစံ, ခံစားချက်, နှင့်အသံထွက်အပေါ် granular ထိန်းချုပ်မှုနှင့်အတူချက်ချင်းအသံ cloning ။

ဘာသာစကားများ - en, zh, ja, ko, fr, de, es, it

အသံကို ကူးယူပါ

Qwen3 TTSQwen3 TTS

Alibaba ၏ဘာသာစကားများစွာ TTS အသံ clone, preset အသံများ, နှင့်စာသားမှအသံဒီဇိုင်းနှင့်အတူ။

ဘာသာစကားများ - en, zh, ja, ko, de, fr, ru, pt, es, it

အသံကို ကူးယူပါ

Chatterbox TurboChatterbox Turbo

ရယ်မောခြင်း, ချောင်းဆိုး, နှင့်ပိုမိုများအတွက် sub-200ms latency နှင့် paralinguistic tags များနှင့်အတူပိုမိုမြန်ဆန် Chatterbox.

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

VoxCPMVoxCPM

Tokenizer-အခမဲ့ TTS 44.1kHz audio ကို context-အသိအမှတ်ပြုပုဒ်မတည်ငြိမ်မှုနှင့်အတူထုတ်လုပ်.

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

OuteTTSOuteTTS

LLM-based TTS ဟာ CPU, GPU, llama.cpp နဲ့ Transformers.js ကနေတဆင့် browser ပေါ်မှာ run တဲ့။

ဘာသာစကားများ - en

အသံကို ကူးယူပါ

Pocket TTSPocket TTS

တစ်ခုတည်းသောနမူနာမှအသံ clone နှင့်အတူ Kyutai အားဖြင့်အလေးချိန် 100M parameter ကိုမော်ဒယ်။

ဘာသာစကားများ - en, fr

အသံကို ကူးယူပါ

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ဘာသာစကားများ - en, zh, ja, ko, de, es, fr, it, ru

အသံကို ကူးယူပါ

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ဘာသာစကားများ - en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

အသံကို ကူးယူပါ

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ဘာသာစကားများ - en, zh

အသံကို ကူးယူပါ

Developer-First API

OpenAI-ကိုက်ညီ REST API ကို။ တစ်ဦး endpoint, 22+ မော်ဒယ်များ။ အစစ်အမှန်အချိန် application များအတွက် streaming ထောက်ခံမှု။

  • OpenAI-ကိုက်ညီသော ပုံစံ
  • အစစ်အမှန်အချိန် အက်ပလီကေးရှင်းများအတွက် TTS စီးဆင်းမှု
  • ကြီးမားသောအလုပ်များအတွက် batch စီမံခန့်ခွဲမှု
  • Webhook အသိပေးချက်များ
API စာရွက်စာတမ်းများကြည့်ရှု
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ရိုးရှင်းသော, ပွင့်လင်းမြင်သာသောစျေးနှုန်း

အခမဲ့စတင်ပါ. သင်ကြီးထွားအဖြစ်စကေး.

အခမဲ့

$0

15 ခရက်ဒစ်

  • Kokoro, Piper, VITS, MeloTTS
  • 500 အက္ခရာ အမြင့်ဆုံး
  • 3 gen / နာရီ (အကောင့်မရှိ)
အခမဲ့ Sign Up

စတင်သူ

$9/မတ်လ

500 ခရက်ဒစ် / လ

  • အားလုံး 22+ မော်ဒယ်များ
  • မျိုးဆက်တစ်ဦးလျှင် 100,000 chars
  • အသံခိုးယူခြင်း
စတင်ပါ
အကြိုက်ဆုံး

ပရော်ဖက်ရှင်နယ်

$29/မတ်လ

2,000 ခရက်ဒစ် / လ

  • Starter တွင်ရှိသောအရာအားလုံး
  • API ဝင်ရောက်ခွင့်
  • အရေးအကြီးဆုံး လုပ်ဆောင်ချက်
Pro ကို Get

စီးပွားရေး

$99/မတ်လ

10,000 ခရက်ဒစ် / လ

  • Pro တွင်အားလုံး
  • အများသုံး API
  • ရှေ့တန်းတင် တန်းစီ
စီးပွားရေးလုပ်ငန်း Get

စာလုံးအစုံများအပါအဝင် အစီအစဉ်အားလုံးကိုကြည့်ပါ →

မေးလေ့ရှိသောမေးခွန်းများ

TTS.ai သည် 22+ text-to-speech models, voice cloning, speech-to-text, နှင့် audio tools များကို ပေးစွမ်းနိုင်သော အလွန်ကျယ်ပြန့်သော AI voice platform တစ်ခုဖြစ်သည်။ အားလုံးသော model များသည် ရောင်းချသူ lock-in မရှိဘဲ open source များဖြစ်သည်။

ဟုတ်ကဲ့! TTS.ai Kokoro, Piper, VITS နှင့် MeloTTS မော်ဒယ်များနှင့်အတူအခမဲ့စာသား-to-စကားပြောကိုပေးသည်။ အကောင့်လိုအပ်ခြင်းမရှိပါ။ 15,000 အခမဲ့စာလုံးများနှင့်မော်ဒယ်အားလုံးကိုဝင်ရောက်ခွင့်ရရန်မှတ်ပုံတင်ပါ။ ပေးချေထားသောအစီအစဉ်များသည် $9 / လတွင်စတင်သည်။

အမြန်နှုန်းအတွက်, Kokoro သို့မဟုတ် Piper ကိုသုံးပါ. အရည်အသွေးအတွက်, CosyVoice ကို2သို့မဟုတ် StyleTTS ကို2စမ်း. အသံကို clone များအတွက်, Chatterbox ကိုသုံးပါသို့မဟုတ် GPT-SoVITS. စကားပြောများအတွက်, Dia TTS ကိုသုံးပါ. စာသားတူတူကိုနှိုင်းယှဉ်ရန်အမျိုးမျိုးသောပုံစံများကိုစမ်း.

ဟုတ်ကဲ့. TTS အတွက် OpenAI-ကိုက်ညီ REST API ကို, STT, အသံကို cloning, နှင့်အသံ tools တွေကို. Pro ($29/mo) နှင့် Enterprise ($99/mo) အစီအစဉ်များပေါ်တွင်ရရှိနိုင်. tts.ai/api/ မှာစာရွက်စာတမ်းများကိုကြည့်ရှု.

CosyVoice 2, StyleTTS 2, နှင့် Chatterbox ကဲ့သို့သောပရီမီယံမော်ဒယ်များသည်သဘာဝအသံထွက်နှင့်စိတ်ခံစားမှုနှင့်အတူလူသားအရည်အသွေးရှိသောစကားပြောခြင်းကိုထုတ်လုပ်သည်။ Kokoro ကဲ့သို့သောအခမဲ့မော်ဒယ်များသည်အများဆုံးအသုံးပြုမှုအတွက်အရည်အသွေးကောင်းများကိုပေးသည်။

TTS.ai ၎င်း၏ပုံစံစာကြည့်တိုက်အနှံ့ 30+ ဘာသာစကားများထောက်ခံ. အင်္ဂလိပ်ဘာသာစကားသည်အကြီးဆုံးပုံစံထောက်ခံမှုရှိပါတယ်, ဒါပေမယ့် CosyVoice ကဲ့သို့သောပုံစံများ2တရုတ်, ဂျပန်, နှင့်ကမ္ဘာ့ဖလားကိုဖုံးလွှမ်း; GPT-SoVITS တရုတ်, ဂျပန်, ကိုရီးယား, နှင့်အင်္ဂလိပ်စကားပြောကိုင်တွယ်; နှင့် MeloTTS အင်္ဂလိပ်, စပိန်, ပြင်သစ်, တရုတ်, ဂျပန်, နှင့်ကမ္ဘာ့ဖလားကိုထောက်ခံ.

ဟုတ်ကဲ့. အားလုံး processing ကျွန်တော်တို့ရဲ့ရည်ရွယ် GPU ဆာဗာများပေါ်တွင်ဖြစ်ပျက်. ကျနော်တို့သင်၏စာသား input ကိုသို့မဟုတ်ပေးပို့ပြီးနောက် generated audio ကိုသိမ်းဆည်းမထား. ကူးယူအတွက် uploaded အသံနမူနာလက်ရှိ session ကိုအတွက်သာအသုံးပြုကြပြီးထိန်းသိမ်းထားကြသည်မဟုတ်. ကျနော်တို့တတိယပါတီများနှင့်အတူသင်၏ဒေတာမျှဝေသို့မဟုတ်မော်ဒယ်များလေ့ကျင့်ဖို့အသုံးပြုခြင်းမပြု.

ဟုတ်ကဲ့. အပေါ် generated အားလုံးအသံ TTS.ai စီးပွားရေးလုပ်ငန်းသုံးဖို့သင့်ရဲ့ဖြစ်ပါသည်, YouTube ကိုဗီဒီယိုများအတွက်အပါအဝင်, podcasts, audiobooks, apps များ, ကြော်ငြာများ, နှင့်ထုတ်ကုန်များ. ကျွန်တော်တို့ရဲ့မော်ဒယ်များခွင့်ပြုလိုင်စင်အောက်တွင်ဖွင့်အရင်းအမြစ်ဖြစ်ကြသည် (MIT, Apache 2.0). royalties သို့မဟုတ် attribution လိုအပ်.

TTS.ai အမြင့်ဆုံးအရည်အသွေးအတွက် default အားဖြင့် WAV format နဲ့အသံဖိုင်များကို generates. သင် MP3 သို့ပြောင်းနိုင်ပါတယ်, FLAC, OGG, သို့မဟုတ်ကျွန်တော်တို့ရဲ့အခမဲ့ Audio Converter tool ကိုအသုံးပြုပြီး M4A. အဆိုပါ API ကိုတောင်းဆိုချက်မှာတိုက်ရိုက်သင့်ရဲ့အလိုရှိ output ကို format ကိုသတ်မှတ်ထောက်ခံ.

တိုတောင်းတဲ့ အသံနမူနာတစ်ခုကို တင်သွင်းပါ (5 စက္ကန့်လောက်ပဲ) သင် ကူးယူလိုတဲ့ အသံကို ရိုက်ထည့်ပါ၊ ထို့နောက် ထိုအသံတွင် စကားပြောရန် မည်သည့် စာသားကိုမဆို ရိုက်ထည့်ပါ။ Chatterbox, GPT-Sovits, နှင့် CosyVoice2ကဲ့သို့သော ပုံစံများဖြင့် ကူးယူနိုင်ပါသည်။ ကူးယူထားသော အသံသည် အသံအသံ၊ အသံထွက်နှင့် စကားပြောပုံကို ရိုက်ယူနိုင်ပါသည်။

အခမဲ့မော်ဒယ်များ (Kokoro, Piper, VITS, MeloTTS) အကောင့်မရှိလိုအပ်ပြီးကုန်ကျစရိတ် Zero characters များ. စံမော်ဒယ်များ (2,000 characters/1K input) Bark, CosyVoice 2, F5-TTS, နှင့် Dia ပါဝင်သည်။ ပရီမီယံမော်ဒယ်များ (4,000 characters/1K input) OpenVoice, Chatterbox, StyleTTS 2, နှင့် Tortoise ပါဝင်သည်။ ပေးဆောင်မော်ဒယ်များအများအားဖြင့်အရည်အသွေးပိုမိုမြင့်မားပေး, ပိုမိုအသံများ, နှင့်အသံ clone ကဲ့သို့အပိုဆောင်း features များကို.

ဟုတ်ကဲ့. အဆိုပါ API ကိုစကားပြောဖို့စာသားအကြီးအကျယ်အရေအတွက်ကိုပြောင်းရွှေ့များအတွက် batch စီမံခန့်ခွဲမှုထောက်ခံ. အများအပြားတောင်းဆိုမှုများကိုတင်သွင်းနှင့်အလုပ် UUIDs ကိုအသုံးပြုခြင်းဖြင့် asynchronously ရလဒ်များကိုရယူ. Enterprise စီမံကိန်းများ ($99/mo) ပိုမိုမြန်ဆန် batch စီမံခန့်ခွဲမှုများအတွက်ရှေ့တန်းတန်းဝင်ရောက်ခွင့်ပါဝင်သည်. အသံစာအုပ်ထုတ်လုပ်မှုအတွက်အသင့်တော်ဆုံး, သင်တန်းအကြောင်းအရာ, နှင့်ကြီးမားသော-scale voiceover စီမံကိန်းများ.
4.1/5 (21)

ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။

AI Voice ကို ယနေ့စတင်အသုံးပြုပါ

ဖန်တီးသူများ, developer များ, နှင့်အသုံးပြုခြင်း TTS.ai စီးပွားရေးလုပ်ငန်းများ join