Open Source စာသားမှစကားပြောပုံစံများ

MIT, Apache 2.0 - အဘယ်သူမျှမပိုင်ဆိုင်မှု lock-in, အဘယ်သူမျှမအသုံးပြုမှုကန့်သတ်ချက်များ, အဘယ်သူမျှမအံ့သြဖွယ်လိုင်စင်ကြေး. ကျွန်တော်တို့ရဲ့ hosting API ကိုမှတဆင့်သူတို့ကိုသုံးပါ, သို့မဟုတ်အပြည့်အဝထိန်းချုပ်မှုနှင့်အတူသင်၏ကိုယ်ပိုင်အခြေခံအဆောက်အအုံပေါ်တွင်သူတို့ကို Self-host.

ရင်းမြစ် ဖွင့်ပါ MIT လိုင်စင် Apache 2.0 ကိုယ်တိုင်-တည်ဆောက်နိုင် GitHub တွင်

အခုစမ်းကြည့်ပါ

Kokoro, Piper, VITS, MeloTTS နှင့်အတူအခမဲ့
သင့်ထုတ်လုပ်ထားသော အသံဖိုင်သည်ဒီနေရာတွင်ပေါ်လာမည်
ဖန်တီးခဲ့သည်
ဒေါင်းလုပ်လုပ်
TTS.ai ကိုချစ်ပါသလား?

Open Source TTS အကျိုးကျေးဇူးများ

သင့်ပရောဂျက်များအတွက် ပွင့်လင်းသော ရင်းမြစ်များ လိုအပ်ခြင်း၏ အကြောင်းရင်း

အားလုံး Open-Source လိုင်စင်

TTS.ai ပေါ်တွင်တိုင်းမော်ဒယ်တစ်ဦးခွင့်ပြုချက်ပွင့်လင်း-source လိုင်စင်ကိုအသုံးပြုသည်။ အဘယ်သူမျှမပိုင်ဆိုင်မှုအနက်ရောင်သေတ္တာများ, အဘယ်သူမျှမရောင်းချသူ lock-in, အဘယ်သူမျှမမျှော်လင့်မထားတဲ့လိုင်စင်ကြေး.

MIT / Apache 2.0

ပုံစံများ MIT သို့မဟုတ် Apache 2.0, အများဆုံးခွင့်ပြုချက်ပွင့်လင်း-source လိုင်စင်အောက်တွင်လိုင်စင်ချထားကြသည်။ စီးပွားရေးလုပ်ငန်းသုံး, ပြုပြင်, redistribute — စည်းမျဉ်းစည်းကမ်းမရှိ။

ကိုယ်တိုင်-တည်ဆောက်နိုင်

မည်သည့်မော်ဒယ်ကို download လုပ်ပြီးသင်၏ကိုယ်ပိုင် hardware ကိုအပေါ် run. သင့်ရဲ့ဒေတာ, latency, နှင့်အခြေခံအဆောက်အအုံအပေါ်အပြည့်အဝထိန်းချုပ်မှု. လိုအပ်သော cloud ကိုမှီခို.

GPU အကောင်းဆုံး

အများစုမှာမော်ဒယ်များထိရောက်သော inference အတွက် 2-8GB VRAM လိုအပ်.

ရပ်ရွာထိန်းသိမ်း

Contributions welcome — submit bugs, improvements, and new voices on GitHub.

စီးပွားရေးလုပ်ငန်းသုံး OK ကို

ကုန်ပစ္စည်းများတည်ဆောက်, ဝန်ဆောင်မှုများကိုရောင်းချ, နှင့် royalties သို့မဟုတ်အသုံးပြုမှုအခကြေးငွေမရှိဘဲကုန်သွယ်ရေးအကြောင်းအရာကိုဖန်တီး.

ကျွန်တော်တို့ရဲ့ Open Source ကို Model ကို Catalog

အားလုံးမော်ဒယ်, ၎င်း၏လိုင်စင်, နှင့်အကောင်းဆုံးလုပ်နေတာဘာလဲ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

အကောင်းဆုံး: Apache 2.0 — အကောင်းဆုံးအရည်အသွေးအခမဲ့မော်ဒယ်, 82M params, self-host ကိုလွယ်ကူ

စမ်းကြည့်ပါ Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

အကောင်းဆုံး: MIT — CPU ကို-သာ, Edge ကိရိယာများနှင့်ထည့်သွင်း self-hosting အတွက်ပြီးပြည့်စုံသော

စမ်းကြည့်ပါ Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

အကောင်းဆုံး: MIT — များစွာသော downstream မော်ဒယ်များအသုံးပြု foundational architecture

စမ်းကြည့်ပါ VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

အကောင်းဆုံး: MIT — စံ TTS ကျော်ထူးခြားတဲ့အသံမျိုးဆက်စွမ်းဆောင်ရည်

စမ်းကြည့်ပါ Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 အသံခိုးယူခြင်း

အကောင်းဆုံး: Apache 2.0 — အမြင့်ဆုံးအရည်အသွေး, အကျယ်တဝင့်လေ့လာအညွှန်းကိန်းအကောင်အထည်ဖော်

စမ်းကြည့်ပါ Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 အသံခိုးယူခြင်း

အကောင်းဆုံး: MIT — granular ပုံစံထိန်းချုပ်မှုနှင့်အတူ open-source အသံကို cloning

စမ်းကြည့်ပါ OpenVoice

Open Source TTS ကိုအသုံးပြုခြင်း

ကျွန်တော်တို့ရဲ့ host ကို API ကိုသုံးပါသို့မဟုတ်ကိုယ်ပိုင်မော်ဒယ်များ run

1

ပွင့်လင်း-ရင်းမြစ်မော်ဒယ်များကိုစူးစမ်း

20+ open-source TTS မော်ဒယ်များ၏ကျွန်တော်တို့ရဲ့ catalog ကိုရှာဖွေပါ။ တစ်ခုချင်းစီကိုမော်ဒယ်စာမျက်နှာလိုင်စင်ကိုပြသ, ဗိသုကာ, စွမ်းဆောင်ရည်, နှင့်ကိုယ်ပိုင်-hosting လိုအပ်ချက်များကို။

2

သင့်ရဲ့ Browser မှာစမ်းကြည့်ပါ

ဘာမှ install မပါဘဲ TTS.ai အပေါ်တိုက်ရိုက်မည်သည့်မော်ဒယ်ကိုစမ်းသပ်ပါ။ ကျွန်ုပ်တို့၏ GPU ဆာဗာများ processing ကိုကိုင်တွယ်ခြင်းအားဖြင့်သင်သည် self-hosting ကိုကြိုးပမ်းခြင်းမပြုမီအရည်အသွေးကိုအကဲဖြတ်နိုင်သည်။

3

Self-Host ကိုသို့မဟုတ်ကျွန်တော်တို့ရဲ့ API ကိုအသုံးပြုပါ

GitHub မှ clone မော်ဒယ် repos နှင့်ဒေသခံ run, သို့မဟုတ်ထုတ်လုပ်မှုအတွက်ကျွန်တော်တို့ရဲ့ hosting API ကိုသုံးပါ. Self-hosting အပြည့်အဝထိန်းချုပ်မှုပေးသည်; ကျွန်တော်တို့ရဲ့ API ကိုစီမံခန့်ခွဲအခြေခံအဆောက်အအုံပေးသည်။

4

သင်၏ application ကိုတည်ဆောက်ပါ

သင့်ရဲ့ထုတ်ကုန်ကိုအသုံးပြုပြီး TTS ကိုပေါင်းစပ် Self-hosted မော်ဒယ်များသို့မဟုတ်ကျွန်တော်တို့ရဲ့ REST API ကို။ အားလုံးမော်ဒယ်များလိုင်စင်အခကြေးငွေသို့မဟုတ် royalties ဖြင့်စီးပွားရေးလုပ်ငန်းသုံးနိုင်သည်မဟုတ်ကြပါဘူး။

လိုင်စင်နှိုင်းယှဉ်ခြင်း

TTS.ai အပေါ်အားလုံးမော်ဒယ်များစီးပွားရေးလုပ်ငန်း-ဖော်ရွေဖွင့်-source လိုင်စင်ကိုအသုံးပြု

မော်ဒယ် လိုင်စင် ကုန်သွယ်ရေးအသုံးပြုမှု ပြုပြင်ခြင်း ကိုယ်ပိုင်ဟိုတယ် အမည်ပေးခြင်း
Kokoro Apache 2.0 လိုအပ်သည်
Piper MIT ရွေးစရာ
VITS MIT ရွေးစရာ
MeloTTS MIT ရွေးစရာ
Chatterbox MIT ရွေးစရာ
Tortoise TTS Apache 2.0 လိုအပ်သည်
StyleTTS 2 MIT ရွေးစရာ
OpenVoice MIT ရွေးစရာ
Sesame CSM Apache 2.0 လိုအပ်သည်
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API ကို

သင့်ကိုယ်သင် ပုံစံများကို လုပ်ဆောင်ပါ သို့မဟုတ် အခြေခံအဆောက်အအုံကို ကျွန်တော်တို့ ကိုင်တွယ်ပါ

သင့်ရဲ့ Hardware ပေါ်မှာ Self-Host

TTS.ai အပေါ်တိုင်းမော်ဒယ် GitHub သို့မဟုတ် Hugging မျက်နှာပေါ်တွင်ပွင့်လင်းအရင်းအမြစ်စီမံကိန်းအဖြစ်ရရှိနိုင်ပါသည်. အဆိုပါအလေးချိန်ဒေါင်းလုပ်, dependencies ကို install လုပ်ပါ, နှင့်သင်၏ကိုယ်ပိုင် GPU များပေါ်တွင်အယူအဆကို run. သငျသညျ latency ကျော်အပြည့်အဝထိန်းချုပ်မှုရှိပါတယ်, ပုဂ္ဂလိက, နှင့် scaling.

  • အပြည့်အဝဒေတာပုဂ္ဂလိက - အသံသည်သင်၏ဆာဗာထွက်ခွာဘယ်တော့မှ
  • ပထမဦးဆုံး setup ပြီးနောက် per-request ကုန်ကျစရိတ်မရှိ
  • သင့်ကိုယ်ပိုင်ဒေတာအပေါ် custom fine-tuning
  • GPU ဟာ့ဒ်ဝဲလိုအပ် (NVIDIA အကြံပြု)
  • update, scaling နှင့် dependencies များကို စီမံခန့်ခွဲပါ

TTS.ai Hosted API ကိုအသုံးပြုခြင်း

တစ်ခုတည်းသော REST API ကိုမှတဆင့်အားလုံး 20+ မော်ဒယ်များချက်ချင်း access ကိုရယူပါ. ကျနော်တို့ GPU ကိုထောက်ပံ့ရေး, မော်ဒယ်အသစ်များ, တန်းစီစီမံခန့်ခွဲမှုနှင့် scale ကိုကိုင်တွယ်. တစ်ခု API ကိုကဒ်ကိုသင်တိုင်းမော်ဒယ်ကို access ကိုပေးသည် - သီးခြားဖြန့်ချိစီမံခန့်ခွဲရန်မလိုပါ.

  • GPU ဟာ့ဒ်ဝဲ မလိုအပ်ပါ
  • အားလုံး 20+ တစ်ခု API ကိုမှတဆင့်မော်ဒယ်များ
  • အလိုအလျောက်မော်ဒယ်အသစ်တင်ခြင်းနှင့်တိုးတက်ကောင်းမွန်ရေး
  • 99.9% အဆက်မပြတ်အဆောက်အအုံနှင့်အတူ
  • သင်အသုံးပြုသောအရာများအတွက်သာပေးချေပါ

မြန်စတင်: API ကိုသို့မဟုတ် Self-Host ကို

ကျွန်တော်တို့ရဲ့ hosting API ကိုအသုံးပြုပါ, သို့မဟုတ်မိနစ်အတွင်း Kokoro အတွင်းပိုင်း install

ရွေးချယ်စရာ 1: TTS.ai Hosted API ကို လွယ်ကူဆုံး
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
ရွေးချယ်စရာ 2: pip နဲ့ Self-Host ကို ထိန်းချုပ်မှုအပြည့်
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Source, တတ်နိုင်သောစျေးနှုန်း

ကျွန်တော်တို့ရဲ့ hosting API ကို GPUs မစီမံခန့်ခွဲဘဲပွင့်လင်း-source TTS ရရှိနိုင်စေသည်။

လွတ်လပ်သော အဆင့်

$0

15 မှတ်ပုံတင်အပေါ်ခရက်ဒစ်

  • 4 open-source ကိုမော်ဒယ်များအခမဲ့
  • အခြေခံအသုံးပြုမှုအတွက် မှတ်ပုံတင်ခြင်းမရှိပါ
  • ကုန်သွယ်ရေးအသုံးပြုမှုခွင့်ပြု

စတင်သူ

$9

500,000 စာလုံး / လ

  • အားလုံး 20+ ပွင့်လင်း-source မော်ဒယ်များ
  • အသံကို ကူးယူခြင်း
  • API ဝင်ရောက်ခွင့်

ပရို

$29

2,000,000 စာလုံး/လ

  • GPU စီမံခြင်းကို အရင်လုပ်
  • အားလုံးပရီမီယံမော်ဒယ်များ
  • လုပ်ငန်းထောက်ပံ့မှု
View အပြည့်အဝစျေးနှုန်းများ

မေးလေ့ရှိသောမေးခွန်းများ

ဖွင့်လှစ် source ကိုစာသားကိုစကားပြောအကြောင်းကိုရိုးရှင်းတဲ့မေးခွန်းတွေ

ဟုတ်ကဲ့. TTS.ai အပေါ်တိုင်းမော်ဒယ်တစ်ခုခွင့်ပြုချက်ဖွင့်-source လိုင်စင်ကိုအသုံးပြုသည် — MIT သို့မဟုတ် Apache 2.0. ကျနော်တို့တိကျစွာကန့်သတ်လိုင်စင်များနှင့်အတူမော်ဒယ်များကိုဖယ်ရှား (Coqui ရဲ့ CPML သို့မဟုတ်စီးပွားရေးလုပ်ငန်းမဟုတ် CC-BY-NC ကဲ့သို့). သင်သည်၎င်း၏ GitHub repository ပေါ်တွင်တစ်ဦးချင်းစီမော်ဒယ်၏လိုင်စင်ကိုစစ်ဆေးနိုင်သည်။

Apache 2.0 ရှင်းလင်းသောပုဂ္ဂလိကလိုင်စင်များကိုထည့်သွင်းပြီးသင်ကကုဒ်ကိုပြုပြင်ပါကပြောင်းလဲမှုများကိုဖော်ပြရန်လိုအပ်သည်။ MIT သည်လိုအပ်ချက်နည်းပါးသောလိုအပ်ချက်များနှင့်အတူရိုးရှင်းသည်။ နှစ် ဦး စလုံးစီးပွားရေးလုပ်ငန်းဖော်ရွေသည်။

ဟုတ်ကဲ့. အားလုံးမော်ဒယ် Self-hosted နိုင်ပါတယ်. GitHub မှမော်ဒယ် repository ကို clone, တည်ငြိမ်မှု install, မော်ဒယ်အလေးချိန် download လုပ်ပါ, နှင့်အယူအဆကို run. ကျနော်တို့ GPU, RAM, နှင့် Python ကိုဗားရှင်းအပါအဝင်တစ်ဦးချင်းစီမော်ဒယ်၏ Self-hosting လိုအပ်ချက်များကိုများအတွက်စာရွက်စာတမ်းများပေးအပ်.

လိုအပ်ချက်များကိုမော်ဒယ်အလိုက်ကွဲပြားခြားနား. Piper GPU ကိုမလိုအပ်ပါဘူး (CPU ကိုသာ). Kokoro နှင့် MeloTTS 1-2GB VRAM ကိုလိုအပ်. အများဆုံးစံမော်ဒယ်များ 4GB VRAM ကိုလိုအပ်. Tortoise နှင့် Sesame CSM ကို 8GB ကိုလိုအပ်. An NVIDIA RTX 3060 (12GB) အများဆုံးမော်ဒယ်များအဆင်ပြေစွာ run နိုင်ပါတယ်.

ဟုတ်ကဲ့. open-source လိုင်စင်များ fine-tuning အပါအဝင်ပြုပြင်ပြောင်းလဲမှုခွင့်ပြု. GPT-SoVITS နှင့် Bark ကဲ့သို့သောမော်ဒယ်များ fine-tuning scripts များကိုပေးအပ်. သင်သည်သင်၏ကိုယ်ပိုင်အသံဒေတာပေါ်တွင်မော်ဒယ်များကိုလေ့ကျင့်နိုင်သည် custom voices များကိုဖန်တီးရန်သို့မဟုတ်တိကျသောဘာသာစကားများအတွက်စွမ်းဆောင်ရည်ကိုတိုးတက်ကောင်းမွန်စေရန်.

Top open-source မော်ဒယ်များ (Kokoro, StyleTTS 2, Chatterbox) ယခုအရည်အသွေးစံချိန်စံညွှန်းများတွင် ElevenLabs နှင့် Google TTS ကဲ့သို့သောကုန်သွယ်ရေးဝန်ဆောင်မှုများကိုချိန်ညှိသို့မဟုတ်ကျော်လွန်သည်။ ကုန်သွယ်ရေးဝန်ဆောင်မှုများ၏အဓိကအားသာချက်မှာစီမံခန့်ခွဲမှုအခြေခံအဆောက်အအုံနှင့်ပံ့ပိုးမှုဖြစ်ပြီးအသံအရည်အသွေးမဟုတ်ပါ။

XTTS / XTTS-v2 (Coqui ရဲ့ CPML - စီးပွားရေးလုပ်ငန်းမဟုတ်သော), F5-TTS (CC-BY-NC - စီးပွားရေးလုပ်ငန်းမဟုတ်သော), နှင့် Higgs-v2 (Boson လိုင်စင် - စည်းမျဉ်း) အားလုံးဖယ်ရှားခဲ့ကြသည်။ အပေါ်တိုင်းမော်ဒယ် TTS.ai စီးပွားရေးလုပ်ငန်း-အသုံးပြုမှုလုံခြုံရေးစစ်ဆေးထားသည်။

ဟုတ်ကဲ့. အများစုကပုံစံများ GitHub ကိုမှတဆင့်အသိုင်းအဝိုင်း၏အထောက်အပံ့ကိုလက်ခံ. သင် bug ကိုအစီရင်ခံတင်သွင်းနိုင်ပါတယ်, ဘာသာစကားအသစ်များအတွက်အသံမှတ်တမ်းတင်, code ကိုတိုးတက်ကောင်းမွန်, နှင့်စာရွက်စာတမ်းများ. ပေးပို့မှုလမ်းညွှန်ချက်များနှင့်လှုပ်ရှားမှုပြဿနာများအတွက်တိုင်းပုံစံ၏ GitHub repository ကိုစစ်ဆေးပါ။

ကျွန်ုပ်တို့၏ GPU ဆာဗာသည် dynamic loading ကိုအသုံးပြု၍ 4x Tesla P40 (96GB စုစုပေါင်း VRAM) ပေါ်တွင် 20+ မော်ဒယ်များကိုလည်ပတ်သည်။ Self-hosting အတွက်တစ်ဦးတည်းသော 24GB GPU သည်တစ်ပြိုင်နက်တည်း 3-5 မော်ဒယ်များကိုဝန်ဆောင်မှုပေးနိုင်သည်။

အများအပြားမော်ဒယ်များတရားဝင် Docker ပုံရိပ်များသို့မဟုတ် Dockerfiles ပေးသည်။ အမျိုးမျိုးသောမော်ဒယ်များ Run ဖို့အတွက်, သင်သည် GPU ကို access ကိုများအတွက် NVIDIA Container Toolkit နှင့်အတူ custom Docker setup ကိုတည်ဆောက်နိုင်သည်။ ကျွန်တော်တို့ရဲ့ API ကိုဆာဗာဗိသုကာအညွှန်းကိန်းတစ်ခုအဖြစ်ဆောင်ရွက်နိုင်သည်။

အများစုမှာမော်ဒယ်များ Python ကိုလိုအပ် 3.10-3.12. Coqui TTS (VITS) တိကျစွာ Python ကိုလိုအပ် 3.11. အများစုမှာမော်ဒယ်များအဘို့ငါတို့က Python ကို 3.12 အကြံပြု. တိကျတဲ့ဗားရှင်းကိုက်ညီမှုများအတွက်တစ်ဦးချင်းစီကိုမော်ဒယ်၏ requirements.txt ကိုစစ်ဆေးပါ။

ဟုတ်ကဲ့. MIT နဲ့ Apache 2.0 လိုင်စင်များရှင်းလင်းစွာစီးပွားရေးလုပ်ငန်းအသုံးပြုမှုကိုခွင့်ပြု. သင်သည်ဤမော်ဒယ်များအသုံးပြုခြင်းနှင့်အတူလိုင်စင်အခကြေးငွေ, royalties, သို့မဟုတ် attribution လိုအပ်ချက်များကိုမရှိဘဲ SaaS ထုတ်ကုန်များ, မိုဘိုင်း apps များ, ဂိမ်းများနှင့်ဝန်ဆောင်မှုများကိုတည်ဆောက်နိုင်သည် (အဘယ်သူမျှမ attribution ကိုကျေးဇူးတင်ပါတယ်သော်လည်း).
5.0/5 (1)

ကျွန်တော်တို့ကိုတိုးတက်ကောင်းမွန်စေနိုင်သလား? သင့်ရဲ့အကြံပြုချက်များကျွန်တော်တို့ကိုပြဿနာများကိုဖြေရှင်းကူညီပေးသည်။

Open Source TTS ကို ယနေ့ စမ်းကြည့်ပါ

20+ open-source မော်ဒယ်များ, အားလုံးစီးပွားရေးလုပ်ငန်းလိုင်စင်. ကျွန်တော်တို့ရဲ့ API ကိုသို့မဟုတ်ကိုယ်ပိုင်-host ကိုအသုံးပြုပါ - ရွေးချယ်မှုသည်သင်၏ဖြစ်ပါသည်.