Àwọn àwòrán àkọlé ìṣàmúlò-ètò
Gbogbo àwọn módèlè̀ TTS nínú àwọn pálẹ́ẹ̀lì wa ní afẹ́fẹ́ pẹ̀lú́ àwọn lísínsì tí a fẹ́. MIT, Apache 2.0 — kò ní ìjádé, kò ní ìgbàyélú, kò ní owó lísínsì tí a kò lè fi hàn. Lò nípá API wà, tàbí lójútó wọn nípá ińfráẹ́ẹ̀kì rẹ̀.
_Yanju
Àwọn Ìfànẹ́ Ìṣàmúlò-ètò TTS
Kini idi ti àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Gbogbo àwọn ààyè-iṣẹ́ àìfilọ́lẹ̀
Every model on TTS.ai uses a permissive open-source license. No proprietary black boxes, no vendor lock-in, no unexpected licensing fees.
Apache
Àwọn àwọn àwòrán ní ìṣẹ̀dà láti inú MIT tàbí Apache 2.0, àwọn ìṣẹ̀dà àìṣiró-ìṣàfilọ́lẹ̀ tí o jú. Lò nípa ìṣowo, ìṣàfarawe, ìṣàfilọ́lẹ̀ padà— kò ní àwọn ìgbàjójú.
Àwọn Ààyè-iṣẹ́
Ṣàfihàn àwọn módè́lì àti ìṣàmúlò-ètò fún ọ̀rọ̀rọ̀ rẹ̀. Ìdáràn fún àwọn ààyè-iṣẹ́ rẹ̀, àwọn ìṣàfihàn, àti àwọn àgbègbè. Kò ní ìgbà tí a fẹ́.
GPU tí a fi pamọ́
Àwọn móòdù ní pàtó fún NVIDIA GPÙ̀ àti ìrànwọ́ CUDA. Piper̀ láàmúlò nípa CPÙ lọ́wọ́lọ́wọ́. Móòdù àwọn púpọ̀ ní niló 2-8GB VRAM fún ìṣàfarawé.
Àwọn Àwọn Àwọn Àwọn Àwọn
Active open-source communities maintain and improve these models. Contributions welcome — submit bugs, improvements, and new voices on GitHub.
Àwọn Ìṣàmúlò-ètò
Gbogbo àwọn ìṣàmúlò-ètò náà náà gba ìlò-ètò fún iṣẹ́ nínú àwọn lísínsì wọn. Ṣẹ̀dà àwọn nǹkan, tá àwọn iṣẹ́, àti ìṣàmúlò-ètò fún iṣẹ́ tí kò ní ẹ̀yàn àwọn ẹ̀yàn ìlò-ètò.
Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn
Àwọn ìṣàmúlò-ètò, àwọn ìṣẹ́dá rẹ̀, àti ohun tí o ṣè
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Ó dara jù fún: Apache 2.0 — ìṣàmúlò-ètò ọ̀fẹ̀ tí o dara jú, 82M àwọn ìṣàmúlò-ètò, rọ́ọ̀nù fún alábòójútó
Àwọn ààyè-iṣẹ́ Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Ó dara jù fún: MIT — CPU-kan, to dara fún àwọn àpá-irinṣẹ́ ìsàlẹ̀-ilà àti àwọn ààyè-iṣẹ́ ìṣàfarawe-ẹni-ní
Àwọn ààyè-iṣẹ́ Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Ó dara jù fún: MIT — ààyè ìdájọ́ tí a lò láti mú àwọn móòdù ìsàlẹ̀-ilà láti sà
Àwọn ààyè-iṣẹ́ VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Ó dara jù fún: MIT — àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ àwòrán tí a kò lè gbọ́ nínú TTS ìṣàfarawé
Àwọn ààyè-iṣẹ́ Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Ó dara jù fún: Apache 2.0 — ìṣàmúlò-ètò ìṣàfihàn ìṣàfihàn tí a kọ̀ nípa ìṣàfihàn
Àwọn ààyè-iṣẹ́ Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Ó dara jù fún: MIT — ìṣàfarawé àwọn ìròyìn àwọn ìsàlẹ̀-ilà àti ìpéwọ̀n ìṣàfarawé àwọn ìṣàmúlò-ilà
Àwọn ààyè-iṣẹ́ OpenVoiceBii o ṣe le lo TTS orisun-aṣiṣii
Ló àwọn API ààyè-iṣẹ́ wà tàbí láti ló àwọn àwọn ìṣàmúlò-ètò rẹ̀
Wá Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn Àwọn
Browse our catalog of 20+ open-source TTS models. Each model page shows the license, architecture, capabilities, and self-hosting requirements.
Wá nínú Awáròyìn Rẹ̀
Ṣayẹwo àwọn módè́ẹ̀lì fún TTS.ai nípa ìṣàfihàn ohunkohun. Àwọn sáà GPU wa nípa ìṣàfarawé ìṣàfarawé láti jẹ́ pé o lè ṣàyẹwo ìgúnrégé nípa ìṣàfihàn ara-ẹni.
Àwọn Ìṣàfilọ́lẹ̀ Àwọn Àwọn Ìṣàfilọ́lẹ̀
Clone model repos from GitHub and run locally, or use our hosted API for production. Self-hosting gives full control; our API provides managed infrastructure.
Ṣẹ̀dá Àtòjọ-ètò Rẹ̀
Ṣàfikún TTS nínú ohun-iní rẹ̀ nípa lórí àwọn àwọn àwòrán tí a fi pamọ́ fún ara wa tàbí REST API wa. Àwọn àwòrán gbogbo ní a lè lò nípa ìmọ̀ràn àti àwọn ẹ̀yàn.
Àwọn ìṣàfarawé ìṣẹ̀dà
Gbogbo àwọn módè́lì lórí TTS.ai lo àwọn ìwé-aládàrọ̀ àìfilọ́lẹ̀ tí a ṣí
| Àwọn ìṣàmúlò-ètò | Àwọn Ààyè-iṣẹ́ | Lórúkọ́ | Àwọn ìkúndùǹ | Àwọn Ààyè-iṣẹ́ | Àwọn Àkọ́gbègbè |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Tí a fẹ́ | |||
| Piper | MIT | Àwọn ìkúndùǹ | |||
| VITS | MIT | Àwọn ìkúndùǹ | |||
| MeloTTS | MIT | Àwọn ìkúndùǹ | |||
| Chatterbox | MIT | Àwọn ìkúndùǹ | |||
| Tortoise TTS | Apache 2.0 | Tí a fẹ́ | |||
| StyleTTS 2 | MIT | Àwọn ìkúndùǹ | |||
| OpenVoice | MIT | Àwọn ìkúndùǹ | |||
| Sesame CSM | Apache 2.0 | Tí a fẹ́ | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Àwọn Ìṣàfilọ́lẹ̀ Rẹ́
Rọ́ọ̀nù àwọn àwòrán fún ara rẹ̀ tàbí fi wà lórí àwọn ààyè-iṣẹ́
Ààyè-iṣẹ́ Fún Rẹ̀ Rẹ̀
Àwọn móòdù gbogbo nípa TTS.ai ní àwọn tí a lè lò nípa ìṣàfilọ́lẹ̀ àwọn ìṣàfilọ́lẹ̀-ìṣàfilọ́lẹ̀ nípa GitHub tàbí Hugging Face. Ṣàfihàn àwọn ìṣàfilọ́lẹ̀, àwọn ìpàrárà, àtí ìṣàfilọ́lẹ̀ àwọn ìṣàfilọ́lẹ̀ nípa GPUs rẹ̀. Ò ní ìdáràn nípa ìṣàfilọ́lẹ̀, ìdáràn, àtí ìṣàfilọ́lẹ̀.
- Àwọn ààyè-iṣẹ́ ìdáràn - àwòrán kò fi àwọn sáà rẹ̀ kù
- Kò ní àwọn owó nípa àgbékalẹ̀ ìṣàmúlò-ètò
- Àwọn ìṣàmúlò-ètò ìṣàfarawé fún àwọn ààyè-iṣẹ́ rẹ̀
- Ní ìṣàmúlò-ètò GPU (NVIDIA tí a fọwọ́sì)
- O lè ṣakoso àwọn ìṣàmúlò-ètò, ìṣàmúlò-ètò, àti àwọn ìpéwọ̀n
Lo TTS.ai Hosted API
Gbaawọn ìwọlé nígbà kan sí gbogbo àwọn àwọn àwọn ààyè-iṣẹ́ 20+ nípa API REST kan. A tí n ṣakosó ìṣàfilọ́lẹ̀ GPU, àwọn ìṣàfilọ́lẹ̀ àwọn ààyè-iṣẹ́, àwọn ìṣàfilọ́lẹ̀ àwọn àwọn àwọn àwọn àwọn àwọn. Bọ́tìnì API kan náà ǹfí ọ̀kan lọ́wọ́ lọ́wọ́ lọ́wọ́ lọ́wọ́.
- Kò ní àwọn ìrísí-lẹ́tà GPU tí a fẹ́
- Gbogbo 20+ awọn awoṣe nipasẹ API kan
- Àwọn ìṣàmúlò-ètò àti àwọn ìdárànṣe àwọn ìṣàmúlò-ètò
- 99.9% uptime pẹlu infrastructura redundant
- Fi owò lọ́wọ́lọ́wọ́ fun ohun tí o lò
Ìṣàfilọ́lẹ̀ Àìpẹ̀: API tàbí Òjútó Rẹ́
Ló àwọn API ààyè-iṣẹ́ wà, tàbí fi Kokoro hàn nínú àwọn àkókò
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Open Source, Agbara-iṣe
API wa ti a fi pamọ́ jẹ́ ki TTS-ọ̀fẹ̀-ọ̀fẹ̀ gbàwọlé látì kò ní ìṣakoso GPUs.
Àwọn Ìjánu-ìsún
$0
15,000 àwọn àmì-àṣírí nínú ìṣàfilọ́lẹ̀
- 4 open-source módèlè̀ ọ̀fẹ̀
- Kò ní ìṣàmúlò-ètò fún ìlòòrò
- Àwọn ìṣàmúlò-ètò tí a fọwọ́sì
Àwọn Ìṣàmúlò-ètò
$9
500,000 àwọn àmì-ìwé/oṣu
- Gbogbo àwọn módè́lì 20+ tí a ṣí
- Ìṣàfarawé àwọn àmì-ìwé
- Àwọn Ìṣàmúlò-ètò
Àwọn Àwọn Àwọn
$29
2,000,000 àwọn àmì-ìwé/oṣu
- Àwọn ìṣàmúlò-ètò GPU ìṣàfarawé
- Àwọn ìṣàmúlò-ètò ìpele-òkè
- Àwọn ìṣàfilọ́lẹ̀ àwọn ìṣẹ̀dá
Àwọn Àtòjọ-ẹ̀yàn
Àwọn ibeere àwọn ìṣàmúlò-ètò àwọn àkọlé àwọn ìṣàmúlò-ètò àìṣiró
Àwọn àwọn àgbéwọlé rẹ̀ lè jẹ́ ìrànwọ́ fún wa.
Wá Open Source TTS ní ọjọ́ yìí
20+ awọn awoṣe orisun-iṣilọ, gbogbo wọn ni iwe-aṣẹ iṣowo. Lo API wa tabi olori-ararẹ - yiyan jẹ rẹ.