Kuzivisa Bug / Feature Request

Open Source Text to Speech Models

MIT, Apache 2.0 — hapana yakazvimiririra lock-in, hapana kushandiswa kwezvirambidzo, hapana zvikanganiso zvemubhadharo wemubhadharo. Usavashandisa kuburikidza neiyo inochengetwa API, kana kuti uzvichengete iwe pachako pane yako yepamutemo infrastructure nekudzora kwese.

Open Source MIT License Apache 2.0 Self-Hostable GitHub

Full TTS Editor API Docs

Tarisa ikozvino

Text
Files

0/500

Free with Kokoro, Piper, VITS, MeloTTS

Yako yakagadzirwa audio ichaonekwa pano

A_vakirwa

Open Source TTS Mashandisiro

Nei open-source mamodheru ari kukosha kune ako mapurojekiti

Zvese zveOpen-Source Licensed

Yese modhi pa TTS.ai inoshandisa yakavhurika-chigadzirwa chitsva chitsva chemutauro. Hapana mabhokisi emavara, hapana kurambidzwa kwemutengesi, hapana mari yemutauro isiri kutarisirwa.

MIT / Apache 2. 0

Models ine license pasi peMIT kana Apache 2.0, iyo inobvumidza zvakanyanya open-source licenses. Usashandisa zvekutengesa, shandura, shandura — hapana zvirambidzo.

Self-Hostable

Dhawunirodha chero model uye shandisa pane yako hardware. Full control pamusoro pedata rako, latency, uye infrastructure. No cloud dependency required.

GPU inovandudzwa

Mamodeli akagadzirirwa NVIDIA GPUs neCUDA rutsigiro. Piper inoshanda chete paCPU. Mamodeli akawanda anodiwa 2-8GB VRAM kuti akwanise kuongorora zvakaomarara.

Kuchengetedzwa kwenharaunda

Active open-source masangano anochengeta uye kuvandudzwa izvi mamodheru. Kubatsira kufara — kutumira bugs, kuvandudzwa, uye matsva mazita pa GitHub.

Commercial Usage OK

All models allow commercial use under their licenses.Build zvigadzirwa, kutengesa sevhisi, uye kugadzira zvemari zvemukati pasina royalties kana kubhadhara kushandiswa.

Our Open Source Model Catalog

Yese model, yayo license, uye izvo zvainoita zvakanaka

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Yakanaka kune: Apache 2.0 — yakanakisa mhando yemahara model, 82M params, nyore ku self-host

Try Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Yakanaka kune: MIT — CPU-only, yakakwana yeedge zvigadzirwa uye embedded self-hosting

Try Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Yakanaka kune: MIT — Foundational architecture yakashandiswa nevamwe vakawanda kumusoro mamodheru

Try VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Yakanaka kune: MIT — zvakasiyana-siyana audio generation kugona kupfuura standard TTS

Try Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Voice Cloning

Yakanaka kune: Apache 2.0 — yepamusoro mhando, zvakaoma kudzidza reference kutevedzera

Try Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Voice Cloning

Yakanaka kune: MIT — open-source voice cloning ne granular style control

Try OpenVoice

Maitiro Ekushandisa Open Source TTS

Usashandisa yedu inochengetwa API kana kuisa mamodheru iwe pachako

Kuongorora Open-Source Models

Tarisa yedu catalog ye 20 + open-source TTS mamodheru.Kazhinji, mamodheru ewebhusaiti anoratidzwa nechirongwa chekuzvishandira, chimiro, zviwanikwa, uye zvinodiwa zvekuzvishandira.

Kuedza mubrowser yako

Unogona kuedza chero model zvakananga pa TTS.ai pasina kuisa chero chinhu. GPU server yedu inodzora kuongorora kuti ugone kuongorora mhando usati wazvimisikidza iwe pachako.

Self-Host kana kushandisa yedu API

Clone model repos kubva kuGitHub uye shandisa munzvimbo yako, kana kushandisa yedu inochengetwa API yekugadzira. Self-hosting inopa kudzora kwakadzama; yedu API inopa yakachengetwa nharaunda.

Build Your Kugamuchirwa

Kubatanidza TTS muzvinhu zvako nekushandisa self-hosted mamodheru kana yedu REST API. All mamodheru anogona kushandiswa muzvitoro pasina mari yechikwereti kana royalties.

Kuenzanisa kweLicense

All models on TTS.ai use commercially-friendly open-source licenses

Model	License	Kutaura
Kokoro	Apache 2.0	Inodiwa
Piper	MIT	Isingafanirwe
VITS	MIT	Isingafanirwe
MeloTTS	MIT	Isingafanirwe
Chatterbox	MIT	Isingafanirwe
Tortoise TTS	Apache 2.0	Inodiwa
StyleTTS 2	MIT	Isingafanirwe
OpenVoice	MIT	Isingafanirwe
Sesame CSM	Apache 2.0	Inodiwa
Orpheus	Llama 3.2	"Built with Llama"

Tarisa izvi Models Free

Self-Hosting vs Hosted API

Kushanda neModels iwe pachako kana kuti tirege isu kudzora michina

Self-Host paHardware yako

Every model on TTS.ai is available as an open source project on GitHub or Hugging Face. Download the weights, install the dependencies, and run inference on your own GPUs. You have full control over latency, privacy, and scaling.

Full data privacy — audio kamwe haachazodzokera kune yako server
Hapana per-request mari mushure mekutanga kuiswa
Custom fine-tuning pane yako yega data
Requires GPU hardware (NVIDIA inokurudzira)
You manage updates, scaling, and dependencies

Usashandisa TTS.ai Hosted API

Kuwana nyore nyore kuwanikwa kweanopfuura 20 mamodheru kuburikidza neimwe REST API. Tinoona nezve GPU provisioning, mamodheru matsva, kurodha kwechikumbiro, uye kukwira kwechiyero.Imwe chete API key inokupa kuwanikwa kweese mamodheru — hapana chikonzero chekudzora kuiswa kwezvirongwa zvakasiyana.

Hapana GPU hardware inodiwa
All 20+ mamodheru kuburikidza neimwe API
Automatic model updates uye kuvandudzwa
99.9% uptime ne redundant infrastructure
Pay chete kwaunoshandisa

Usashandisa Hosted API Sezvo

Kutanga nekukurumidza: API kana Self-Host

Usashandisa yedu inochengetwa API, kana kuisa Kokoro panzvimbo muminetsi

Zvisarudzo 1: TTS.ai Hosted API Yakanaka

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Chisarudzo 2: Self-Host ne pip Kudzora Kwakadzama

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

View API Documentation

Open Source, Yakachipa Kutengesa

Isu tinochengeta API inoita kuti open-source TTS ive yakawanikwa pasina kudzora GPUs.

Free Tier

15 mari pakutanga

4 open-source mamodheru akasununguka
Hapana kumbobvira kushanyira webhusaiti
Kushambadzira kushandiswa kwakabvumirwa

Starter

500,000 characters/mwedzi

All 20+ open-source mamodheru
Kutaura
API kuwanikwa

Pro

$29

2,000,000 characters/mwedzi

GPU kuongorora kwekutanga
All premium models
Enterprise rutsigiro

Ona Full Pricing

Mibvunzo Inobvunzwa Kazhinji

Mabvunzo anowanzobvunzwa nezve open source yekushandura mashoko kuita mashoko

Yeah. Every model on TTS.ai uses a permissive open-source license — either MIT or Apache 2.0. We specifically exclude models with restrictive licenses (like Coqui's CPML or non-commercial CC-BY-NC). You can verify each model's license on its GitHub repository.

Vaviri ndivo vakasununguka-source licenses kubvumira zvemari kushandiswa, kuchinja, uye kugoverazve. Apache 2.0 wedzera zvakajeka patent zvikwereti uye zvinoda kutaura zvigadziriso kana iwe kuchinja kodhi. MIT iri nyore neshoma zvinodiwa. Vaviri ndivo bhizinesi-inoshamwaridzika.

Yega. Yese model inogona kugara yakabatana nayo. Clone iyo model repository kubva kuGitHub, shandisa zvinodiwa, bvisa model weights, uye shandisa inference. Tine mapepanhau ekuti iite sei kuti igare yakabatana nayo, kusanganisira GPU, RAM, uye Python vhezheni.

Piper haina GPU (CPU chete). Kokoro neMeloTTS zvinoda 1-2GB VRAM. Mamwe mamodheru anoda 4GB VRAM. Tortoise neSesame CSM zvinoda 8GB. A NVIDIA RTX 3060 (12GB) inogona kushanda nemamwe mamodheru zvakanaka.

Yes. Open-source licenses allow modification including fine-tuning. Models like GPT-SoVITS and Bark provide fine-tuning scripts. You can train models on your own voice data to create custom voices or improve performance for specific languages.

Top open-source mamodheru (Kokoro, StyleTTS 2, Chatterbox) ikozvino kusangana kana kupfuura zvekutengesa sevhisi seElevenLabs uye Google TTS mumhando benchmarks.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

Yeah. Mamodeli akawanda anogamuchira kubatanidzwa kwenharaunda kuburikidza neGitHub. Unogona kutumira mareport ebug, kunyorwa kwezwi kune matsva matauro, kuvandudzwa kwekodzero, uye kunyora. Ona GitHub repository yeese mamodeli ezvinyorwa zvemazano ekubatanidzwa uye zvikanganiso zvinoitika.

Kuisa mamodheru panzvimbo uye kubvisa mamodheru kana uchigara uchishanda kuti ugovane GPU memory. Isu tinoshandisa 20+ mamodheru pa4x Tesla P40 (96GB yeVRAM) nekushandisa dynamic loading.

Mamodheru akawanda anopa Docker mapikicha kana Dockerfiles. Kuti uite akawanda mamodheru, unogona kugadzira Docker setup neNVIDIA Container Toolkit yeGPU access. Iyo API server architecture inogona kushandiswa seyakareruka kumisikidza.

Mamodheru akawanda anodiwa Python 3.10-3.12. Coqui TTS (VITS) anodiwa Python 3.11. Tinokurudzira Python 3.12 kune akawanda mamodheru. Cheka requirements.txt yeese mamodheru kuti uone kuti ndeipi vhezheni inoenderana.

MIT neApache 2.0 malicences anobvumidza kushandiswa kwekutengesa. Iwe unogona kugadzira SaaS zvigadzirwa, maapplication efoni, mitambo, uye masevhisi usingashandisire mamodheru aya pasina mari yelicences, royalties, kana zvinodiwa zvekupihwa ( kunyangwe kupihwa kuri kuzivikanwa).

5.0/5 (1)

Tarisa Open Source TTS Nhasi

20+ open-source mamodheru, ese akapihwa mvumo yekutengesa. Usashandisa yedu API kana kugara uchizvishandira - sarudzo yako.

Open Source Text to Speech Models

Tarisa ikozvino

Love TTS.ai? Tiudza shamwari dzako!

Open Source TTS Mashandisiro

Zvese zveOpen-Source Licensed

MIT / Apache 2. 0

Self-Hostable

GPU inovandudzwa

Kuchengetedzwa kwenharaunda

Commercial Usage OK

Our Open Source Model Catalog

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Maitiro Ekushandisa Open Source TTS

Kuongorora Open-Source Models

Kuedza mubrowser yako

Self-Host kana kushandisa yedu API

Build Your Kugamuchirwa

Kuenzanisa kweLicense

Self-Hosting vs Hosted API

Self-Host paHardware yako

Usashandisa TTS.ai Hosted API

Kutanga nekukurumidza: API kana Self-Host

Open Source, Yakachipa Kutengesa

Free Tier

Starter

Pro

Mibvunzo Inobvunzwa Kazhinji

Are all TTS.ai models really open source?

Ndeupi musiyano pakati peMIT neApache 2.0 licenses?

Ndinogona sei kuisa mamodheru aya panzvimbo yangu yese?

Ndeipi GPU ndinofanira kushandisa kuti ndikwanise kuisa TTS mamodheru?

Ndinogona sei kunyatsogadzirisa open-source TTS mamodheru?

Sei open-source TTS mamodheru achienzaniswa nekutengesa sevhisi?

Ndeapi mamodheru ane restraint licenses andinofanira kudzivirira?

Ndinogona here kusimudzira izvi zve open-source models?

Ndinogona sei kuisa akawanda mamodheru paGPU server imwe chete?

Pane Docker image ye self-hosting?

Ndeipi Python vhezheni ndinofanira kushandisa kune self-hosting?

Ndinogona sei kugadzira chigadzirwa chekutengesa nekushandisa izvi?

Tarisa Open Source TTS Nhasi