> Iulat ang Bug / Feature Request

tl> Libreng Teksto sa Modelo ng Pagsasalita

Ang bawat modelo ng TTS sa aming platform ay open source na may mga lisensya na komersyal. MIT, Apache 2.0 — walang mga may-ari na lock-in, walang mga paghihigpit sa paggamit, walang mga sorpresang bayad sa pag-license. Gamitin ang mga ito sa pamamagitan ng aming hosted API, o self-host ang mga ito sa iyong sariling imprastraktura na may kumpletong kontrol.

Magbukas ng source Lisensiyang MIT Ang Apache 2.0 ay Self-host GitHub. nito.

> Buong TTS Editor Mga dokumento ng API

Subukan ito ngayon

0/500

Libreng may Kokoro, Piper, VITS, MeloTTS

> Ang iyong audio na nabuo ay lilitaw dito

> Buksan ang buong TTS editor

Mga Benepisyo ng Open Source TTS

Bakit open-source modelo mahalaga para sa iyong mga proyekto

> Lahat ng Open-Source lisensyado

Ang bawat modelo sa TTS.ai ay gumagamit ng isang permissive na open-source na lisensya. Walang mga pribadong black box, walang vendor lock-in, walang hindi inaasahang mga bayad sa lisensya.

Ang MIT / Apache 2.0

Ang mga modelo ay lisensyado sa ilalim ng MIT o Apache 2.0, ang pinaka-permissive na mga lisensya ng open-source. Gamitin sa komersyo, baguhin, muling ipamahagi — walang mga paghihigpit.

Self-host

> I-download ang anumang modelo at patakbuhin ito sa iyong sariling hardware. Buong kontrol sa iyong data, latency, at imprastraktura. Walang dependency cloud kinakailangan.

GPU na na-optimize

> Mga modelo ay na-optimize para sa NVIDIA GPUs na may CUDA suporta. Piper tumatakbo sa CPU lamang. Karamihan sa mga modelo kailangan 2-8GB VRAM para sa mahusay na pagbubuod.

> Komunidad Pinapanatili

Ang mga aktibong open-source na komunidad ay pinapanatili at pinabuting mga modelong ito. Mga kontribusyon ay welcome — mag-submit ng mga bug, pagpapabuti, at mga bagong boses sa GitHub.

> Komersyal na Paggamit OK

Ang lahat ng mga modelo ay pinapayagan ang komersyal na paggamit sa ilalim ng kanilang mga lisensya. Bumuo ng mga produkto, magbenta ng mga serbisyo, at lumikha ng komersyal na nilalaman nang walang royalties o bayad sa paggamit.

Ang aming Open Source Model Catalog

> Ang bawat modelo, ang lisensya nito, at kung ano ang ginagawa nito pinakamahusay

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Pinakamahusay para sa: > Apache 2.0 — pinakamahusay na kalidad ng libreng modelo, 82M params, madaling self-host

Subukan Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Pinakamahusay para sa: > MIT — CPU-lamang, perpekto para sa gilid ng mga aparato at naka-embed na self-hosting

Subukan Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Pinakamahusay para sa: > MIT — pundasyon architecture ginagamit ng maraming mga modelo downstream

Subukan VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Pinakamahusay para sa: > MIT — natatanging audio henerasyon kakayahan sa kabila ng pamantayan TTS

Subukan Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 > Voice pag-clone

Pinakamahusay para sa: > Apache 2.0 — maximum na kalidad, malawak na aral reference pagpapatupad

Subukan Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 > Voice pag-clone

Pinakamahusay para sa: MIT — open-source na cloning ng boses na may granular na kontrol sa estilo

Subukan OpenVoice

Paano Gumamit ng Open Source TTS

> Gamitin ang aming hosted API o patakbuhin ang mga modelo sa iyong sarili

> Galugarin ang mga modelo ng Open-Source

> Mag-browse sa aming katalogo ng 20 + open-source TTS modelo. Ang bawat modelo ng pahina ay nagpapakita ng lisensya, architecture, kakayahan, at self-hosting mga kinakailangan.

> Subukan sa iyong browser

> Subukan ang anumang modelo nang direkta sa TTS.ai nang walang pag-install ng anumang bagay. Ang aming GPU server hawakan processing kaya maaari mong suriin ang kalidad bago mag-commit sa self-hosting.

> Self-host o gamitin ang aming API

> Clone modelo repos mula sa GitHub at patakbuhin sa lokal, o gamitin ang aming hosted API para sa produksyon. Self-hosting ay nagbibigay ng kumpletong kontrol; ang aming API ay nagbibigay ng pinamamahalaang imprastraktura.

Build ang iyong Application

> Isama TTS sa iyong produkto gamit ang sarili-hosted modelo o ang aming REST API. Lahat ng mga modelo ay komersyal na magagamit na walang mga bayad sa pag-license o royalties.

Paghahambing ng Lisensya

> Lahat ng mga modelo sa TTS.ai gamitin commercially-friendly open-source na lisensya

Modelo	Lisensya	Pag-aari
Kokoro	Apache 2.0	Kinakailangan
Piper	MIT	Opsyonal
VITS	MIT	Opsyonal
MeloTTS	MIT	Opsyonal
Chatterbox	MIT	Opsyonal
Tortoise TTS	Apache 2.0	Kinakailangan
StyleTTS 2	MIT	Opsyonal
OpenVoice	MIT	Opsyonal
Sesame CSM	Apache 2.0	Kinakailangan
Orpheus	Llama 3.2	"Built with Llama"

> Subukan ang mga modelong ito Libre

Self-Hosting vs Pinamamahalaang API

> Patakbuhin ang mga modelo sa iyong sarili o hayaan kaming hawakan ang imprastraktura

> Self-host sa iyong hardware

Ang bawat modelo sa TTS.ai ay magagamit bilang isang open-source na proyekto sa GitHub o Hugging Face. I-download ang mga timbang, i-install ang mga dependency, at patakbuhin ang inferensiya sa iyong sariling GPU. Mayroon kang kumpletong kontrol sa latency, privacy, at scaling.

> Buong data privacy - audio hindi kailanman umaalis sa iyong server
> Walang per-hiling gastos pagkatapos ng unang setup
> Custom fine-tuning sa iyong sariling data
> Kinakailangan GPU hardware (NVIDIA inirerekomenda)
> Ikaw pamahalaan ang mga update, scaling, at dependencies

> Gamitin ang TTS.ai na-host API

> Kumuha ng instant na access sa lahat ng 20 + modelo sa pamamagitan ng isang solong REST API. Paghawak namin GPU provisioning, modelo ng mga update, pamamahala ng queue, at scaling. Isang API key ay nagbibigay sa iyo ng access sa bawat modelo - walang kailangang pamahalaan ang hiwalay na deployments.

> Walang GPU hardware na kinakailangan
> Lahat ng 20+ modelo sa pamamagitan ng isang API
> Awtomatikong modelo ng mga update at pagpapabuti
> 99.9% uptime na may redundant imprastraktura
> Mag-bayad lamang para sa kung ano ang iyong ginagamit

> Gamitin ang Hosted API Sa halip

Mabilis na Simula: API o Self-Host

> Gamitin ang aming hosted API, o i-install Kokoro lokal sa loob ng ilang minuto

Opsyon 1: TTS.ai na-host API Pinakadaling

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

> Opsyon 2: Self-Host na may pip > Buong Kontrol

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

tl> Tingnan ang API Dokumentasyon

> Buksan ang Source, Makatwirang Pagpepresyo

Ang aming hosted API ay ginagawang open-source TTS na magagamit nang walang pamamahala ng GPU.

Libreng antas

> 15,000 character sa pag-signup

>4open-source na mga modelo ng libreng
> Walang pag-signup para sa pangunahing paggamit
> Commercial paggamit pinahihintulutan

Pasimula

> 500,000 mga character / buwan

> Lahat ng 20+ open-source na modelo
> Pag-clone ng boses
API access

Pro

$29

> 2,000,000 mga character / buwan

> Prioridad GPU pagpoproseso
Lahat ng mga modelo premium
> Enterprise suporta

Tingnan ang Buong Pagpepresyo

Mga Madalas Itanong

> Karaniwang mga katanungan tungkol sa open source teksto sa pagsasalita

Oo. Ang bawat modelo sa TTS.ai ay gumagamit ng isang permissive na open-source na lisensya — alinman sa MIT o Apache 2.0. Naming partikular na hindi kasama ang mga modelo na may mga restriktibo lisensya (tulad ng CPML ng Coqui o non-commercial CC-BY-NC). Maaari mong suriin ang lisensya ng bawat modelo sa GitHub repository nito.

Ang parehong ay permissive open-source na lisensya na nagpapahintulot sa komersyal na paggamit, pagbabago, at muling pamamahagi. Apache 2.0 ay nagdaragdag ng malinaw na patent grants at nangangailangan ng pagpapahiwatig ng mga pagbabago kung ikaw ay baguhin ang code. MIT ay mas simpleng may mas kaunting mga kinakailangan. Parehong ay negosyo-friendly.

> Oo. Ang bawat modelo ay maaaring self-hosted. Clone ang modelo repository mula sa GitHub, i-install ang mga dependencies, i-download ang mga timbang ng modelo, at patakbuhin ang inference. Nagbibigay kami ng dokumentasyon para sa bawat modelo ng self-hosting mga kinakailangan kabilang ang GPU, RAM, at Python bersyon.

Ang Piper ay hindi nangangailangan ng GPU (CPU lamang). Ang Kokoro at MeloTTS ay nangangailangan ng 1-2GB VRAM. Karamihan sa mga karaniwang modelo ay nangangailangan ng 4GB VRAM. Ang Tortoise at Sesame CSM ay nangangailangan ng 8GB. Ang isang NVIDIA RTX 3060 (12GB) ay maaaring tumakbo nang komportable sa karamihan ng mga modelo.

Ang mga modelo tulad ng GPT-SoVITS at Bark ay nagbibigay ng mga script ng fine-tuning. Maaari kang magsanay ng mga modelo sa iyong sariling data ng boses upang lumikha ng mga pasadyang boses o mapabuti ang pagganap para sa mga tiyak na wika.

> Top open-source na mga modelo (Kokoro, StyleTTS 2, Chatterbox) ngayon magkasya o lumagpas sa mga komersyal na serbisyo tulad ng ElevenLabs at Google TTS sa kalidad ng mga benchmark. Ang pangunahing bentahe ng mga komersyal na serbisyo ay pinamamahalaang imprastraktura at suporta, hindi kalidad ng audio.

XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), at Higgs-v2 (Boson License — restrictive) ay lahat inalis. Ang bawat modelo sa TTS.ai ay na-verify na ligtas sa komersyal na paggamit.

> Oo. Karamihan sa mga modelo ay tumatanggap ng mga kontribusyon ng komunidad sa pamamagitan ng GitHub. Maaari kang mag-submit ng mga ulat ng bug, mga recording ng boses para sa mga bagong wika, mga pagpapabuti sa code, at dokumentasyon. Tingnan ang GitHub repository ng bawat modelo para sa mga alituntunin ng kontribusyon at mga aktibong isyu.

> I-load ang mga modelo sa demand at i-unload kapag walang ginagawa upang ibahagi ang GPU memory. Ang aming GPU server ay tumatakbo 20 + mga modelo sa 4x Tesla P40 (96GB kabuuang VRAM) gamit ang dynamic na pag-load. Para sa self-hosting, isang solong 24GB GPU ay maaaring magsilbi 3-5 mga modelo nang sabay-sabay.

Para sa pagpapatakbo ng maraming mga modelo, maaari mong bumuo ng isang pasadyang Docker setup na may NVIDIA Container Toolkit para sa GPU access. Ang aming API server architecture ay maaaring magsilbi bilang isang reference pagpapatupad.

Ang karamihan ng mga modelo ay nangangailangan ng Python 3.10-3.12. Ang Coqui TTS (VITS) ay partikular na nangangailangan ng Python 3.11. Inirerekomenda namin ang Python 3.12 para sa karamihan ng mga modelo. Tingnan ang requirements.txt ng bawat modelo para sa eksaktong compatibility ng bersyon.

Oo. Ang MIT at Apache 2.0 na lisensya ay malinaw na nagpapahintulot sa komersyal na paggamit. Maaari kang bumuo ng mga produktong SaaS, mobile apps, laro, at serbisyo gamit ang mga modelong ito nang walang bayad sa pag-license, royalties, o mga kinakailangan sa pagbibigay ng kredito (bagaman ang pagbibigay ng kredito ay pinahahalagahan).

5.0/5 (1)

> Subukan ang Open Source TTS Ngayon

> 20+ open-source na mga modelo, lahat ng commercially-licensed. Gamitin ang aming API o self-host - ang pagpili ay iyong.

Mag-sign up para sa libreng tl> Tingnan ang Pagpepresyo

tl> Libreng Teksto sa Modelo ng Pagsasalita

Subukan ito ngayon

I-love TTS.ai? Ibahagi sa iyong mga kaibigan!

Mga Benepisyo ng Open Source TTS

> Lahat ng Open-Source lisensyado

Ang MIT / Apache 2.0

Self-host

GPU na na-optimize

> Komunidad Pinapanatili

> Komersyal na Paggamit OK

Ang aming Open Source Model Catalog

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Paano Gumamit ng Open Source TTS

> Galugarin ang mga modelo ng Open-Source

> Subukan sa iyong browser

> Self-host o gamitin ang aming API

Build ang iyong Application

Paghahambing ng Lisensya

Self-Hosting vs Pinamamahalaang API

> Self-host sa iyong hardware

> Gamitin ang TTS.ai na-host API

Mabilis na Simula: API o Self-Host

> Buksan ang Source, Makatwirang Pagpepresyo

Libreng antas

Pasimula

Pro

Mga Madalas Itanong

> Ang lahat ng TTS.ai modelo ay talagang bukas na mapagkukunan?

Ano ang pagkakaiba sa pagitan ng MIT at Apache 2.0 lisensya?

> Maaari ko bang self-host ang mga modelo sa aking sariling server?

> Ano GPU kailangan ko upang self-host TTS modelo?

Maaari ko bang i-fine-tune ang mga modelo ng TTS na bukas na mapagkukunan?

Paano maihahambing ang mga modelong open-source ng TTS sa mga komersyal na serbisyo?

> Mayroon bang anumang mga modelo na may limitadong mga lisensya na dapat kong iwasan?

Maaari ba akong magbigay ng kontribusyon sa mga modelong open-source na ito?

> Paano ko patakbuhin ang maraming mga modelo sa isang GPU server?

> Mayroon bang isang Docker imahe para sa self-hosting?

> Ano ang Python bersyon kailangan ko para sa self-hosting?

> Maaari ba akong bumuo ng isang komersyal na produkto gamit ang mga modelo?

> Subukan ang Open Source TTS Ngayon