Tilkynna villu / Feature Request

Open Source texti til tal líkan

Sérhver TTS líkan á vettvangi okkar er opinn uppspretta með viðskiptavinum vingjarnlegum leyfum. MIT, Apache 2.0 — engin einkaleyfi, engar notkunartakmarkanir, engin óvænt leyfisgjöld.Notaðu þau í gegnum hýsta API okkar, eða sjálf-hýsa þau á eigin innviði með fullri stjórn.

Opinn kóði MIT leyfi Apache Sjálfvirkt GitHub

Fullur TTS ritstjóri API skjölun

Prófaðu núna

Texti
Skrár

0/500

Frjáls með Kokoro, Piper, VITS, MeloTTS

Hljóðin þín birtast hér

Opna TTS ritil

Open Source TTS Hagur

Af hverju opið uppspretta módel skiptir máli fyrir verkefnin þín

Öll opinn uppspretta leyfi

Sérhver líkan á TTS.ai notar leyfilegt opið leyfi.Engin einkaréttar svartir kassar, engin söluaðili læsa í, engin óvænt leyfisgjöld.

MIT / Apache 2. 0

Líkönin eru gefin út undir MIT eða Apache 2.0, sem eru leyfilegustu opnu afnotaleyfin.Nota í viðskiptalegum tilgangi, breyta, endurdreifa — engar takmarkanir.

Sjálfvirkt

Hlaða niður hvaða líkani sem er og keyrðu það á eigin vélbúnaði. Full stjórn á gögnum þínum, leynd og innviði.

GPU bjartsýni

Líkön eru bjartsýni fyrir NVIDIA GPUs með CUDA stuðning. Piper keyrir á CPU aðeins. Flestir gerðir þurfa 2-8GB VRAM fyrir skilvirka niðurstöðu.

Samfélagið viðhaldið

Þátttaka er velkomin — sendu inn villur, umbætur og nýjar raddir á GitHub, þar sem þú getur fengið aðstoð við að þróa nýjar útgáfur.

Notkun í atvinnuskyni OK

Öll módel leyfa notkun í atvinnuskyni undir leyfum sínum.Byggja vörur, selja þjónustu og búa til efni í atvinnuskyni án höfundarréttar eða notkunargjalda.

Okkar opinn uppspretta Model Catalog

Sérhver líkan, leyfi þess og það sem það gerir best

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Best fyrir: Apache 2.0 — besta gæði ókeypis líkan, 82M params, auðvelt að sjálfstætt hýsa

Reyndu Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Best fyrir: MIT - CPU-aðeins, fullkomið fyrir brún tæki og innbyggt sjálf-hýsingu

Reyndu Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Best fyrir: MIT — grundvallar arkitektúr notaður af mörgum downstream módelum

Reyndu VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Hægur 4/5

Best fyrir: MIT - einstakt hljóð kynslóð getu umfram staðlaða TTS

Reyndu Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Hægur 5/5 Raddklónun

Best fyrir: Apache 2.0 — hámarks gæði, víða rannsakað tilvísun framkvæmd

Reyndu Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Miðlungs 4/5 Raddklónun

Best fyrir: MIT — opið raddklónun með kornuðu stílstýringu

Reyndu OpenVoice

Hvernig á að nota Open Source TTS

Notaðu hýst API okkar eða keyrðu líkan sjálfur

Kannaðu opinn uppspretta módel

Skoðaðu verslun okkar með 20+ opinn uppspretta TTS módel.Hver líkan síða sýnir leyfi, arkitektúr, getu og sjálf-hýsingu kröfur.

Prófaðu í vafranum þínum

Prófaðu hvaða líkan sem er beint á TTS.ai án þess að setja upp neitt.GPU netþjónar okkar meðhöndla vinnslu þannig að þú getur metið gæði áður en þú skuldbindur þig til sjálfshjálpar.

Self Host eða nota API okkar

Klónaðu líkan frá GitHub og keyrðu á staðnum, eða notaðu hýst API okkar fyrir framleiðslu.Sjálfshýsing gefur fulla stjórn; API okkar veitir stjórnað innviði.

Byggja forritið þitt

Samþætta TTS í vöruna þína með því að nota sjálfstætt hýst módel eða REST API okkar.Allar gerðir eru notaðar í atvinnuskyni án leyfisgjalda eða höfundarréttar.

Samanburður á afnotaleyfum

Öll módel á TTS.ai nota viðskiptalega vingjarnleg opið leyfi

Tegund	Leyfi	Tilvísun
Kokoro	Apache 2.0	Nauðsynlegt
Piper	MIT	Valfrjálst
VITS	MIT	Valfrjálst
MeloTTS	MIT	Valfrjálst
Chatterbox	MIT	Valfrjálst
Tortoise TTS	Apache 2.0	Nauðsynlegt
StyleTTS 2	MIT	Valfrjálst
OpenVoice	MIT	Valfrjálst
Sesame CSM	Apache 2.0	Nauðsynlegt
Orpheus	Llama 3.2	"Built with Llama"

Prófaðu þessar gerðir ókeypis

Self Hosting vs Hýsing API

Keyrðu líkan sjálfur eða láttu okkur sjá um innviði

Self Host á vélbúnaði þínum

Sérhver líkan á TTS.ai er í boði sem opinn uppspretta verkefni á GitHub eða Hugging Face.Sækja þyngd, setja upp eftirspurn, og keyra ályktun á eigin GPUs.Þú hefur fulla stjórn á leynd, næði, og mælikvarða.

Full gagnavernd - hljóð fer aldrei frá miðlaranum þínum
Enginn kostnaður fyrir hverja beiðni eftir upphaflega uppsetningu
Sérsniðin fínstilling á eigin gögnum þínum
Krefst GPU vélbúnaður (NVIDIA mælt með)
Þú stjórnar uppfærslum, mælikvarða og eftirspurn

Nota TTS.ai Hýstur API

Fáðu strax aðgang að öllum 20+ líkanum í gegnum eitt REST API.Við sjáum um GPU framboð, líkan uppfærslur, biðröð stjórnun og mælikvarða.Einn API lykill gefur þér aðgang að hverju líkani - engin þörf á að stjórna sérstökum dreifingum.

Engin GPU vélbúnaður þarf
Öll 20+ módel í gegnum eitt API
Sjálfvirkar uppfærslur og endurbætur á líkaninu
99,9% upptíma með óþarfa innviði
Borgaðu aðeins fyrir það sem þú notar

Notaðu Hýslað API í staðinn

Quick Start: API eða sjálfvirkt hýsing

Notaðu hýst API okkar, eða setja Kokoro á staðnum í mínútum

Valkostur 1: TTS.ai Hýst API Auðveldasta

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Valkostur 2: Self-Host með pip Full stjórn

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Skoða API skjöl

Open Source, á viðráðanlegu verði

Hýstur API okkar gerir opið uppspretta TTS aðgengilegt án þess að stjórna GPUs.

Free Tier

50 einingar við skráningu

4 opinn-uppspretta módel ókeypis
Engin skráning fyrir grunnnotkun
Notkun í atvinnuskyni leyfð

Ræsir

500.000 stafir / mánuður

Öll 20+ opinn-uppspretta módel
Raddklóðun
API aðgangur

Fyrir

$29

2.000.000 stafir / mánuður

Forgangur GPU vinnslu
Öll Premium módel
Enterprise stuðningur

Skoða fullt verð

Algengar spurningar (FAQ)

Algengar spurningar um opið texta til tals

Já. Sérhver líkan á TTS.ai notar leyfilegt opið afnotaleyfi — annað hvort MIT eða Apache 2.0. Við útilokum sérstaklega módel með takmörkuðum leyfum (eins og CPML Coqui eða CC-BY-NC fyrir ekki-auglýsingar). Þú getur staðfest leyfi hvers líkans á GitHub geymslu þess.

Báðar eru leyfilegar opnar heimildir sem leyfa notkun í atvinnuskyni, breytingar og endurdreifingu. Apache 2.0 bætir við skýrum einkaleyfaréttindum og krefst þess að tilgreina breytingar ef þú breytir kóðanum. MIT er einfaldara með færri kröfum. Báðar eru viðskiptavænar.

Já. Sérhver líkan er hægt að vera sjálfstætt hýstur. Klóna líkanið frá GitHub, setja upp eftirspurn, hlaða niður líkanþyngd og keyra ályktun. Við bjóðum upp á skjöl fyrir hverja líkan sjálfstætt hýsingu kröfur þar á meðal GPU, RAM og Python útgáfu.

Kröfur eru mismunandi eftir gerð. Piper þarf ekki GPU (CPU aðeins). Kokoro og MeloTTS þurfa 1-2GB VRAM. Flestar venjulegar gerðir þurfa 4GB VRAM. Tortoise og Sesame CSM þurfa 8GB. NVIDIA RTX 3060 (12GB) getur keyrt flestar gerðir þægilega.

Já. Opin afnotaleyfi leyfa breytingar, þar á meðal fínstillingu. Líkön eins og GPT-SoVITS og Bark veita fínstillingarskriftir. Þú getur þjálfað líkön á eigin raddgögnum til að búa til sérsniðnar raddir eða bæta afköst fyrir tiltekin tungumál.

Top opinn-uppspretta módel (Kokoro, StyleTTS 2, Chatterbox) passa nú eða fara yfir viðskiptaþjónustu eins og ElevenLabs og Google TTS í gæðaviðmiðum.Meginkosturinn við viðskiptaþjónustu er stjórnað innviði og stuðning, ekki hljóðgæði.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

Já. Flestar gerðir taka við framlögum frá samfélaginu í gegnum GitHub. Þú getur sent inn villuskýrslur, raddupptökur fyrir ný tungumál, kóðabætur og skjöl. Athugaðu GitHub geymslu hverrar gerðar fyrir leiðbeiningar um framlag og virkar vandamál.

Hlaða módel á eftirspurn og hlaða þegar aðgerðalaus til að deila GPU minni.GPU miðlari okkar keyrir 20+ módel á 4x Tesla P40 (96GB samtals VRAM) með dynamic hleðslu. Fyrir sjálfstætt hýsingu getur einn 24GB GPU þjónað 3-5 módel samtímis.

Margar gerðir veita opinberar Docker myndir eða Dockerfiles. Til að keyra margar gerðir geturðu byggt sérsniðna Docker uppsetningu með NVIDIA Container Toolkit fyrir GPU aðgang. API miðlara arkitektúr okkar getur þjónað sem tilvísun framkvæmd.

Flestar gerðir þurfa Python 3.10-3.12. Coqui TTS (VITS) þarf sérstaklega Python 3.11. Við mælum með Python 3.12 fyrir flestar gerðir. Athugaðu requirements.txt hverrar gerðar fyrir nákvæma útgáfusamhæfni.

Já. MIT og Apache 2.0 leyfi leyfa augljóslega notkun í atvinnuskyni. Þú getur byggt SaaS vörur, farsímaforrit, leiki og þjónustu með því að nota þessi módel án leyfisgjalda, höfundarréttar eða tilvísunarkrafna (þó að tilvísun sé vel þegin).

5.0/5 (1)

Prófaðu Open Source TTS í dag

20+ opinn uppspretta módel, allt með viðskiptaleyfi. Notaðu API okkar eða sjálfvirkan gestgjafa - val þitt.

Skráðu þig ókeypis Skoða verðlag

Open Source texti til tal líkan

Prófaðu núna

Elska TTS.ai? Segðu vinum þínum!

Open Source TTS Hagur

Öll opinn uppspretta leyfi

MIT / Apache 2. 0

Sjálfvirkt

GPU bjartsýni

Samfélagið viðhaldið

Notkun í atvinnuskyni OK

Okkar opinn uppspretta Model Catalog

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Hvernig á að nota Open Source TTS

Kannaðu opinn uppspretta módel

Prófaðu í vafranum þínum

Self Host eða nota API okkar

Byggja forritið þitt

Samanburður á afnotaleyfum

Self Hosting vs Hýsing API

Self Host á vélbúnaði þínum

Nota TTS.ai Hýstur API

Quick Start: API eða sjálfvirkt hýsing

Open Source, á viðráðanlegu verði

Free Tier

Ræsir

Fyrir

Algengar spurningar (FAQ)

Eru allar TTS.ai gerðir virkilega opnar?

Hver er munurinn á MIT og Apache 2.0 afnotaleyfum?

Get ég sjálfur hýst þessar gerðir á eigin netþjóni?

Hvaða GPU þarf ég til að sjálfstætt hýsa TTS módel?

Get ég fínstillt opinn uppspretta TTS módel?

Hvernig bera opinn-uppspretta TTS módel saman við viðskiptaþjónustu?

Eru einhverjar gerðir með takmarkað leyfi sem ég ætti að forðast?

Get ég lagt mitt af mörkum til þessara opnu líkana?

Hvernig keyri ég margar gerðir á einum GPU miðlara?

Er til Docker mynd fyrir sjálfshjálp?

Hvaða Python útgáfu þarf ég fyrir sjálf-hýsingu?

Get ég byggt upp viðskiptavöru með því að nota þessar gerðir?

Prófaðu Open Source TTS í dag