Open Source texti til tal líkan

Sérhver TTS líkan á vettvangi okkar er opinn uppspretta með viðskiptavinum vingjarnlegum leyfum. MIT, Apache 2.0 — engin einkaleyfi, engar notkunartakmarkanir, engin óvænt leyfisgjöld.Notaðu þau í gegnum hýsta API okkar, eða sjálf-hýsa þau á eigin innviði með fullri stjórn.

Opinn kóði MIT leyfi Apache Sjálfvirkt GitHub

Prófaðu núna

Frjáls með Kokoro, Piper, VITS, MeloTTS
Hljóðin þín birtast hér
Búið til
Sækja
Elska TTS.ai? Segðu vinum þínum!

Open Source TTS Hagur

Af hverju opið uppspretta módel skiptir máli fyrir verkefnin þín

Öll opinn uppspretta leyfi

Sérhver líkan á TTS.ai notar leyfilegt opið leyfi.Engin einkaréttar svartir kassar, engin söluaðili læsa í, engin óvænt leyfisgjöld.

MIT / Apache 2. 0

Líkönin eru gefin út undir MIT eða Apache 2.0, sem eru leyfilegustu opnu afnotaleyfin.Nota í viðskiptalegum tilgangi, breyta, endurdreifa — engar takmarkanir.

Sjálfvirkt

Hlaða niður hvaða líkani sem er og keyrðu það á eigin vélbúnaði. Full stjórn á gögnum þínum, leynd og innviði.

GPU bjartsýni

Líkön eru bjartsýni fyrir NVIDIA GPUs með CUDA stuðning. Piper keyrir á CPU aðeins. Flestir gerðir þurfa 2-8GB VRAM fyrir skilvirka niðurstöðu.

Samfélagið viðhaldið

Þátttaka er velkomin — sendu inn villur, umbætur og nýjar raddir á GitHub, þar sem þú getur fengið aðstoð við að þróa nýjar útgáfur.

Notkun í atvinnuskyni OK

Öll módel leyfa notkun í atvinnuskyni undir leyfum sínum.Byggja vörur, selja þjónustu og búa til efni í atvinnuskyni án höfundarréttar eða notkunargjalda.

Okkar opinn uppspretta Model Catalog

Sérhver líkan, leyfi þess og það sem það gerir best

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Best fyrir: Apache 2.0 — besta gæði ókeypis líkan, 82M params, auðvelt að sjálfstætt hýsa

Reyndu Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Best fyrir: MIT - CPU-aðeins, fullkomið fyrir brún tæki og innbyggt sjálf-hýsingu

Reyndu Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Best fyrir: MIT — grundvallar arkitektúr notaður af mörgum downstream módelum

Reyndu VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Best fyrir: MIT - einstakt hljóð kynslóð getu umfram staðlaða TTS

Reyndu Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Raddklónun

Best fyrir: Apache 2.0 — hámarks gæði, víða rannsakað tilvísun framkvæmd

Reyndu Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Raddklónun

Best fyrir: MIT — opið raddklónun með kornuðu stílstýringu

Reyndu OpenVoice

Hvernig á að nota Open Source TTS

Notaðu hýst API okkar eða keyrðu líkan sjálfur

1

Kannaðu opinn uppspretta módel

Skoðaðu verslun okkar með 20+ opinn uppspretta TTS módel.Hver líkan síða sýnir leyfi, arkitektúr, getu og sjálf-hýsingu kröfur.

2

Prófaðu í vafranum þínum

Prófaðu hvaða líkan sem er beint á TTS.ai án þess að setja upp neitt.GPU netþjónar okkar meðhöndla vinnslu þannig að þú getur metið gæði áður en þú skuldbindur þig til sjálfshjálpar.

3

Self Host eða nota API okkar

Klónaðu líkan frá GitHub og keyrðu á staðnum, eða notaðu hýst API okkar fyrir framleiðslu.Sjálfshýsing gefur fulla stjórn; API okkar veitir stjórnað innviði.

4

Byggja forritið þitt

Samþætta TTS í vöruna þína með því að nota sjálfstætt hýst módel eða REST API okkar.Allar gerðir eru notaðar í atvinnuskyni án leyfisgjalda eða höfundarréttar.

Samanburður á afnotaleyfum

Öll módel á TTS.ai nota viðskiptalega vingjarnleg opið leyfi

Tegund Leyfi Notkun í atvinnuskyni Breyta Sjálfvirk vél Tilvísun
Kokoro Apache 2.0 Nauðsynlegt
Piper MIT Valfrjálst
VITS MIT Valfrjálst
MeloTTS MIT Valfrjálst
Chatterbox MIT Valfrjálst
Tortoise TTS Apache 2.0 Nauðsynlegt
StyleTTS 2 MIT Valfrjálst
OpenVoice MIT Valfrjálst
Sesame CSM Apache 2.0 Nauðsynlegt
Orpheus Llama 3.2 "Built with Llama"

Self Hosting vs Hýsing API

Keyrðu líkan sjálfur eða láttu okkur sjá um innviði

Self Host á vélbúnaði þínum

Sérhver líkan á TTS.ai er í boði sem opinn uppspretta verkefni á GitHub eða Hugging Face.Sækja þyngd, setja upp eftirspurn, og keyra ályktun á eigin GPUs.Þú hefur fulla stjórn á leynd, næði, og mælikvarða.

  • Full gagnavernd - hljóð fer aldrei frá miðlaranum þínum
  • Enginn kostnaður fyrir hverja beiðni eftir upphaflega uppsetningu
  • Sérsniðin fínstilling á eigin gögnum þínum
  • Krefst GPU vélbúnaður (NVIDIA mælt með)
  • Þú stjórnar uppfærslum, mælikvarða og eftirspurn

Nota TTS.ai Hýstur API

Fáðu strax aðgang að öllum 20+ líkanum í gegnum eitt REST API.Við sjáum um GPU framboð, líkan uppfærslur, biðröð stjórnun og mælikvarða.Einn API lykill gefur þér aðgang að hverju líkani - engin þörf á að stjórna sérstökum dreifingum.

  • Engin GPU vélbúnaður þarf
  • Öll 20+ módel í gegnum eitt API
  • Sjálfvirkar uppfærslur og endurbætur á líkaninu
  • 99,9% upptíma með óþarfa innviði
  • Borgaðu aðeins fyrir það sem þú notar

Quick Start: API eða sjálfvirkt hýsing

Notaðu hýst API okkar, eða setja Kokoro á staðnum í mínútum

Valkostur 1: TTS.ai Hýst API Auðveldasta
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Valkostur 2: Self-Host með pip Full stjórn
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Source, á viðráðanlegu verði

Hýstur API okkar gerir opið uppspretta TTS aðgengilegt án þess að stjórna GPUs.

Free Tier

$0

50 einingar við skráningu

  • 4 opinn-uppspretta módel ókeypis
  • Engin skráning fyrir grunnnotkun
  • Notkun í atvinnuskyni leyfð

Ræsir

$9

500.000 stafir / mánuður

  • Öll 20+ opinn-uppspretta módel
  • Raddklóðun
  • API aðgangur

Fyrir

$29

2.000.000 stafir / mánuður

  • Forgangur GPU vinnslu
  • Öll Premium módel
  • Enterprise stuðningur
Skoða fullt verð

Algengar spurningar (FAQ)

Algengar spurningar um opið texta til tals

Já. Sérhver líkan á TTS.ai notar leyfilegt opið afnotaleyfi — annað hvort MIT eða Apache 2.0. Við útilokum sérstaklega módel með takmörkuðum leyfum (eins og CPML Coqui eða CC-BY-NC fyrir ekki-auglýsingar). Þú getur staðfest leyfi hvers líkans á GitHub geymslu þess.

Báðar eru leyfilegar opnar heimildir sem leyfa notkun í atvinnuskyni, breytingar og endurdreifingu. Apache 2.0 bætir við skýrum einkaleyfaréttindum og krefst þess að tilgreina breytingar ef þú breytir kóðanum. MIT er einfaldara með færri kröfum. Báðar eru viðskiptavænar.

Já. Sérhver líkan er hægt að vera sjálfstætt hýstur. Klóna líkanið frá GitHub, setja upp eftirspurn, hlaða niður líkanþyngd og keyra ályktun. Við bjóðum upp á skjöl fyrir hverja líkan sjálfstætt hýsingu kröfur þar á meðal GPU, RAM og Python útgáfu.

Kröfur eru mismunandi eftir gerð. Piper þarf ekki GPU (CPU aðeins). Kokoro og MeloTTS þurfa 1-2GB VRAM. Flestar venjulegar gerðir þurfa 4GB VRAM. Tortoise og Sesame CSM þurfa 8GB. NVIDIA RTX 3060 (12GB) getur keyrt flestar gerðir þægilega.

Já. Opin afnotaleyfi leyfa breytingar, þar á meðal fínstillingu. Líkön eins og GPT-SoVITS og Bark veita fínstillingarskriftir. Þú getur þjálfað líkön á eigin raddgögnum til að búa til sérsniðnar raddir eða bæta afköst fyrir tiltekin tungumál.

Top opinn-uppspretta módel (Kokoro, StyleTTS 2, Chatterbox) passa nú eða fara yfir viðskiptaþjónustu eins og ElevenLabs og Google TTS í gæðaviðmiðum.Meginkosturinn við viðskiptaþjónustu er stjórnað innviði og stuðning, ekki hljóðgæði.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

Já. Flestar gerðir taka við framlögum frá samfélaginu í gegnum GitHub. Þú getur sent inn villuskýrslur, raddupptökur fyrir ný tungumál, kóðabætur og skjöl. Athugaðu GitHub geymslu hverrar gerðar fyrir leiðbeiningar um framlag og virkar vandamál.

Hlaða módel á eftirspurn og hlaða þegar aðgerðalaus til að deila GPU minni.GPU miðlari okkar keyrir 20+ módel á 4x Tesla P40 (96GB samtals VRAM) með dynamic hleðslu. Fyrir sjálfstætt hýsingu getur einn 24GB GPU þjónað 3-5 módel samtímis.

Margar gerðir veita opinberar Docker myndir eða Dockerfiles. Til að keyra margar gerðir geturðu byggt sérsniðna Docker uppsetningu með NVIDIA Container Toolkit fyrir GPU aðgang. API miðlara arkitektúr okkar getur þjónað sem tilvísun framkvæmd.

Flestar gerðir þurfa Python 3.10-3.12. Coqui TTS (VITS) þarf sérstaklega Python 3.11. Við mælum með Python 3.12 fyrir flestar gerðir. Athugaðu requirements.txt hverrar gerðar fyrir nákvæma útgáfusamhæfni.

Já. MIT og Apache 2.0 leyfi leyfa augljóslega notkun í atvinnuskyni. Þú getur byggt SaaS vörur, farsímaforrit, leiki og þjónustu með því að nota þessi módel án leyfisgjalda, höfundarréttar eða tilvísunarkrafna (þó að tilvísun sé vel þegin).
5.0/5 (1)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Prófaðu Open Source TTS í dag

20+ opinn uppspretta módel, allt með viðskiptaleyfi. Notaðu API okkar eða sjálfvirkan gestgjafa - val þitt.