Iturburu irekiko testu-hizketa ereduak

Gure plataformako TTS eredu guztiak kode irekikoak dira, lizentzia komertzialak dituztenak. MIT, Apache 2.0 — jabetzazko blokeorik ez, erabilera-mugarik ez, lizentziaren kostu sorpresarik ez. Erabili gure ostatatutako APIaren bidez, edo ostatatu zeure azpiegitura propioan kontrol osoarekin.

Kode irekia MIT lizentzia Apache 2.0 Autoostagarria GitHub

Saiatu orain

0/500
Librea Kokoro, Piper, VITS, MeloTTS-ekin
Your generated audio will appear here
Sortua
0:00 0:00
Deskargatu
TTS.ai gustatzen zaizu? Esaiozu zure lagunei!

Kode irekiko TTS abantailak

Zergatik dira garrantzitsuak kode irekiko ereduak zure proiektuetarako

Denak kode irekiko lizentziapean

TTS.ai-ko modelo guztiek kode irekiko lizentzia onartzen dute. Ez dago kutxa beltz pribaturik, ez hornitzaileen blokeorik, ez ustekabeko lizentzia-saririk.

MIT / Apache 2.0

Ereduak MIT edo Apache 2.0 lizentziapean daude, kode irekiko lizentziarik permisiboenak. Erabili komertzialki, aldatu, birbanatu — murrizketarik gabe.

Autoostagarria

Deskargatu edozein eredu eta exekutatu zure hardwarean. Kontrol osoa zure datuen, latentziaren eta azpiegituraren gainean. Ez da hodeiko menpekotasunrik behar.

GPU optimizatua

Ereduak CUDA onartzen duten NVIDIA GPUetarako optimizatuta daude. Piper PUZetan bakarrik exekutatzen da. Eredu gehienek 2-8 GB VRAM behar dute inferentzia eraginkorra egiteko.

Komunitateak mantentzen du

Kode irekiko komunitate aktiboek eredu hauek mantentzen eta hobetzen dituzte. Ongi etorriak dira ekarpenak — bidali akatsak, hobekuntzak eta ahots berriak GitHub-en.

Erabilera komertziala Ados

Eredu guztiek baimentzen dute erabilera komertziala beren lizentzien arabera. Sortu produktuak, saldu zerbitzuak eta sortu eduki komertzialak errenta edo erabilera-saririk gabe.

Gure iturburu irekiko modeloen katalogoa

Modelo bakoitza, bere lizentzia, eta zer egiten duen hoberen.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Honako hauentzako onena: Apache 2.0 — kalitate oneko modelo askea, 82M parametro, autoostatzea erraza

Saiatu Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Honako hauentzako onena: MIT — PUZ-a soilik, ezin hobea ertz-gailuetarako eta kapsulatutako auto-ostatuetarako

Saiatu Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Honako hauentzako onena: MIT — oinarrizko arkitektura, beheragoko modelo askok erabiltzen dutena

Saiatu VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Honako hauentzako onena: MIT — TTS estandarretik haratagoko audio sorkuntzarako gaitasun bereziak

Saiatu Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Ahots klonaketa

Honako hauentzako onena: Apache 2.0 — kalitate maximoa, erreferentziako inplementazio zabalki aztertua

Saiatu Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Ahots klonaketa

Honako hauentzako onena: MIT — iturburu irekiko ahots klonaketa estilo kontrol granularrarekin

Saiatu OpenVoice

Iturburu irekiko TTS nola erabili

Erabili gure ostatatutako APIa edo exekutatu ereduak zuk zeuk

1

Ezagutu iturburu irekiko ereduak

Arakatu gure 20+ kode irekiko TTS ereduen katalogoa. Eredu bakoitzaren orrialdeak lizentzia, arkitektura, gaitasunak eta auto-ostatu baldintzak erakusten ditu.

2

Saiatu zure arakatzailean

Probatu edozein eredu zuzenean TTS.ai-n, ezer instalatu gabe. Gure GPU zerbitzariek prozesamendua kudeatzen dute, kalitatea ebaluatu ahal izateko autoostatu aurretik.

3

Auto-ostatu edo erabili gure APIa

Klonatu modelo-errepositorioak GitHub-etik eta exekutatu lokalki, edo erabili gure ostatatutako APIa ekoizpenerako. Auto-ostatuak kontrol osoa ematen du; gure APIak azpiegitura kudeatua eskaintzen du.

4

Eraiki zure aplikazioa

Integratu TTS zure produktuan, autoostatutako ereduak edo gure REST APIa erabiliz. Eredu guztiak erabil daitezke komertzialki, lizentzia- edo errenta-saririk gabe.

Lizentziaren konparazioa

TTS.ai-ko modelo guztiek kode irekiko lizentzia komertzialak erabiltzen dituzte

Modeloa Lizentzia Erabilera komertziala Aldaketa Ostalari propioa Atribuzioa
Kokoro Apache 2.0 Beharrezkoa
Piper MIT Aukerakoa
VITS MIT Aukerakoa
MeloTTS MIT Aukerakoa
Chatterbox MIT Aukerakoa
Tortoise TTS Apache 2.0 Beharrezkoa
StyleTTS 2 MIT Aukerakoa
OpenVoice MIT Aukerakoa
Sesame CSM Apache 2.0 Beharrezkoa
Orpheus Llama 3.2 "Built with Llama"

Auto-ostatua vs ostatatutako APIa

Exekutatu ereduak zuk zeuk edo utzi guk azpiegitura kudeatzen

Ostalari propioa zure hardwarean

TTS.ai-ko eredu guztiak kode irekiko proiektu gisa daude eskuragarri GitHub-en edo Hugging Face-n. Deskargatu pisuak, instalatu mendekotasunak eta exekutatu inferentzia zure GPUetan. Kontrol osoa duzu latentzia, pribatutasuna eta eskalatzearen gainean.

  • Datuen pribatutasun osoa — audioa ez da inoiz zerbitzaritik irteten
  • Ez dago eskaera bakoitzeko kosturik hasierako konfigurazioaren ondoren
  • Zure datuen doikuntza pertsonalizatua
  • GPU hardwarea behar du (NVIDIA gomendatzen da)
  • Kudeatu eguneratzeak, eskalatzea eta mendekotasunak

Erabili TTS.ai ostatatutako APIa

Lortu berehalako sarbidea 24+ eredu guztietara REST API bakar baten bidez. GPUaren hornidura, modeloen eguneratzeak, ilara-kudeaketa eta eskalatzea kudeatzen ditugu. API gako bakar batek eredu guztietarako sarbidea ematen dizu — ez dago banakako hedapenak kudeatzeko beharrik.

  • Ez da GPU hardwarerik behar
  • 24+ modelo guztiak API baten bidez
  • Ereduen eguneratze eta hobekuntza automatikoak
  • % 99,9ko uptime azpiegitura erredundantearekin
  • Ordaindu bakarrik erabiltzen duzunagatik

Hasiera bizkorra: API edo ostalari propioa

Erabili gure ostatatutako APIa, edo instalatu Kokoro lokalean minutu gutxitan

1. aukera: TTS.ai ostatatutako APIa Erraza
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2. aukera: Ostalari propioa pip- arekin Kontrol osoa
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Kode irekia, prezio merkea

Gure ostatatutako APIak iturburu irekiko TTS erabilgarria egiten du GPUak kudeatu gabe.

Geruza librea

$0

50 kreditu izena ematean

  • 4 kode irekiko eredu doakoak
  • Oinarrizko erabilerarako izen-ematerik ez
  • Erabilera komertziala baimenduta

Abiarazlea

$9

500 kreditu/hilabete

  • 24+ kode irekiko modelo guztiak
  • Ahotsa klonatzea
  • API atzipena

Pro

$29

2000 kreditu/hilean

  • GPU prozesamenduaren lehentasuna
  • Premium modelo guztiak
  • Enpresen euskarria
Ikusi prezio osoa

Maiz egiten diren galderak

Iturburu irekiko testu-hizketari buruzko galdera arruntak

Bai. TTS.ai-ko eredu guztiek kode irekiko lizentzia permisiboa erabiltzen dute —MIT edo Apache 2.0—. Lizentzia murriztaileak dituzten ereduak berariaz baztertzen ditugu (Coquiren CPML edo CC-BY-NC ez-komertziala, adibidez). Eredu bakoitzaren lizentzia bere GitHub biltegian egiazta dezakezu.

Biak kode irekiko lizentzia permisiboak dira, erabilera komertziala, aldaketak eta birbanaketa baimentzen dituztenak. Apache 2.0-k patente-emate esplizituak gehitzen ditu eta aldaketak adieraztea eskatzen du kodea aldatzen baduzu. MIT sinpleagoa da, eskakizun gutxiagorekin. Biak negozio-adimentsuak dira.

Bai. Eredu bakoitzak bere burua ostatatu dezake. Klonatu modeloaren biltegia GitHub-etik, instalatu mendekotasunak, deskargatu modeloaren pisuak eta exekutatu inferentzia. Eredu bakoitzaren bere burua ostatatzeko baldintzak dokumentatzen ditugu, GPUa, RAMa eta Python bertsioa barne.

Baldintzak modeloaren arabera aldatzen dira. Piper-ek ez du GPUrik behar (PUZ soilik). Kokoro eta MeloTTS-ek 1-2 GB VRAM behar dute. Modelo estandar gehienek 4 GB VRAM behar dute. Tortoise eta Sesame CSM-k 8 GB behar dituzte. NVIDIA RTX 3060 (12 GB) modelo gehienek eroso exekutatu dezakete.

Bai. Kode irekiko lizentziek aldaketak onartzen dituzte, doikuntza barne. GPT-SoVITS eta Bark bezalako ereduek doikuntza-scriptak eskaintzen dituzte. Zure ahots-datuetan entrena ditzakezu modeloak, ahots pertsonalizatuak sortzeko edo hizkuntza jakin batzuen errendimendua hobetzeko.

Kode irekiko modelorik onenek (Kokoro, StyleTTS 2, Chatterbox) ElevenLabs eta Google TTS bezalako zerbitzu komertzialak berdintzen edo gainditzen dituzte kalitate-erreferentzietan. Zerbitzu komertzialen abantaila nagusia azpiegitura kudeatua eta laguntza da, ez audio-kalitatea.

Jada baztertu ditugu. XTTS/XTTS-v2 (Coquiren CPML — ez-merkataritzakoa), F5-TTS (CC-BY-NC — ez-merkataritzakoa), eta Higgs-v2 (Boson License — murriztua) guztiak kendu dira. TTS.ai-ko eredu guztiak erabilpen komertzialerako seguruak direla egiaztatu da.

Bai. Eredu gehienek onartzen dituzte komunitatearen ekarpenak GitHub-en bidez. Errore-txostenak, hizkuntza berrietarako ahots-grabazioak, kode-hobekuntzak eta dokumentazioa bidali ditzakezu. Begiratu eredu bakoitzaren GitHub biltegian ekarpen-gidalerroak eta arazo aktiboak.

Kargatu ereduak eskatuta eta deskargatu inaktibo daudenean GPU memoria partekatzeko. Gure GPU zerbitzariak 20+ modelo exekutatzen ditu 4x Tesla P40-n (96GB VRAM guztira) karga dinamikoa erabiliz. Auto-ostaturako, 24GB GPU bakar batek 3-5 modelo zerbitza ditzake aldi berean.

Modelo askok Docker irudi ofizialak edo Dockerfitxategiak eskaintzen dituzte. Modelo ugari exekutatzeko, Docker konfigurazio pertsonalizatua eraiki dezakezu NVIDIA Container Toolkit-ekin GPUra sartzeko. Gure API zerbitzariaren arkitekturak erreferentziazko inplementazio gisa balio dezake.

Modelo gehienek Python 3.10-3.12 behar dute. Coqui TTS (VITS)-ek Python 3.11 behar du bereziki. Python 3.12 gomendatzen dugu modelo gehienentzat. Egiaztatu modelo bakoitzaren requirements.txt fitxategia bertsio zehatzaren bateragarritasuna ikusteko.

Bai. MIT eta Apache 2.0 lizentziak esplizituki baimentzen dute erabilera komertziala. Eredu hauek erabiliz SaaS produktuak, aplikazio mugikorrak, jokoak eta zerbitzuak eraiki ditzakezu lizentzia-ordainik, errentarik edo aitorpen-eskakizunik gabe (aitorpena eskertzen den arren).
5.0/5 (1)

Probatu iturburu irekiko TTS gaur

24 kode irekiko eredu baino gehiago, denak lizentzia komertzialekin. Erabili gure APIa edo auto-ostatu - aukera zurea da.