Txostendu programa- errorea / Eskaera

Iturburu irekiko testu-hizketa ereduak

Gure plataformako TTS eredu guztiak kode irekikoak dira, lizentzia komertzialak dituztenak. MIT, Apache 2.0 — jabetzazko blokeorik ez, erabilera-mugarik ez, lizentziaren kostu sorpresarik ez. Erabili gure ostatatutako APIaren bidez, edo ostatatu zeure azpiegitura propioan kontrol osoarekin.

Kode irekia MIT lizentzia Apache 2.0 Autoostagarria GitHub

TTS editore osoa API dokumentazioa

Saiatu orain

0/500

Librea Kokoro, Piper, VITS, MeloTTS-ekin

Sortu duzun audioa hemen agertuko da

Ireki TTS editore osoa

Kode irekiko TTS abantailak

Zergatik dira garrantzitsuak kode irekiko ereduak zure proiektuetarako

Denak kode irekiko lizentziapean

TTS.ai-ko modelo guztiek kode irekiko lizentzia onartzen dute. Ez dago kutxa beltz pribaturik, ez hornitzaileen blokeorik, ez ustekabeko lizentzia-saririk.

MIT / Apache 2.0

Ereduak MIT edo Apache 2.0 lizentziapean daude, kode irekiko lizentziarik permisiboenak. Erabili komertzialki, aldatu, birbanatu — murrizketarik gabe.

Autoostagarria

Deskargatu edozein eredu eta exekutatu zure hardwarean. Kontrol osoa zure datuen, latentziaren eta azpiegituraren gainean. Ez da hodeiko menpekotasunrik behar.

GPU optimizatua

Ereduak CUDA onartzen duten NVIDIA GPUetarako optimizatuta daude. Piper PUZetan bakarrik exekutatzen da. Eredu gehienek 2-8 GB VRAM behar dute inferentzia eraginkorra egiteko.

Komunitateak mantentzen du

Kode irekiko komunitate aktiboek eredu hauek mantentzen eta hobetzen dituzte. Ongi etorriak dira ekarpenak — bidali akatsak, hobekuntzak eta ahots berriak GitHub-en.

Erabilera komertziala Ados

Eredu guztiek baimentzen dute erabilera komertziala beren lizentzien arabera. Sortu produktuak, saldu zerbitzuak eta sortu eduki komertzialak errenta edo erabilera-saririk gabe.

Gure iturburu irekiko modeloen katalogoa

Modelo bakoitza, bere lizentzia, eta zer egiten duen hoberen.

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Azkarra 5/5

Honako hauentzako onena: Apache 2.0 — kalitate oneko modelo askea, 82M parametro, autoostatzea erraza

Saiatu Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Azkarra 3/5

Honako hauentzako onena: MIT — PUZ-a soilik, ezin hobea ertz-gailuetarako eta kapsulatutako auto-ostatuetarako

Saiatu Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Azkarra 3/5

Honako hauentzako onena: MIT — oinarrizko arkitektura, beheragoko modelo askok erabiltzen dutena

Saiatu VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Motela 4/5

Honako hauentzako onena: MIT — TTS estandarretik haratagoko audio sorkuntzarako gaitasun bereziak

Saiatu Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Motela 5/5 Ahots klonaketa

Honako hauentzako onena: Apache 2.0 — kalitate maximoa, erreferentziako inplementazio zabalki aztertua

Saiatu Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Ertaina 4/5 Ahots klonaketa

Honako hauentzako onena: MIT — iturburu irekiko ahots klonaketa estilo kontrol granularrarekin

Saiatu OpenVoice

Iturburu irekiko TTS nola erabili

Erabili gure ostatatutako APIa edo exekutatu ereduak zuk zeuk

Ezagutu iturburu irekiko ereduak

Arakatu gure 20+ kode irekiko TTS ereduen katalogoa. Eredu bakoitzaren orrialdeak lizentzia, arkitektura, gaitasunak eta auto-ostatu baldintzak erakusten ditu.

Saiatu zure arakatzailean

Probatu edozein eredu zuzenean TTS.ai-n, ezer instalatu gabe. Gure GPU zerbitzariek prozesamendua kudeatzen dute, kalitatea ebaluatu ahal izateko autoostatu aurretik.

Auto-ostatu edo erabili gure APIa

Klonatu modelo-errepositorioak GitHub-etik eta exekutatu lokalki, edo erabili gure ostatatutako APIa ekoizpenerako. Auto-ostatuak kontrol osoa ematen du; gure APIak azpiegitura kudeatua eskaintzen du.

Eraiki zure aplikazioa

Integratu TTS zure produktuan, autoostatutako ereduak edo gure REST APIa erabiliz. Eredu guztiak erabil daitezke komertzialki, lizentzia- edo errenta-saririk gabe.

Lizentziaren konparazioa

TTS.ai-ko modelo guztiek kode irekiko lizentzia komertzialak erabiltzen dituzte

Modeloa	Lizentzia	Atribuzioa
Kokoro	Apache 2.0	Beharrezkoa
Piper	MIT	Aukerakoa
VITS	MIT	Aukerakoa
MeloTTS	MIT	Aukerakoa
Chatterbox	MIT	Aukerakoa
Tortoise TTS	Apache 2.0	Beharrezkoa
StyleTTS 2	MIT	Aukerakoa
OpenVoice	MIT	Aukerakoa
Sesame CSM	Apache 2.0	Beharrezkoa
Orpheus	Llama 3.2	"Built with Llama"

Probatu eredu hauek doan

Auto-ostatua vs ostatatutako APIa

Exekutatu ereduak zuk zeuk edo utzi guk azpiegitura kudeatzen

Ostalari propioa zure hardwarean

TTS.ai-ko eredu guztiak kode irekiko proiektu gisa daude eskuragarri GitHub-en edo Hugging Face-n. Deskargatu pisuak, instalatu mendekotasunak eta exekutatu inferentzia zure GPUetan. Kontrol osoa duzu latentzia, pribatutasuna eta eskalatzearen gainean.

Datuen pribatutasun osoa — audioa ez da inoiz zerbitzaritik irteten
Ez dago eskaera bakoitzeko kosturik hasierako konfigurazioaren ondoren
Zure datuen doikuntza pertsonalizatua
GPU hardwarea behar du (NVIDIA gomendatzen da)
Kudeatu eguneratzeak, eskalatzea eta mendekotasunak

Erabili TTS.ai ostatatutako APIa

Lortu berehalako sarbidea 20+ eredu guztietara REST API bakar baten bidez. GPUaren hornidura, modeloen eguneratzeak, ilara-kudeaketa eta eskalatzea kudeatzen ditugu. API gako bakar batek modelo guztietarako sarbidea ematen dizu — ez dago banakako hedapenak kudeatzeko beharrik.

Ez da GPU hardwarerik behar
20+ modelo guztiak API baten bidez
Ereduen eguneratze eta hobekuntza automatikoak
% 99,9ko uptime azpiegitura erredundantearekin
Ordaindu bakarrik erabiltzen duzunagatik

Erabili ostalatutako APIa

Hasiera bizkorra: API edo ostalari propioa

Erabili gure ostatatutako APIa, edo instalatu Kokoro lokalean minutu gutxitan

1. aukera: TTS.ai ostatatutako APIa Erraza

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

2. aukera: Ostalari propioa pip- arekin Kontrol osoa

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Ikusi APIaren dokumentazioa

Kode irekia, prezio merkea

Gure ostatatutako APIak iturburu irekiko TTS erabilgarria egiten du GPUak kudeatu gabe.

Geruza librea

15.000 karaktere erregistroan

4 kode irekiko eredu doakoak
Oinarrizko erabilerarako izen-ematerik ez
Erabilera komertziala baimenduta

Abiarazlea

500 kreditu/hilabete

20+ kode irekiko modelo guztiak
Ahotsa klonatzea
API atzipena

Pro

$29

2000 kreditu/hilean

GPU prozesamenduaren lehentasuna
Premium modelo guztiak
Enpresen euskarria

Ikusi prezio osoa

Maiz egiten diren galderak

Iturburu irekiko testu-hizketari buruzko galdera arruntak

Bai. TTS.ai-ko eredu guztiek kode irekiko lizentzia permisiboa erabiltzen dute —MIT edo Apache 2.0—. Lizentzia murriztaileak dituzten ereduak berariaz baztertzen ditugu (Coquiren CPML edo CC-BY-NC ez-komertziala, adibidez). Eredu bakoitzaren lizentzia bere GitHub biltegian egiazta dezakezu.

Biak kode irekiko lizentzia permisiboak dira, erabilera komertziala, aldaketak eta birbanaketa baimentzen dituztenak. Apache 2.0-k patente-emate esplizituak gehitzen ditu eta aldaketak adieraztea eskatzen du kodea aldatzen baduzu. MIT sinpleagoa da, eskakizun gutxiagorekin. Biak negozio-adimentsuak dira.

Bai. Eredu bakoitzak bere burua ostatatu dezake. Klonatu modeloaren biltegia GitHub-etik, instalatu mendekotasunak, deskargatu modeloaren pisuak eta exekutatu inferentzia. Eredu bakoitzaren bere burua ostatatzeko baldintzak dokumentatzen ditugu, GPUa, RAMa eta Python bertsioa barne.

Baldintzak modeloaren arabera aldatzen dira. Piper-ek ez du GPUrik behar (PUZ soilik). Kokoro eta MeloTTS-ek 1-2 GB VRAM behar dute. Modelo estandar gehienek 4 GB VRAM behar dute. Tortoise eta Sesame CSM-k 8 GB behar dituzte. NVIDIA RTX 3060 (12 GB) modelo gehienek eroso exekutatu dezakete.

Bai. Kode irekiko lizentziek aldaketak onartzen dituzte, doikuntza barne. GPT-SoVITS eta Bark bezalako ereduek doikuntza-scriptak eskaintzen dituzte. Zure ahots-datuetan entrena ditzakezu modeloak, ahots pertsonalizatuak sortzeko edo hizkuntza jakin batzuen errendimendua hobetzeko.

Kode irekiko modelorik onenek (Kokoro, StyleTTS 2, Chatterbox) ElevenLabs eta Google TTS bezalako zerbitzu komertzialak berdintzen edo gainditzen dituzte kalitate-erreferentzietan. Zerbitzu komertzialen abantaila nagusia azpiegitura kudeatua eta laguntza da, ez audio-kalitatea.

Jada baztertu ditugu. XTTS/XTTS-v2 (Coquiren CPML — ez-merkataritzakoa), F5-TTS (CC-BY-NC — ez-merkataritzakoa), eta Higgs-v2 (Boson License — murriztua) guztiak kendu dira. TTS.ai-ko eredu guztiak erabilpen komertzialerako seguruak direla egiaztatu da.

Bai. Eredu gehienek onartzen dituzte komunitatearen ekarpenak GitHub-en bidez. Errore-txostenak, hizkuntza berrietarako ahots-grabazioak, kode-hobekuntzak eta dokumentazioa bidali ditzakezu. Begiratu eredu bakoitzaren GitHub biltegian ekarpen-gidalerroak eta arazo aktiboak.

Kargatu ereduak eskatuta eta deskargatu inaktibo daudenean GPU memoria partekatzeko. Gure GPU zerbitzariak 20+ modelo exekutatzen ditu 4x Tesla P40-n (96GB VRAM guztira) karga dinamikoa erabiliz. Auto-ostaturako, 24GB GPU bakar batek 3-5 modelo zerbitza ditzake aldi berean.

Modelo askok Docker irudi ofizialak edo Dockerfitxategiak eskaintzen dituzte. Modelo ugari exekutatzeko, Docker konfigurazio pertsonalizatua eraiki dezakezu NVIDIA Container Toolkit-ekin GPUra sartzeko. Gure API zerbitzariaren arkitekturak erreferentziazko inplementazio gisa balio dezake.

Modelo gehienek Python 3.10-3.12 behar dute. Coqui TTS (VITS)-ek Python 3.11 behar du bereziki. Python 3.12 gomendatzen dugu modelo gehienentzat. Egiaztatu modelo bakoitzaren requirements.txt fitxategia bertsio zehatzaren bateragarritasuna ikusteko.

Bai. MIT eta Apache 2.0 lizentziak esplizituki baimentzen dute erabilera komertziala. Eredu hauek erabiliz SaaS produktuak, aplikazio mugikorrak, jokoak eta zerbitzuak eraiki ditzakezu lizentzia-ordainik, errentarik edo aitorpen-eskakizunik gabe (aitorpena eskertzen den arren).

5.0/5 (1)

Probatu iturburu irekiko TTS gaur

20 kode irekiko eredu baino gehiago, denak lizentzia komertzialekin. Erabili gure APIa edo autoostatu - aukera zurea da.

Izena eman doan Ikusi prezioa

Iturburu irekiko testu-hizketa ereduak

Saiatu orain

Maite TTS.ai? Esan zure lagunei!

Kode irekiko TTS abantailak

Denak kode irekiko lizentziapean

MIT / Apache 2.0

Autoostagarria

GPU optimizatua

Komunitateak mantentzen du

Erabilera komertziala Ados

Gure iturburu irekiko modeloen katalogoa

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Iturburu irekiko TTS nola erabili

Ezagutu iturburu irekiko ereduak

Saiatu zure arakatzailean

Auto-ostatu edo erabili gure APIa

Eraiki zure aplikazioa

Lizentziaren konparazioa

Auto-ostatua vs ostatatutako APIa

Ostalari propioa zure hardwarean

Erabili TTS.ai ostatatutako APIa

Hasiera bizkorra: API edo ostalari propioa

Kode irekia, prezio merkea

Geruza librea

Abiarazlea

Pro

Maiz egiten diren galderak

TTS.ai modelo guztiak benetan kode irekikoak dira?

Zein da MIT eta Apache 2.0 lizentziaren arteko aldea?

Eredu hauek nire zerbitzarian ostata ditzaket?

Zein GPU behar dut TTS ereduak autoostatzeko?

Iturburu irekiko TTS ereduak doitu ditzaket?

Nola konparatzen dira kode irekiko TTS modeloak zerbitzu komertzialekin?

Ba al dago saihestu behar dudan lizentzia murriztailea duen modelorik?

Egin dezaket ekarpenik kode irekiko eredu hauei?

Nola exekuta ditzaket hainbat modelo GPU zerbitzari batean?

Ba al dago Docker irudirik bere burua ostatatzeko?

Zein Python bertsio behar dut autoostatu ahal izateko?

Produktu komertzial bat eraiki dezaket eredu hauek erabiliz?

Probatu iturburu irekiko TTS gaur