Poročilo o napaki / Zahteva o lastnostih

Modeli odprtega izvornega besedila za govor

Vsak TTS model na naši platformi je odprt vir s komercialno prijaznimi licencami. MIT, Apači 2.0 – brez lastniških omejitev uporabe, brez presenetljivih pristojbin za licenciranje. Uporabite jih prek našega gostitelja API ali jih samostojno gostite na lastni infrastrukturi s polnim nadzorom.

Odpri vir Licenca MIT Apači 2.0 Samostojna gostilna naprava GitHub

Polni urejevalnik TTS API Docs

Poskusi zdaj

0/500

Prosto z Kokoro, Piper, VITS, Melotts

Tukaj se bo pojavil vaš izdelani zvok

Odpri polni urejevalnik TTS

Odprti vir koristi TTS

Zakaj so modeli odprtega virov pomembni za vaše projekte

Vse licencirane z odprtim virom

Vsak model na TTS.ai uporablja popustljivo dovoljenje odprtega vira. Brez lastniških črnih škatel, brez zaklepanja prodajalca, brez nepričakovanih pristojbin za licenciranje.

MIT / Apači 2.0

Modeli so licencirani pod MIT ali Apači 2.0, najbolj dopustne licence odprtega izvora. Uporabljajte komercialno, modificirano, prerazporeditev – brez omejitev.

Samostojna gostilna naprava

Prenesi vse modele in ga spustite na lastno opremo. Polni nadzor nad vašimi podatki, latencijo in infrastrukturo. Ni potrebe po odvisnosti oblaka.

GPU optimiziran

Modeli so optimizirani za NVIDIA GPUs s podporo CUDA. Piper teče samo na CPU. Večina modelov potrebuje 2-8GB VRAM za učinkovite ugotovitve.

Obdržana skupnost

Aktivne skupnosti odprtih virov ohranjajo in izboljšujejo te modele. Prispevki dobrodošli – predložijo napake, izboljšave in nove glasove na GitHub.

Trgovska uporaba OK

Vsi modeli omogočajo komercialno uporabo pod svojimi licencami. Zgraditi izdelke, prodajati storitve in ustvariti komercialne vsebine brez honorarjev ali pristojbin za uporabo.

Naš katalog odprtega modela

Vsak model, njegova licenca, in kaj je najboljše

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Hitro 5/5

Najboljše za: Apači 2.0 – najboljši brez kakovostnega modela, 82M params, enostavno za samovoditelja

Poskusi. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Hitro 3/5

Najboljše za: MIT – samo za CPU, popolna za robne naprave in vgrajeno samovoditeljstvo

Poskusi. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Hitro 3/5

Najboljše za: MIT – temeljna arhitektura, ki jo uporabljajo mnogi nizvodni modeli

Poskusi. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Počasi 4/5

Najboljše za: MIT – edinstvene zmogljivosti za ustvarjanje zvoka, ki presegajo standardno TTS

Poskusi. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Počasi 5/5 Kloniranje glasu

Najboljše za: Apači 2.0 – najvišja kakovost, široko proučeno referenčno izvajanje

Poskusi. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Srednja 4/5 Kloniranje glasu

Najboljše za: MIT – kloniranje glasu z odprtim virom z granuliranim slogom

Poskusi. OpenVoice

Kako uporabljati odprt vir TTS

Uporabite naše gostiteljsko API ali vodite modele sami

Raziščite modele odprtega izvora

Brskajte naš katalog 20+ modelov TTS s odprtim virom. Vsaka model strani prikazuje licenco, arhitekturo, zmogljivosti in samostojne zahteve.

Poskusite v brskalniku

Preizkusite kakršen koli model neposredno na TTS.ai brez namestitve ničesar. Naši GPU strežniki ročajo obdelavo, tako da lahko ocenite kakovost, preden se zavezate k samovoditeljstvu.

Samostojnost ali uporaba našega API

Klonov model repos iz GitHub in teči lokalno, ali uporabite naš gostiteljski API za proizvodnjo. Self-hosting daje poln nadzor; naš API zagotavlja upravljano infrastrukturo.

Zgradite svoj program

Integrirajte TTS v vaš izdelek z uporabo samohostnih modelov ali našega REST API. Vsi modeli so komercialno uporabni brez licenčnih pristojbin ali honorarjev.

Primerjava licence

Vsi modeli na TTS.ai uporablja komercialno prijazno dovoljenje za odprti vir

Vzorec	Licenca	Atribucija
Kokoro	Apache 2.0	Zahtevana
Piper	MIT	Neobvezno
VITS	MIT	Neobvezno
MeloTTS	MIT	Neobvezno
Chatterbox	MIT	Neobvezno
Tortoise TTS	Apache 2.0	Zahtevana
StyleTTS 2	MIT	Neobvezno
OpenVoice	MIT	Neobvezno
Sesame CSM	Apache 2.0	Zahtevana
Orpheus	Llama 3.2	"Built with Llama"

Poskusite te modele brezplačno

Samoposteljni vs gostiteljski API

Poženite modele sami ali pa nam dovolite, da upravljamo infrastrukturo

Samostojna oprema

Vsak model na TTS.ai je na voljo kot projekt odprtega vira na GitHub ali Hugging Face. Prenesi uteži, namestite odvisnosti in teči inferenco na lastne GPU. Imate poln nadzor nad latencijo, zasebnostjo in skaliranjem.

Polna zasebnost podatkov – zvok nikoli ne zapusti strežnika
Brez stroškov na zahtevo po začetni nastavitvi
Prilagojeno uravnavanje na lastne podatke
Zahteva GPU strojno opremo (priporočeno NVIDIA)
Upravljate posodobitve, skaliranje in odvisnosti

Uporabi TTS.ai API gostitelja

Dobite takojšen dostop do vseh 20+ modelov prek enotnega REST API. Obravnavamo GPU ponudbe, posodobitve modelov, upravljanje redov in skaliranje. En API ključ vam omogoča dostop do vsakega modela – ni potrebe po upravljanju ločenih namestitev.

Ni potrebno strojno opremo GPU
Vsi 20+ modeli skozi en API
Samodejne posodobitve in izboljšave modelov
99,9 % preživetja z odvečno infrastrukturo
Plačajte samo za to, kar uporabljate.

Namesto tega uporabi API gostitelja

Hitri zagon: API ali samostojni

Uporabite naš gostiteljski API, ali namestite Kokoro lokalno v minutah

Možnost 1: TTS.ai Hostiteljski API Najlažje

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Možnost 2: Samostojna hiša s pip Celoten nadzor

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Oglejte si dokumentacijo API

Odprti vir, dopustne cene

Naša gostiteljica API omogoča dostop do odprtega vira TTS brez upravljanja GPU.

Prosta stopnja

15 kreditov za prijavo

4 modeli odprtega vira brezplačno
Ni prijave za osnovno uporabo
Dozvoljena komercialna uporaba

Začetek

500.000 znakov mesečno

Vsi 20+ modeli odprtega vira
kloniranje glasu
Dostop API

Prof.

$29

2.000.000 znakov/mesec

Prednostna obdelava GPU
Vsi premijski modeli
Podpora podjetjem

Poglej polno cenitev

Pogosta vprašanja

Skupna vprašanja glede besedila odprtega vira govora

Da. Vsak model na TTS.ai uporablja popustljivo dovoljenje odprtega izvora – MIT ali Apache 2.0. Izključujemo modele z omejevalnimi licencami (kot je Coquijev CPML ali nekomercialni CC-BY-NC). Vsak model lahko preverite v svojem repozitoriju GitHub.

Oba sta popustljiva licenca odprtega vira, ki omogočajo komercialno uporabo, spremembo in prerazporeditev. Apache 2.0 dodaja izrecne patentne donacije in zahteva navedbo sprememb, če spremenite kodo. MIT je preprostejši z manj zahtev. Oba sta prijazna za poslovanje.

Ja. Vsak model se lahko samostojno gosti. Klonirajo repozitorij modela iz GitHub, namestite odvisnosti, prenesete uteži modela in teči ininference. Za vsak model zagotavljamo dokumentacijo za zahteve za samohostovanje vsakega modela, vključno z GPU, RAM in Python različico.

Zahteve se razlikujejo glede na model. Piper ne potrebuje GPU (samo CPU). Kokoro in Melotts potrebujeta 1-2GB VRAM. Večina standardnih modelov potrebuje 4GB VRAM. Tortoise in Sezam CSM potrebujeta 8GB. NVIDIA RTX 3060 (12GB) lahko večina modelov poteka udobno.

Da. Odprte licence omogočajo spremembo, vključno z fino uravnavanjem. Modeli, kot so GPT-SoviTS in Bark zagotavljajo dobro uravnavanje skriptov. Modele lahko trenirate na lastnih glasovnih podatkih za ustvarjanje posebnih glasov ali izboljšanje uspešnosti za določene jezike.

Najboljši modeli odprtega vira (Kokoro, StyleTTS 2, Chatterbox) se zdaj ujemajo ali presegajo komercialne storitve, kot so EnajstLabs in Google TTS v merilih kakovosti. Glavna prednost komercialnih storitev je upravljanje infrastrukture in podpora, ne kakovost zvoka.

Smo jih že izključili. XTTS/XTS-v2 (Coquijev CPML – non-commercial), F5-TTS (CC-BY-NC – non-commercial) in Higgs-v2 (Bosonova licenca – omejevalna) so bili vsi odstranjeni. Vsak model na TTS.ai je preverjen komercialno uporabo varen.

Da. Večina modelov sprejema prispevke skupnosti prek GitHub. Lahko pošljete poročila o napakah, glasbene posnetke za nove jezike, izboljšave kode in dokumentacijo. Preverite repozitorij vsakega modela GitHub za smernice za prispevke in aktivna vprašanja.

Nalaganje modelov na zahtevo in razkladanje pri nedejavnosti za izmenjavo GPU pomnilnika. Naš GPU strežnik uporablja 20+ modelov na 4x Tesla P40 (96GB total VRAM) z dinamično nalaganjem. Za samohostovanje lahko en 24GB GPU hkrati služi 3-5 modelov.

Mnogi modeli zagotavljajo uradne Docker slike ali Dockerfiles. Za delovanje več modelov, lahko zgradite custom Docker nastavitev z NVIDIA Container Toolkit za dostop GPU. Naša API strežnik arhitektura lahko služi kot referenčna implementacija.

Večina modelov potrebuje Python 3.10-3.12 Coqui TTS (VITS) posebej potrebuje Python 3.11 Priporočamo Python 3.12 za večino modelov. Preverite zahteve vsakega modela.txt za natančno združljivost različic.

Da. licence MIT in Apache 2.0 izrecno omogočajo komercialno uporabo. Lahko gradite SaaS izdelke, mobilne aplikacije, igre in storitve, ki uporabljajo te modele brez licenciranja pristojbine, licenčnine ali zahteve pripisovanja (čeprav je pripisovanje cenjeno).

5.0/5 (1)

Poskusite odprti vir TTS danes

20+ modeli odprtega vira, vsi komercialno licencirani. Uporabite naš API ali samovoditelj – izbira je vaša.

Prosto se prijavite Prikaži ceno

Modeli odprtega izvornega besedila za govor

Poskusi zdaj

Ljubi TTS.ai, povej prijateljem!

Odprti vir koristi TTS

Vse licencirane z odprtim virom

MIT / Apači 2.0

Samostojna gostilna naprava

GPU optimiziran

Obdržana skupnost

Trgovska uporaba OK

Naš katalog odprtega modela

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Kako uporabljati odprt vir TTS

Raziščite modele odprtega izvora

Poskusite v brskalniku

Samostojnost ali uporaba našega API

Zgradite svoj program

Primerjava licence

Samoposteljni vs gostiteljski API

Samostojna oprema

Uporabi TTS.ai API gostitelja

Hitri zagon: API ali samostojni

Odprti vir, dopustne cene

Prosta stopnja

Začetek

Prof.

Pogosta vprašanja

So vsi TTS.ai modelov res odprt vir?

Kakšna je razlika med licencami MIT in Apačev 2.0?

Lahko samodejno vodim te modele na svojem strežniku?

Kateri GPU potrebujem za samovoditeljske TTS modele?

Lahko lepo nastavim modele TTS s odprtim virom?

Kako se modeli TTS s odprtim virom primerjajo s komercialnimi storitvami?

Ali obstajajo modeli z omejevalnimi licencami, ki bi se jih moral izogniti?

Lahko prispevam k tem modelom?

Kako lahko upravljam več modelov na enem GPU strežniku?

Ali obstaja podoba Dockerja za samovoditeljstvo?

Katero Python različico potrebujem za samovodenje?

Lahko zgradim komercialni izdelek s temi modeli?

Poskusite odprti vir TTS danes