Modeli odprtega izvornega besedila za govor

Vsak TTS model na naši platformi je odprt vir s komercialno prijaznimi licencami. MIT, Apači 2.0 – brez lastniških omejitev uporabe, brez presenetljivih pristojbin za licenciranje. Uporabite jih prek našega gostitelja API ali jih samostojno gostite na lastni infrastrukturi s polnim nadzorom.

Odpri vir Licenca MIT Apači 2.0 Samostojna gostilna naprava GitHub

Poskusi zdaj

Prosto z Kokoro, Piper, VITS, Melotts
Tukaj se bo pojavil vaš izdelani zvok
Ustvaril
Prenesi
Ljubi TTS.ai, povej prijateljem!

Odprti vir koristi TTS

Zakaj so modeli odprtega virov pomembni za vaše projekte

Vse licencirane z odprtim virom

Vsak model na TTS.ai uporablja popustljivo dovoljenje odprtega vira. Brez lastniških črnih škatel, brez zaklepanja prodajalca, brez nepričakovanih pristojbin za licenciranje.

MIT / Apači 2.0

Modeli so licencirani pod MIT ali Apači 2.0, najbolj dopustne licence odprtega izvora. Uporabljajte komercialno, modificirano, prerazporeditev – brez omejitev.

Samostojna gostilna naprava

Prenesi vse modele in ga spustite na lastno opremo. Polni nadzor nad vašimi podatki, latencijo in infrastrukturo. Ni potrebe po odvisnosti oblaka.

GPU optimiziran

Modeli so optimizirani za NVIDIA GPUs s podporo CUDA. Piper teče samo na CPU. Večina modelov potrebuje 2-8GB VRAM za učinkovite ugotovitve.

Obdržana skupnost

Aktivne skupnosti odprtih virov ohranjajo in izboljšujejo te modele. Prispevki dobrodošli – predložijo napake, izboljšave in nove glasove na GitHub.

Trgovska uporaba OK

Vsi modeli omogočajo komercialno uporabo pod svojimi licencami. Zgraditi izdelke, prodajati storitve in ustvariti komercialne vsebine brez honorarjev ali pristojbin za uporabo.

Naš katalog odprtega modela

Vsak model, njegova licenca, in kaj je najboljše

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najboljše za: Apači 2.0 – najboljši brez kakovostnega modela, 82M params, enostavno za samovoditelja

Poskusi. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najboljše za: MIT – samo za CPU, popolna za robne naprave in vgrajeno samovoditeljstvo

Poskusi. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najboljše za: MIT – temeljna arhitektura, ki jo uporabljajo mnogi nizvodni modeli

Poskusi. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najboljše za: MIT – edinstvene zmogljivosti za ustvarjanje zvoka, ki presegajo standardno TTS

Poskusi. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloniranje glasu

Najboljše za: Apači 2.0 – najvišja kakovost, široko proučeno referenčno izvajanje

Poskusi. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloniranje glasu

Najboljše za: MIT – kloniranje glasu z odprtim virom z granuliranim slogom

Poskusi. OpenVoice

Kako uporabljati odprt vir TTS

Uporabite naše gostiteljsko API ali vodite modele sami

1

Raziščite modele odprtega izvora

Brskajte naš katalog 20+ modelov TTS s odprtim virom. Vsaka model strani prikazuje licenco, arhitekturo, zmogljivosti in samostojne zahteve.

2

Poskusite v brskalniku

Preizkusite kakršen koli model neposredno na TTS.ai brez namestitve ničesar. Naši GPU strežniki ročajo obdelavo, tako da lahko ocenite kakovost, preden se zavezate k samovoditeljstvu.

3

Samostojnost ali uporaba našega API

Klonov model repos iz GitHub in teči lokalno, ali uporabite naš gostiteljski API za proizvodnjo. Self-hosting daje poln nadzor; naš API zagotavlja upravljano infrastrukturo.

4

Zgradite svoj program

Integrirajte TTS v vaš izdelek z uporabo samohostnih modelov ali našega REST API. Vsi modeli so komercialno uporabni brez licenčnih pristojbin ali honorarjev.

Primerjava licence

Vsi modeli na TTS.ai uporablja komercialno prijazno dovoljenje za odprti vir

Vzorec Licenca Trgovska uporaba Sprememba Samostojni objekti Atribucija
Kokoro Apache 2.0 Zahtevana
Piper MIT Neobvezno
VITS MIT Neobvezno
MeloTTS MIT Neobvezno
Chatterbox MIT Neobvezno
Tortoise TTS Apache 2.0 Zahtevana
StyleTTS 2 MIT Neobvezno
OpenVoice MIT Neobvezno
Sesame CSM Apache 2.0 Zahtevana
Orpheus Llama 3.2 "Built with Llama"

Samoposteljni vs gostiteljski API

Poženite modele sami ali pa nam dovolite, da upravljamo infrastrukturo

Samostojna oprema

Vsak model na TTS.ai je na voljo kot projekt odprtega vira na GitHub ali Hugging Face. Prenesi uteži, namestite odvisnosti in teči inferenco na lastne GPU. Imate poln nadzor nad latencijo, zasebnostjo in skaliranjem.

  • Polna zasebnost podatkov – zvok nikoli ne zapusti strežnika
  • Brez stroškov na zahtevo po začetni nastavitvi
  • Prilagojeno uravnavanje na lastne podatke
  • Zahteva GPU strojno opremo (priporočeno NVIDIA)
  • Upravljate posodobitve, skaliranje in odvisnosti

Uporabi TTS.ai API gostitelja

Dobite takojšen dostop do vseh 20+ modelov prek enotnega REST API. Obravnavamo GPU ponudbe, posodobitve modelov, upravljanje redov in skaliranje. En API ključ vam omogoča dostop do vsakega modela – ni potrebe po upravljanju ločenih namestitev.

  • Ni potrebno strojno opremo GPU
  • Vsi 20+ modeli skozi en API
  • Samodejne posodobitve in izboljšave modelov
  • 99,9 % preživetja z odvečno infrastrukturo
  • Plačajte samo za to, kar uporabljate.

Hitri zagon: API ali samostojni

Uporabite naš gostiteljski API, ali namestite Kokoro lokalno v minutah

Možnost 1: TTS.ai Hostiteljski API Najlažje
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Možnost 2: Samostojna hiša s pip Celoten nadzor
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Odprti vir, dopustne cene

Naša gostiteljica API omogoča dostop do odprtega vira TTS brez upravljanja GPU.

Prosta stopnja

$0

15 kreditov za prijavo

  • 4 modeli odprtega vira brezplačno
  • Ni prijave za osnovno uporabo
  • Dozvoljena komercialna uporaba

Začetek

$9

500.000 znakov mesečno

  • Vsi 20+ modeli odprtega vira
  • kloniranje glasu
  • Dostop API

Prof.

$29

2.000.000 znakov/mesec

  • Prednostna obdelava GPU
  • Vsi premijski modeli
  • Podpora podjetjem
Poglej polno cenitev

Pogosta vprašanja

Skupna vprašanja glede besedila odprtega vira govora

Da. Vsak model na TTS.ai uporablja popustljivo dovoljenje odprtega izvora – MIT ali Apache 2.0. Izključujemo modele z omejevalnimi licencami (kot je Coquijev CPML ali nekomercialni CC-BY-NC). Vsak model lahko preverite v svojem repozitoriju GitHub.

Oba sta popustljiva licenca odprtega vira, ki omogočajo komercialno uporabo, spremembo in prerazporeditev. Apache 2.0 dodaja izrecne patentne donacije in zahteva navedbo sprememb, če spremenite kodo. MIT je preprostejši z manj zahtev. Oba sta prijazna za poslovanje.

Ja. Vsak model se lahko samostojno gosti. Klonirajo repozitorij modela iz GitHub, namestite odvisnosti, prenesete uteži modela in teči ininference. Za vsak model zagotavljamo dokumentacijo za zahteve za samohostovanje vsakega modela, vključno z GPU, RAM in Python različico.

Zahteve se razlikujejo glede na model. Piper ne potrebuje GPU (samo CPU). Kokoro in Melotts potrebujeta 1-2GB VRAM. Večina standardnih modelov potrebuje 4GB VRAM. Tortoise in Sezam CSM potrebujeta 8GB. NVIDIA RTX 3060 (12GB) lahko večina modelov poteka udobno.

Da. Odprte licence omogočajo spremembo, vključno z fino uravnavanjem. Modeli, kot so GPT-SoviTS in Bark zagotavljajo dobro uravnavanje skriptov. Modele lahko trenirate na lastnih glasovnih podatkih za ustvarjanje posebnih glasov ali izboljšanje uspešnosti za določene jezike.

Najboljši modeli odprtega vira (Kokoro, StyleTTS 2, Chatterbox) se zdaj ujemajo ali presegajo komercialne storitve, kot so EnajstLabs in Google TTS v merilih kakovosti. Glavna prednost komercialnih storitev je upravljanje infrastrukture in podpora, ne kakovost zvoka.

Smo jih že izključili. XTTS/XTS-v2 (Coquijev CPML – non-commercial), F5-TTS (CC-BY-NC – non-commercial) in Higgs-v2 (Bosonova licenca – omejevalna) so bili vsi odstranjeni. Vsak model na TTS.ai je preverjen komercialno uporabo varen.

Da. Večina modelov sprejema prispevke skupnosti prek GitHub. Lahko pošljete poročila o napakah, glasbene posnetke za nove jezike, izboljšave kode in dokumentacijo. Preverite repozitorij vsakega modela GitHub za smernice za prispevke in aktivna vprašanja.

Nalaganje modelov na zahtevo in razkladanje pri nedejavnosti za izmenjavo GPU pomnilnika. Naš GPU strežnik uporablja 20+ modelov na 4x Tesla P40 (96GB total VRAM) z dinamično nalaganjem. Za samohostovanje lahko en 24GB GPU hkrati služi 3-5 modelov.

Mnogi modeli zagotavljajo uradne Docker slike ali Dockerfiles. Za delovanje več modelov, lahko zgradite custom Docker nastavitev z NVIDIA Container Toolkit za dostop GPU. Naša API strežnik arhitektura lahko služi kot referenčna implementacija.

Večina modelov potrebuje Python 3.10-3.12 Coqui TTS (VITS) posebej potrebuje Python 3.11 Priporočamo Python 3.12 za večino modelov. Preverite zahteve vsakega modela.txt za natančno združljivost različic.

Da. licence MIT in Apache 2.0 izrecno omogočajo komercialno uporabo. Lahko gradite SaaS izdelke, mobilne aplikacije, igre in storitve, ki uporabljajo te modele brez licenciranja pristojbine, licenčnine ali zahteve pripisovanja (čeprav je pripisovanje cenjeno).
5.0/5 (1)

Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.

Poskusite odprti vir TTS danes

20+ modeli odprtega vira, vsi komercialno licencirani. Uporabite naš API ali samovoditelj – izbira je vaša.