Modeli otvorenog izvornog teksta za govor

Svaki TTS model na našoj platformi je otvoren izvor s komercijalno prijatnim licencama. MIT, Apache 2.0 – bez vlasništva priključka, bez ograničenja korištenja, bez iznenađujućih naknada za licenciranje. Koristite ih preko domaćina API, ili samo-host ih na vlastitoj infrastrukturi s punom kontrolom.

Otvori izvor MIT dozvola Apači 2.0 Samougostiteljstvo GitHub

Pokušaj sada

Besplatno s Kokoro, Piper, VITS, Melotts
Vaš generirani zvuk će se pojaviti ovdje
Generirano
Preuzmi
Reci svojim prijateljima!

Koristi otvorenog izvora TTS

Zašto su modeli otvorenog izvora važni za vaše projekte

Svi otvoreni izvorni licencirani

Svaki model na TTS.ai koristi popustljivu licencu otvorenog izvora. Nema vlasništva crne kutije, nema prodavaca zaključavanja, nema neočekivanih naknada za licenciranje.

MIT / Apači 2.0

Modeli su licencirani pod MIT ili Apache 2.0, najpovoljnije dozvole otvorenog izvora. Komercijalno koristiti, modificirati, predistribuirati – bez ograničenja.

Samougostiteljstvo

Preuzmite bilo koji model i pokrenite ga na vlastitom hardveru. Puna kontrola nad svojim podacima, latencije, i infrastrukture. Nije potrebna ovisnost oblaka.

GPU optimiziran

Modeli su optimizirani za NVIDIA GPUs s podrškom CUDA. Piper pokreće samo na CPU. Većina modela treba 2-8GB VRAM za efikasan zaključak.

Zajednica održavana

Aktivne zajednice otvorenog izvora održavaju i poboljšavaju te modele. Doprinosi dobrodošli — podnošenje grešaka, poboljšanja, i nove glasove na GitHub.

Komercijalna upotreba OK

Svi modeli omogućuju komercijalnu upotrebu pod njihovim licencama. Izgraditi proizvode, prodati usluge, i stvoriti komercijalne sadržaje bez honorara ili naknada za korištenje.

Naš katalog Open source modela

Svaki model, njena dozvola, i ono što je najbolje

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najbolje za: Apache 2.0 — najkvalitetniji besplatni model, 82M params, jednostavan za samostalnog domaćina

Pokušaj Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najbolje za: MIT – samo CPU-samo, savršen za rubne uređaje i ugrađene samo-hosting

Pokušaj Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najbolje za: MIT — temeljna arhitektura koju koriste mnogi nizvodni modeli

Pokušaj VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najbolje za: MIT – jedinstvene mogućnosti proizvodnje zvuka izvan standardnog TTS-a

Pokušaj Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloniranje glasa

Najbolje za: Apache 2.0 — maksimalna kvaliteta, proučavana referentna provedba

Pokušaj Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloniranje glasa

Najbolje za: MIT – kloniranje glasa otvorenog izvora s kontrolom granuliranog stila

Pokušaj OpenVoice

Kako koristiti otvoreni izvor TTS

Koristite naše domaće API ili pokrenite modele sami

1

Istražite modele otvorenog izvora

Pregledajte naš katalog 20+ modela otvorenog izvora TTS. Svaka stranica modela prikazuje licencu, arhitekturu, mogućnosti i zahtjeve za samohosting.

2

Pokušaj u svom pregledniku

Testirajte bilo koji model direktno na TTS.ai bez instalacije ništa. Naši GPU poslužitelji rukovati obradu tako da možete ocijeniti kvalitetu prije nego se obvezuju na samo-hosting.

3

Samostalnost ili korištenje naše API

Klonov model repos iz GitHub i pokrenuti lokalno, ili koristiti naš domaćin API za proizvodnju. Self-hosting daje punu kontrolu; naš API pruža upravljanu infrastrukturu.

4

Izgradite vašu aplikaciju

Integrirajte TTS u svoj proizvod koristeći samostalne modele ili naš REST API. Svi modeli su komercijalno upotrebljivi bez licencijskih naknada ili autorskih honorarara.

Usporedba licence

Svi modeli na TTS.ai korištenja komercijalno prijatne dozvole otvorenog izvora

Uzorak Dozvola Komercijalna upotreba Izmjena Samostalnost Atribucija
Kokoro Apache 2.0 Potrebno
Piper MIT Slobodno
VITS MIT Slobodno
MeloTTS MIT Slobodno
Chatterbox MIT Slobodno
Tortoise TTS Apache 2.0 Potrebno
StyleTTS 2 MIT Slobodno
OpenVoice MIT Slobodno
Sesame CSM Apache 2.0 Potrebno
Orpheus Llama 3.2 "Built with Llama"

Samoposjećivanje i domaćinski API

Pokrenite modele sami ili pustite nas da upravljamo infrastrukturom

Samopouzdanost na hardveru

Svaki model na TTS.ai je dostupan kao projekt otvorenog izvora na GitHub ili Hugging Face. Preuzmite težine, instalirajte ovisnosti, i pokrenite inferenciju na vlastiti GPUs. Imate punu kontrolu nad latencijom, privatnost, i skaliranje.

  • Puna privatnost podataka — zvuk nikada ne ostavlja vaš poslužitelj
  • Bez troškova po zahtjevu nakon početne konfiguracije
  • Prilagođeno uklapanje na vlastite podatke
  • Zahtjeva GPU hardver (preporučena NVIDIA)
  • Upravljate ažuriranjem, skaliranjem i ovisnostima

Koristi TTS.ai domaćinski API

Dobiti instant pristup svim 20+ modela kroz jedan REST API. Mi rukujemo GPU opskrbu, ažuriranje modela, upravljanje redom, i skaliranje. Jedan API ključ vam daje pristup svakom modelu – nema potrebe za upravljanjem odvojenim raspoređivanjem.

  • GPU hardver nije potreban
  • Svi 20+ modeli kroz jedan API
  • Automatska ažuriranja modela i poboljšanja
  • 99,9% ispunjenog vremena s suvišnom infrastrukturom
  • Platite samo za ono što koristite

Brzi početak: API ili samo-host

Koristite naš domaćinski API, ili instalirajte Kokoro lokalno u minutama

Opcija 1: TTS.ai Hosted API Najlakše
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opcija 2: Samo-Host s pip Puna kontrola
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Otvoreni izvor, dostupne cijene

Naš domaćin API čini otvoreni-source TTS dostupan bez upravljanja GPUs.

Slobodan redoslijed

$0

15.000 znakova na prijavi

  • 4 modela otvorenog izvora besplatno
  • Nema prijave za osnovnu upotrebu
  • Dozvoljeno trgovačko korištenje

Pokretanje

$9

500.000 znakova/mjesečno

  • Svi 20+ modeli otvorenog izvora
  • Kloniranje glasa
  • API pristup

Profesionalno

$29

2.000.000 znakova/mjesečno

  • Prioritetna obrada GPU-a
  • Svi premium modeli
  • Podrška poduzeća
Pogledaj punu cijene

Česta pitanja

Uobičajna pitanja o otvorenom izvornom tekstu govora

Da. Svaki model na TTS.ai koristi permisivnu licencu otvorenog izvora – ili MIT ili Apache 2.0. Mi posebno isključujemo modele s ograničavajućim licencama (kao što je Coqui CPML ili nekomercijalni CC-BY-NC). Možete provjeriti licencu svakog modela na svom GitHub repozitoriju.

Obje su dopuštene dozvole otvorenog izvora omogućuju komercijalnu upotrebu, modifikaciju i preraspodjelu. Apache 2.0 dodaje izričite patentne dotacije i zahtijeva izjavu promjena ako modificirate kod. MIT je jednostavniji s manje zahtjeva. Obojica su poslovni prijatni.

Da. Svaki model može biti samostalno domaćin. Klonirati repozitorij modela iz GitHub, instalirati ovisnosti, preuzimanje modela težine, i pokrenuti zaključak. Mi pružamo dokumentaciju za zahtjeve svakog modela samo-hosting uključujući GPU, RAM i Python verziju.

Zahtjevi variraju prema modelu. Piper ne treba GPU (samo CPU). Kokoro i Melotts trebaju 1-2GB VRAM. Većini standardnih modela treba 4GB VRAM. Tortoise i Sesame CSM trebaju 8GB. NVIDIA RTX 3060 (12GB) može pokrenuti većinu modela udobno.

Da. Open-source dozvole omogućuju izmjene uključujući fino uklapanje. Modeli kao što su GPT-SoviTS i Bark pružaju fino uklapanje skripta. Možete trenirati modele na vlastitim glasovnim podacima za stvaranje vlastitih glasova ili poboljšanje performanse za određene jezike.

Najbolji modeli otvorenog izvora (Kokoro, StyleTTS 2, Chatterbox) sada poklapaju ili nadmašuju komercijalne usluge kao što su 11Labs i Google TTS u kvalitetnim mjerilima. Glavna prednost komercijalnih usluga je upravljanje infrastrukturom i podrškom, a ne audio kvalitetom.

Već smo ih isključili. XTTS/XTS-v2 (Coquijev CPML – nekomercijalni), F5-TTS (CC-BY-NC – nekomercijalni) i Higgs-v2 (Bosonova licenca – restryktivna) uklonjeni su. Svaki model na TTS.ai je provjeren komercijalno-uporabe sef.

Da. Većina modela prihvaća doprinose zajednice preko GitHub. Možete poslati izvješća o greškama, glasovne snimke za nove jezike, poboljšanja koda i dokumentaciju. Provjerite svaki model GitHub repozitorij za doprinose i aktivna pitanja.

Učitavanje modela na zahtjev i istovar kada je neuspješan za dijeljenje GPU memorije. Naš GPU poslužitelj pokreće 20+ modela na 4x Tesla P40 (96GB ukupno VRAM) koristeći dinamičko opterećenje. Za samohosting, jedan 24GB GPU može istovremeno služiti 3-5 modela.

Mnogi modeli pružaju službene Docker slike ili Dockerfiles. Za pokretanje više modela, možete izgraditi custom Docker postavke s NVIDIA Container Toolkit za pristup GPU. Naš API server arhitektura može služiti kao referentna implementacija.

Većina modela zahtijeva Python 3.10-3.12. Coqui TTS (VITS) posebno zahtijeva Python 3.11. Preporučujemo Python 3.12 za većinu modela. Provjerite zahtjeve svakog modela.txt za točnu kompatibilnost verzije.

Da. MIT i Apache 2.0 licence izričito omogućuju komercijalnu upotrebu. Možete izgraditi SaaS proizvode, mobilne aplikacije, igre i usluge koristeći ove modele bez licenciranja naknade, honorarnosti, ili zahtjeva za pripisivanje (iako se cijeni pripisivanje).
5.0/5 (1)

Što možemo poboljšati? Vaša povratna informacija nam pomaže riješiti probleme.

Pokušajte Open source TTS danas

20+ Open-source modeli, svi komercijalno licencirani. Koristite naš API ili samo-domaćin – izbor je vaš.