Prijavi grešku / Zahtjev za značajkom

Open Source Text-to-Speech Models

Svaki TTS model na našoj platformi je otvoreni kod sa komercijalno prihvatljivim licencama. MIT, Apache 2.0 — bez vlasničkog zaključavanja, bez ograničenja upotrebe, bez iznenađujućih naknada za licenciranje. Koristite ih putem našeg hosted API-ja, ili ih sami hostirajte na vlastitoj infrastrukturi sa punom kontrolom.

Otvoren kod MIT licenca Apache Self-hosted GitHub

Potpuni TTS editor API dokumentacija

Probaj sada

0/500

Besplatno sa Kokoro, Piper, VITS, MeloTTS

Vaš generirani audio će se pojaviti ovdje

Otvori potpuni TTS editor

Open Source TTS Prednosti

Zašto su modeli otvorenog koda važni za vaše projekte

Open Source Licences

Svaki model na TTS.ai koristi permisivnu licencu otvorenog koda, bez vlasničkih crnih kutija, bez ograničenja proizvođača, bez neočekivanih naknada za licenciranje.

Apache

Modeli su licencirani pod MIT ili Apache 2.0, najpermisivnijim licencama otvorenog koda. Koristite komercijalno, mijenjajte, redistribuirajte — bez ograničenja.

Self-hosted

Preuzmite bilo koji model i pokrenite ga na svom hardveru. Potpuna kontrola nad podacima, zakašnjenjem i infrastrukturom. Nema potrebe za ovisnosti o oblaku.

Optimizirano za GPU

Modeli su optimizirani za NVIDIA GPU-ove sa CUDA podrškom. Piper radi samo na CPU-u. Većini modela treba 2-8GB VRAM-a za efikasno zaključivanje.

Održavanje zajednice

Aktivne zajednice otvorenog koda održavaju i poboljšavaju ove modele.Doprinosi su dobrodošli — pošaljite bugove, poboljšanja i nove glasove na GitHub.

Komercijalna upotreba OK

Svi modeli dozvoljavaju komercijalnu upotrebu pod svojim licencama. Izgradite proizvode, prodajte usluge i kreirajte komercijalni sadržaj bez naknada ili naknada za korištenje.

Naš katalog modela otvorenog koda

Svaki model, njegova licenca, i ono što najbolje radi

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najbolje za: Apache 2.0 — najbolji kvalitet slobodan model, 82M parama, jednostavan za self-host

Pokušaj. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najbolje za: MIT — samo CPU, savršeno za rubne uređaje i ugrađeni self-hosting

Pokušaj. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najbolje za: MIT — temeljna arhitektura koja se koristi u mnogim nizvodnim modelima

Pokušaj. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najbolje za: MIT — jedinstvene mogućnosti generiranja zvuka izvan standardnog TTS-a

Pokušaj. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloniranje glasa

Najbolje za: Apache 2.0 — maksimalni kvalitet, široko proučavana referentna implementacija

Pokušaj. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloniranje glasa

Najbolje za: MIT — open source kloniranje glasa sa granularnom kontrolom stila

Pokušaj. OpenVoice

Kako koristiti TTS otvorenog koda

Koristite naš hostirani API ili sami pokrenite modele

Istražite modele otvorenog koda

Pregledajte naš katalog od preko 20 modela TTS-a otvorenog koda. Svaka stranica modela prikazuje licencu, arhitekturu, mogućnosti i zahtjeve za samohosting.

Pokušajte u svom pregledniku

Testirajte bilo koji model direktno na TTS.ai bez instaliranja ičega. Naši GPU serveri upravljaju procesom tako da možete procijeniti kvalitet prije nego što se odlučite za samohosting.

Samo-hosting ili koristite naš API

Clone model repos from GitHub and run locally, or use our hosted API for production. Self-hosting gives full control; our API provides managed infrastructure.

Izgradite svoju aplikaciju

Integrirajte TTS u svoj proizvod koristeći self-hosted modele ili naš REST API. Svi modeli su komercijalno upotrebljivi bez naknada za licenciranje ili autorskih prava.

Usporedba licenci

Svi modeli na TTS.ai koriste komercijalno prihvatljive licence otvorenog koda

Model	Licenca	Atributi
Kokoro	Apache 2.0	Obvezno
Piper	MIT	Neobavezno
VITS	MIT	Neobavezno
MeloTTS	MIT	Neobavezno
Chatterbox	MIT	Neobavezno
Tortoise TTS	Apache 2.0	Obvezno
StyleTTS 2	MIT	Neobavezno
OpenVoice	MIT	Neobavezno
Sesame CSM	Apache 2.0	Obvezno
Orpheus	Llama 3.2	"Built with Llama"

Isprobaj ove modele besplatno

Hosted API

Upravljajte modelima sami ili prepustite nama upravljanje infrastrukturom

SelfHost na vašem hardveru

Svaki model na TTS.ai je dostupan kao projekt otvorenog koda na GitHub-u ili Hugging Face-u. Preuzmite težine, instalirajte zavisnosti i pokrenite zaključivanje na vlastitim GPU-ovima. Imate potpunu kontrolu nad latencijom, privatnošću i skaliranjem.

Potpuna privatnost podataka — zvuk nikad ne napušta vaš server
Nema troškova po zahtjevu nakon početnog podešavanja
Prilagođeno fino podešavanje na vlastitim podacima
Zahtijeva GPU hardver (NVIDIA preporučeno)
Vi upravljate ažuriranjem, skaliranjem i zavisnostima

Koristi TTS.ai Hosted API

Dobijte trenutni pristup svim 20+ modelima putem jednog REST API-ja. Mi se bavimo GPU-ovim osiguravanjem, ažuriranjem modela, upravljanjem redom i skaliranjem. Jedan API ključ vam daje pristup svakom modelu - nema potrebe za upravljanjem zasebnim implementacijama.

Nije potreban GPU hardver
Svih 20+ modela kroz jedan API
Automatska ažuriranja i poboljšanja modela
99,9% uptime sa redundantnom infrastrukturom
Plaćaš samo ono što koristiš.

Umjesto toga koristite hosted API

Brzi početak: API ili SelfHost

Koristite naš hostirani API, ili instalirajte Kokoro lokalno za nekoliko minuta

Opcija 1: TTS.ai Hosted API Najlakše

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opcija 2: Self-Host sa pip Potpuna kontrola

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Prikaži API dokumentaciju

Otvoren kod, pristupačne cijene

Naš hostirani API čini TTS otvorenim izvorom pristupačnim bez upravljanja GPU-ovima.

Slobodni nivo

15.000 znakova pri registraciji

4 open-source modela besplatno
Nema registracije za osnovnu upotrebu
Komercijalna upotreba dozvoljena

Starter

500 kredita/mjesečno

Svih 20+ modela otvorenog koda
Kloniranje glasa
API pristup

Pro

$29

2,000,000 znakova/mjesečno

Prioritet GPU obrade
Svi premium modeli
Enterprise Support

Pogledaj cijelu cijenu

Često postavljana pitanja

Uobičajena pitanja o otvorenom tekstu u govor

Da. Svaki model na TTS.ai koristi permisivnu open-source licencu — bilo MIT ili Apache 2.0. Izričito isključujemo modele sa restriktivnim licencama (kao što je Coqui's CPML ili nekomercijalno CC-BY-NC). Licencu svakog modela možete provjeriti na njegovom GitHub repozitoriju.

Obje su permisivne licence otvorenog koda koje dozvoljavaju komercijalnu upotrebu, izmjenu i redistribuciju. Apache 2.0 dodaje eksplicitne patentne dozvole i zahtijeva da se navode promjene ako mijenjate kod. MIT je jednostavniji s manje zahtjeva. Obje su poslovno prihvatljive.

Da. Svaki model može biti samohosting. Klonirajte repozitorij modela sa GitHub-a, instalirajte zavisnosti, skinite težine modela, i pokrenite zaključivanje. Pružamo dokumentaciju za zahtjeve samohosting-a svakog modela uključujući GPU, RAM, i Python verziju.

Zahtjevi se razlikuju po modelu. Piper ne treba GPU (samo CPU). Kokoro i MeloTTS trebaju 1-2GB VRAM. Većina standardnih modela treba 4GB VRAM. Tortoise i Sesame CSM trebaju 8GB. NVIDIA RTX 3060 (12GB) može udobno pokrenuti većinu modela.

Da. Licence otvorenog koda dozvoljavaju izmjene uključujući i fino podešavanje. Modeli kao što su GPT-SoVITS i Bark pružaju skripte za fino podešavanje. Možete trenirati modele na vlastitim glasovnim podacima kako biste stvorili prilagođene glasove ili poboljšali performanse za određene jezike.

Vrhunski modeli otvorenog koda (Kokoro, StyleTTS 2, Chatterbox) sada odgovaraju ili premašuju komercijalne servise poput ElevenLabs i Google TTS u kvalitetu.Glavna prednost komercijalnih servisa je upravljana infrastruktura i podrška, a ne kvalitet zvuka.

Već smo ih isključili. XTTS/XTTS-v2 (Coqui's CPML — nekomercijalno), F5-TTS (CC-BY-NC — nekomercijalno), i Higgs-v2 (Boson License — restriktivno) su svi uklonjeni. Svaki model na TTS.ai je provjeren da je siguran za komercijalnu upotrebu.

Da. Većina modela prihvaća doprinose zajednice putem GitHub-a. Možete slati izvještaje o greškama, glasovne snimke za nove jezike, poboljšanja koda i dokumentaciju. Provjerite GitHub repozitorij svakog modela za smjernice doprinosa i aktivna pitanja.

Učitavanje modela na zahtjev i istovar kada je neaktivan za dijeljenje memorije GPU-a. Naš GPU server pokreće 20+ modela na 4x Tesla P40 (96GB ukupnog VRAM-a) koristeći dinamičko učitavanje. Za samohosting, jedan GPU od 24GB može istovremeno poslužiti 3-5 modela.

Mnogi modeli pružaju službene Docker slike ili Dockerfile. Za pokretanje više modela, možete izgraditi prilagođenu Docker postavku sa NVIDIA Container Toolkit za GPU pristup. Naša API server arhitektura može poslužiti kao referentna implementacija.

Većina modela zahtijeva Python 3.10-3.12. Coqui TTS (VITS) posebno zahtijeva Python 3.11. Preporučujemo Python 3.12 za većinu modela. Provjerite requirements.txt svakog modela za tačnu kompatibilnost verzije.

Da. MIT i Apache 2.0 licence eksplicitno dozvoljavaju komercijalnu upotrebu. Možete graditi SaaS proizvode, mobilne aplikacije, igre i usluge koristeći ove modele bez naknada za licenciranje, autorskih prava, ili zahtjeva za atribuciju (iako je atribucija cijenjena).

5.0/5 (1)

Probaj danas TTS otvorenog koda

20+ modela otvorenog koda, svi komercijalno licencirani. Koristite naš API ili self-host - izbor je vaš.

Prijavite se besplatno Prikaži cijene

Open Source Text-to-Speech Models

Probaj sada

Volite TTS.ai?

Open Source TTS Prednosti

Open Source Licences

Apache

Self-hosted

Optimizirano za GPU

Održavanje zajednice

Komercijalna upotreba OK

Naš katalog modela otvorenog koda

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Kako koristiti TTS otvorenog koda

Istražite modele otvorenog koda

Pokušajte u svom pregledniku

Samo-hosting ili koristite naš API

Izgradite svoju aplikaciju

Usporedba licenci

Hosted API

SelfHost na vašem hardveru

Koristi TTS.ai Hosted API

Brzi početak: API ili SelfHost

Otvoren kod, pristupačne cijene

Slobodni nivo

Starter

Pro

Često postavljana pitanja

Da li su svi modeli TTS.ai stvarno otvoreni?

Koja je razlika između MIT i Apache 2.0 licenci?

Mogu li da sam hostujem ove modele na svom serveru?

Koji GPU mi treba da samohosting TTS modele?

Mogu li fino podesiti TTS modele otvorenog koda?

Kako se TTS modeli otvorenog koda uspoređuju sa komercijalnim uslugama?

Postoje li modeli sa restriktivnim licencama koje bih trebao izbjegavati?

Mogu li doprinijeti ovim modelima otvorenog koda?

Kako mogu pokrenuti više modela na jednom GPU serveru?

Postoji li Docker slika za samohosting?

Koja verzija Pythona mi treba za samohosting?

Mogu li napraviti komercijalni proizvod koristeći ove modele?

Probaj danas TTS otvorenog koda