Open Source Text-to-Speech Models

Svaki TTS model na našoj platformi je otvoreni kod sa komercijalno prihvatljivim licencama. MIT, Apache 2.0 — bez vlasničkog zaključavanja, bez ograničenja upotrebe, bez iznenađujućih naknada za licenciranje. Koristite ih putem našeg hosted API-ja, ili ih sami hostirajte na vlastitoj infrastrukturi sa punom kontrolom.

Otvoren kod MIT licenca Apache Self-hosted GitHub

Probaj sada

Besplatno sa Kokoro, Piper, VITS, MeloTTS
Vaš generirani audio će se pojaviti ovdje
Generirano
Preuzmi
Volite TTS.ai?

Open Source TTS Prednosti

Zašto su modeli otvorenog koda važni za vaše projekte

Open Source Licences

Svaki model na TTS.ai koristi permisivnu licencu otvorenog koda, bez vlasničkih crnih kutija, bez ograničenja proizvođača, bez neočekivanih naknada za licenciranje.

Apache

Modeli su licencirani pod MIT ili Apache 2.0, najpermisivnijim licencama otvorenog koda. Koristite komercijalno, mijenjajte, redistribuirajte — bez ograničenja.

Self-hosted

Preuzmite bilo koji model i pokrenite ga na svom hardveru. Potpuna kontrola nad podacima, zakašnjenjem i infrastrukturom. Nema potrebe za ovisnosti o oblaku.

Optimizirano za GPU

Modeli su optimizirani za NVIDIA GPU-ove sa CUDA podrškom. Piper radi samo na CPU-u. Većini modela treba 2-8GB VRAM-a za efikasno zaključivanje.

Održavanje zajednice

Aktivne zajednice otvorenog koda održavaju i poboljšavaju ove modele.Doprinosi su dobrodošli — pošaljite bugove, poboljšanja i nove glasove na GitHub.

Komercijalna upotreba OK

Svi modeli dozvoljavaju komercijalnu upotrebu pod svojim licencama. Izgradite proizvode, prodajte usluge i kreirajte komercijalni sadržaj bez naknada ili naknada za korištenje.

Naš katalog modela otvorenog koda

Svaki model, njegova licenca, i ono što najbolje radi

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najbolje za: Apache 2.0 — najbolji kvalitet slobodan model, 82M parama, jednostavan za self-host

Pokušaj. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najbolje za: MIT — samo CPU, savršeno za rubne uređaje i ugrađeni self-hosting

Pokušaj. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najbolje za: MIT — temeljna arhitektura koja se koristi u mnogim nizvodnim modelima

Pokušaj. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najbolje za: MIT — jedinstvene mogućnosti generiranja zvuka izvan standardnog TTS-a

Pokušaj. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Kloniranje glasa

Najbolje za: Apache 2.0 — maksimalni kvalitet, široko proučavana referentna implementacija

Pokušaj. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Kloniranje glasa

Najbolje za: MIT — open source kloniranje glasa sa granularnom kontrolom stila

Pokušaj. OpenVoice

Kako koristiti TTS otvorenog koda

Koristite naš hostirani API ili sami pokrenite modele

1

Istražite modele otvorenog koda

Pregledajte naš katalog od preko 20 modela TTS-a otvorenog koda. Svaka stranica modela prikazuje licencu, arhitekturu, mogućnosti i zahtjeve za samohosting.

2

Pokušajte u svom pregledniku

Testirajte bilo koji model direktno na TTS.ai bez instaliranja ičega. Naši GPU serveri upravljaju procesom tako da možete procijeniti kvalitet prije nego što se odlučite za samohosting.

3

Samo-hosting ili koristite naš API

Clone model repos from GitHub and run locally, or use our hosted API for production. Self-hosting gives full control; our API provides managed infrastructure.

4

Izgradite svoju aplikaciju

Integrirajte TTS u svoj proizvod koristeći self-hosted modele ili naš REST API. Svi modeli su komercijalno upotrebljivi bez naknada za licenciranje ili autorskih prava.

Usporedba licenci

Svi modeli na TTS.ai koriste komercijalno prihvatljive licence otvorenog koda

Model Licenca Komercijalna upotreba Izmjena Self Host Atributi
Kokoro Apache 2.0 Obvezno
Piper MIT Neobavezno
VITS MIT Neobavezno
MeloTTS MIT Neobavezno
Chatterbox MIT Neobavezno
Tortoise TTS Apache 2.0 Obvezno
StyleTTS 2 MIT Neobavezno
OpenVoice MIT Neobavezno
Sesame CSM Apache 2.0 Obvezno
Orpheus Llama 3.2 "Built with Llama"

Hosted API

Upravljajte modelima sami ili prepustite nama upravljanje infrastrukturom

SelfHost na vašem hardveru

Svaki model na TTS.ai je dostupan kao projekt otvorenog koda na GitHub-u ili Hugging Face-u. Preuzmite težine, instalirajte zavisnosti i pokrenite zaključivanje na vlastitim GPU-ovima. Imate potpunu kontrolu nad latencijom, privatnošću i skaliranjem.

  • Potpuna privatnost podataka — zvuk nikad ne napušta vaš server
  • Nema troškova po zahtjevu nakon početnog podešavanja
  • Prilagođeno fino podešavanje na vlastitim podacima
  • Zahtijeva GPU hardver (NVIDIA preporučeno)
  • Vi upravljate ažuriranjem, skaliranjem i zavisnostima

Koristi TTS.ai Hosted API

Dobijte trenutni pristup svim 20+ modelima putem jednog REST API-ja. Mi se bavimo GPU-ovim osiguravanjem, ažuriranjem modela, upravljanjem redom i skaliranjem. Jedan API ključ vam daje pristup svakom modelu - nema potrebe za upravljanjem zasebnim implementacijama.

  • Nije potreban GPU hardver
  • Svih 20+ modela kroz jedan API
  • Automatska ažuriranja i poboljšanja modela
  • 99,9% uptime sa redundantnom infrastrukturom
  • Plaćaš samo ono što koristiš.

Brzi početak: API ili SelfHost

Koristite naš hostirani API, ili instalirajte Kokoro lokalno za nekoliko minuta

Opcija 1: TTS.ai Hosted API Najlakše
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opcija 2: Self-Host sa pip Potpuna kontrola
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Otvoren kod, pristupačne cijene

Naš hostirani API čini TTS otvorenim izvorom pristupačnim bez upravljanja GPU-ovima.

Slobodni nivo

$0

15.000 znakova pri registraciji

  • 4 open-source modela besplatno
  • Nema registracije za osnovnu upotrebu
  • Komercijalna upotreba dozvoljena

Starter

$9

500 kredita/mjesečno

  • Svih 20+ modela otvorenog koda
  • Kloniranje glasa
  • API pristup

Pro

$29

2,000,000 znakova/mjesečno

  • Prioritet GPU obrade
  • Svi premium modeli
  • Enterprise Support
Pogledaj cijelu cijenu

Često postavljana pitanja

Uobičajena pitanja o otvorenom tekstu u govor

Da. Svaki model na TTS.ai koristi permisivnu open-source licencu — bilo MIT ili Apache 2.0. Izričito isključujemo modele sa restriktivnim licencama (kao što je Coqui's CPML ili nekomercijalno CC-BY-NC). Licencu svakog modela možete provjeriti na njegovom GitHub repozitoriju.

Obje su permisivne licence otvorenog koda koje dozvoljavaju komercijalnu upotrebu, izmjenu i redistribuciju. Apache 2.0 dodaje eksplicitne patentne dozvole i zahtijeva da se navode promjene ako mijenjate kod. MIT je jednostavniji s manje zahtjeva. Obje su poslovno prihvatljive.

Da. Svaki model može biti samohosting. Klonirajte repozitorij modela sa GitHub-a, instalirajte zavisnosti, skinite težine modela, i pokrenite zaključivanje. Pružamo dokumentaciju za zahtjeve samohosting-a svakog modela uključujući GPU, RAM, i Python verziju.

Zahtjevi se razlikuju po modelu. Piper ne treba GPU (samo CPU). Kokoro i MeloTTS trebaju 1-2GB VRAM. Većina standardnih modela treba 4GB VRAM. Tortoise i Sesame CSM trebaju 8GB. NVIDIA RTX 3060 (12GB) može udobno pokrenuti većinu modela.

Da. Licence otvorenog koda dozvoljavaju izmjene uključujući i fino podešavanje. Modeli kao što su GPT-SoVITS i Bark pružaju skripte za fino podešavanje. Možete trenirati modele na vlastitim glasovnim podacima kako biste stvorili prilagođene glasove ili poboljšali performanse za određene jezike.

Vrhunski modeli otvorenog koda (Kokoro, StyleTTS 2, Chatterbox) sada odgovaraju ili premašuju komercijalne servise poput ElevenLabs i Google TTS u kvalitetu.Glavna prednost komercijalnih servisa je upravljana infrastruktura i podrška, a ne kvalitet zvuka.

Već smo ih isključili. XTTS/XTTS-v2 (Coqui's CPML — nekomercijalno), F5-TTS (CC-BY-NC — nekomercijalno), i Higgs-v2 (Boson License — restriktivno) su svi uklonjeni. Svaki model na TTS.ai je provjeren da je siguran za komercijalnu upotrebu.

Da. Većina modela prihvaća doprinose zajednice putem GitHub-a. Možete slati izvještaje o greškama, glasovne snimke za nove jezike, poboljšanja koda i dokumentaciju. Provjerite GitHub repozitorij svakog modela za smjernice doprinosa i aktivna pitanja.

Učitavanje modela na zahtjev i istovar kada je neaktivan za dijeljenje memorije GPU-a. Naš GPU server pokreće 20+ modela na 4x Tesla P40 (96GB ukupnog VRAM-a) koristeći dinamičko učitavanje. Za samohosting, jedan GPU od 24GB može istovremeno poslužiti 3-5 modela.

Mnogi modeli pružaju službene Docker slike ili Dockerfile. Za pokretanje više modela, možete izgraditi prilagođenu Docker postavku sa NVIDIA Container Toolkit za GPU pristup. Naša API server arhitektura može poslužiti kao referentna implementacija.

Većina modela zahtijeva Python 3.10-3.12. Coqui TTS (VITS) posebno zahtijeva Python 3.11. Preporučujemo Python 3.12 za većinu modela. Provjerite requirements.txt svakog modela za tačnu kompatibilnost verzije.

Da. MIT i Apache 2.0 licence eksplicitno dozvoljavaju komercijalnu upotrebu. Možete graditi SaaS proizvode, mobilne aplikacije, igre i usluge koristeći ove modele bez naknada za licenciranje, autorskih prava, ili zahtjeva za atribuciju (iako je atribucija cijenjena).
5.0/5 (1)

Šta možemo da poboljšamo? Vaše povratne informacije nam pomažu da riješimo probleme.

Probaj danas TTS otvorenog koda

20+ modela otvorenog koda, svi komercijalno licencirani. Koristite naš API ili self-host - izbor je vaš.