Open Source modely prevodu textu na reč

Každý model TTS na našej platforme je open source s komerčne priateľskými licenciami. MIT, Apache 2.0 — žiadne proprietárne uzamknutie, žiadne obmedzenia používania, žiadne prekvapujúce licenčné poplatky.Používajte ich prostredníctvom nášho hosťovaného API alebo ich hosťujte na vlastnej infraštruktúre s plnou kontrolou.

Open source softvér Licencia MIT Apache 2.0 Self-hostable GitHub

Úplný TTS Editor Dokumentácia API

Vyskúšajte si to teraz

Text
Súbory

0/500

Zadarmo s Kokoro, Piper, VITS, MeloTTS

Vygenerovaný zvuk sa zobrazí tu

Otvoriť plný TTS editor

Open Source TTS Výhody

Prečo sú open source modely dôležité pre vaše projekty

Všetky Open-Source licencované

Každý model na TTS.ai používa permisívnu open-source licenciu, žiadne proprietárne čierne skrinky, žiadny vendor lock-in, žiadne neočakávané licenčné poplatky.

MIT / Apache 2.0

Modely sú licencované pod MIT alebo Apache 2.0, najviac tolerantnými open-source licenciami, ktoré umožňujú komerčné použitie, modifikáciu, redistribuciu — bez obmedzení.

Self-hostable

Stiahnite si akýkoľvek model a spustite ho na vlastnom hardvéri. Úplná kontrola nad vašimi dátami, latenciou a infraštruktúrou, bez nutnosti závislosti od cloudu.

Optimalizované pre GPU

Modely sú optimalizované pre grafické procesory NVIDIA s podporou CUDA. Piper beží iba na CPU, väčšina modelov potrebuje 2-8 GB VRAM pre efektívne odvodenie.

Komunita udržiavaná

Aktívne open-source komunity udržiavajú a vylepšujú tieto modely.Príspevky sú vítané — odošlite chyby, vylepšenia a nové hlasy na GitHub.

Komerčné použitie OK

Všetky modely umožňujú komerčné použitie v rámci ich licencií.Vytvárajte produkty, predávajte služby a vytvárajte komerčný obsah bez licenčných poplatkov alebo poplatkov za používanie.

Náš katalóg modelov s otvoreným zdrojovým kódom

Každý model, jeho licencia a to, čo robí najlepšie

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najlepšie pre: Apache 2.0 — najkvalitnejší voľný model, 82M parametrov, ľahký self-host

Skúste to. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najlepšie pre: MIT — len CPU, ideálne pre hraničné zariadenia a vstavaný self-hosting

Skúste to. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najlepšie pre: MIT — základná architektúra používaná mnohými downstream modelmi

Skúste to. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najlepšie pre: MIT — jedinečné možnosti generovania zvuku nad rámec štandardného TTS

Skúste to. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klonovanie hlasu

Najlepšie pre: Apache 2.0 — maximálna kvalita, široko študovaná referenčná implementácia

Skúste to. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonovanie hlasu

Najlepšie pre: MIT — open source klonovanie hlasu s granulárnym ovládaním štýlu

Skúste to. OpenVoice

Ako používať Open Source TTS

Použite naše hosťované rozhranie API alebo spustite modely sami

Preskúmajte open-source modely

Prejdite si náš katalóg viac ako 20 open-source TTS modelov.Každá stránka modelu zobrazuje licenciu, architektúru, možnosti a požiadavky na self-hosting.

Vyskúšajte vo svojom prehliadači

Testujte akýkoľvek model priamo na TTS.ai bez toho, aby ste museli čokoľvek inštalovať.Naše GPU servery sa starajú o spracovanie, takže môžete vyhodnotiť kvalitu predtým, ako sa zaviažete k samohostovaniu.

Self-Host alebo použite naše API

Klonujte repozitáre modelov z GitHubu a spustite ich lokálne alebo použite naše hosťované rozhranie API na produkciu.Vlastný hosting poskytuje úplnú kontrolu; naše rozhranie API poskytuje spravovanú infraštruktúru.

Vytvorte si svoju aplikáciu

Integrujte TTS do svojho produktu pomocou self-hosted modelov alebo nášho REST API Všetky modely sú komerčne využiteľné bez licenčných poplatkov alebo licenčných poplatkov.

Porovnanie licencií

Všetky modely na TTS.ai používajú komerčne priateľské open-source licencie

Model	Licencia	Atribúcia
Kokoro	Apache 2.0	Povinné
Piper	MIT	Voliteľné
VITS	MIT	Voliteľné
MeloTTS	MIT	Voliteľné
Chatterbox	MIT	Voliteľné
Tortoise TTS	Apache 2.0	Povinné
StyleTTS 2	MIT	Voliteľné
OpenVoice	MIT	Voliteľné
Sesame CSM	Apache 2.0	Povinné
Orpheus	Llama 3.2	"Built with Llama"

Try These Models Free

Self-Hosting vs hosťované API

Spustite modely sami alebo nechajte infraštruktúru na nás

Self-Host na vašom hardvéri

Každý model na TTS.ai je dostupný ako open source projekt na GitHub alebo Hugging Face. Stiahnite si váhy, nainštalujte závislosti a spustite dedukciu na svojich vlastných grafických procesoroch.Máte plnú kontrolu nad latenciou, súkromím a škálovaním.

Úplné súkromie dát – zvuk nikdy neopúšťa váš server
Žiadne náklady na požiadavku po počiatočnom nastavení
Vlastné doladenie na základe vlastných údajov
Vyžaduje hardvér GPU (odporúča sa NVIDIA)
Spravujete aktualizácie, škálovanie a závislosti

Použitie TTS.ai hosťovaného rozhrania API

Získajte okamžitý prístup k viac ako 20 modelom prostredníctvom jedného rozhrania REST API. Postaráme sa o zriadenie grafických procesorov, aktualizácie modelov, správu frontov a škálovanie.Jeden kľúč rozhrania API vám poskytne prístup ku každému modelu – nie je potrebné spravovať samostatné nasadenie.

Nie je potrebný žiadny hardvér GPU
Všetkých 20+ modelov cez jedno API
Automatické aktualizácie a vylepšenia modelov
99,9 % dostupnosť s redundantnou infraštruktúrou
Platíte len za to, čo používate

Use Hosted API Instead

Rýchly štart: API alebo Self-Host

Použite naše hosťované API alebo nainštalujte Kokoro lokálne v priebehu niekoľkých minút

Možnosť 1: TTS.ai Hosťované rozhranie API Najjednoduchšie

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Možnosť 2: Self-Host s pip Plná kontrola nad

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

View API Documentation

Open Source, cenovo dostupné ceny

Naše hosťované rozhranie API sprístupňuje TTS s otvoreným zdrojovým kódom bez správy grafických procesorov.

Free Tier 2

15 kreditov pri registrácii

4 open-source modely zadarmo
Žiadna registrácia pre základné použitie
Povolené komerčné použitie

Štart

500 000 znakov/mesiac

Všetkých 20+ open-source modelov
Klonovanie hlasu
Prístup k API

Pre

$29

2 000 000 znakov/mesiac

Prioritné spracovanie GPU
Všetky prémiové modely
Podpora pre podniky

Zobraziť plnú cenu

Často kladené otázky

Časté otázky o prevode textu na reč s otvoreným zdrojovým kódom

Áno. Každý model na TTS.ai používa permisívnu open-source licenciu — buď MIT alebo Apache 2.0. Výslovne vylučujeme modely s obmedzujúcimi licenciami (ako Coquiho CPML alebo nekomerčné CC-BY-NC). Môžete overiť licenciu každého modelu na jeho GitHub repozitári.

Obe sú permisívne open source licencie, ktoré umožňujú komerčné použitie, modifikáciu a redistribuciu. Apache 2.0 pridáva explicitné patentové udelenie a vyžaduje uvedenie zmien, ak upravujete kód. MIT je jednoduchší s menším počtom požiadaviek. Obe sú priateľské k podnikaniu.

Každý model môže byť hosťovaný samostatne.Naklonujte úložisko modelu z GitHubu, nainštalujte závislosti, stiahnite si váhy modelu a spustite odvodenie.Poskytujeme dokumentáciu pre požiadavky na vlastný hosting každého modelu vrátane GPU, RAM a verzie Pythonu.

Požiadavky sa líšia v závislosti od modelu. Piper nevyžaduje GPU (iba CPU). Kokoro a MeloTTS vyžadujú 1 až 2 GB pamäte VRAM. Väčšina štandardných modelov vyžaduje 4 GB pamäte VRAM. Tortoise a Sesame CSM vyžadujú 8 GB.

Modely ako GPT-SoVITS a Bark poskytujú skripty na jemné ladenie. Modely môžete trénovať na základe vlastných hlasových údajov, aby ste vytvorili vlastné hlasy alebo zlepšili výkon pre konkrétne jazyky.

Špičkové open-source modely (Kokoro, StyleTTS 2, Chatterbox) sa v súčasnosti vyrovnávajú alebo dokonca prekonávajú komerčné služby ako ElevenLabs a Google TTS v oblasti kvality, pričom hlavnou výhodou komerčných služieb je spravovaná infraštruktúra a podpora, nie kvalita zvuku.

XTTS/XTTS-v2 (Coquiho CPML — nekomerčné), F5-TTS (CC-BY-NC — nekomerčné) a Higgs-v2 (Bozónová licencia — obmedzujúca) boli všetky odstránené. Každý model na TTS.ai je overený ako bezpečný pre komerčné použitie.

Väčšina modelov prijíma príspevky komunity prostredníctvom GitHubu. Môžete odoslať hlásenia o chybách, hlasové nahrávky pre nové jazyky, vylepšenia kódu a dokumentáciu.Pozri GitHub repozitár každého modelu pre pokyny pre prispievanie a aktívne problémy.

Načítajte modely na požiadanie a uvoľnite ich, keď sú nečinné, aby ste zdieľali pamäť GPU. Náš GPU server spúšťa viac ako 20 modelov na 4x Tesla P40 (96 GB celkovej pamäte VRAM) pomocou dynamického načítania.

Mnohé modely poskytujú oficiálne obrazy Docker alebo Dockerfiles. Ak chcete spustiť viacero modelov, môžete vytvoriť vlastné nastavenie Docker s NVIDIA Container Toolkit pre prístup k GPU.Naša architektúra servera API môže slúžiť ako referenčná implementácia.

Väčšina modelov vyžaduje Python 3.10-3.12. Coqui TTS (VITS) vyžaduje Python 3.11. Pre väčšinu modelov odporúčame Python 3.12. Skontrolujte si requirements.txt každého modelu pre presnú kompatibilitu verzií.

Licencie MIT a Apache 2.0 výslovne povoľujú komerčné použitie. Môžete vytvárať produkty SaaS, mobilné aplikácie, hry a služby pomocou týchto modelov bez licenčných poplatkov, licenčných poplatkov alebo požiadaviek na uvedenie autorstva (aj keď uvedenie autorstva je vítané).

5.0/5 (1)

Vyskúšajte Open Source TTS ešte dnes

Viac ako 20 open-source modelov, všetky komerčne licencované. Použite naše API alebo self-host — voľba je na vás.

Zaregistrujte sa zdarma Zobraziť cenové ponuky

Open Source modely prevodu textu na reč

Vyskúšajte si to teraz

Láska TTS.ai? Povedzte svojim priateľom!

Open Source TTS Výhody

Všetky Open-Source licencované

MIT / Apache 2.0

Self-hostable

Optimalizované pre GPU

Komunita udržiavaná

Komerčné použitie OK

Náš katalóg modelov s otvoreným zdrojovým kódom

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Ako používať Open Source TTS

Preskúmajte open-source modely

Vyskúšajte vo svojom prehliadači

Self-Host alebo použite naše API

Vytvorte si svoju aplikáciu

Porovnanie licencií

Self-Hosting vs hosťované API

Self-Host na vašom hardvéri

Použitie TTS.ai hosťovaného rozhrania API

Rýchly štart: API alebo Self-Host

Open Source, cenovo dostupné ceny

Free Tier 2

Štart

Pre

Často kladené otázky

Sú všetky modely TTS.ai naozaj open source?

Aký je rozdiel medzi licenciami MIT a Apache 2.0?

Môžem tieto modelky hostiť na svojom vlastnom serveri?

Aký grafický procesor potrebujem na vlastné hosťovanie modelov TTS?

Môžem dolaďovať modely TTS s otvoreným zdrojovým kódom?

Ako sa open-source modely TTS porovnávajú s komerčnými službami?

Existujú nejaké modely s obmedzujúcimi licenciami, ktorým by som sa mal vyhnúť?

Môžem prispieť k týmto modelom s otvoreným zdrojovým kódom?

Ako môžem spustiť viacero modelov na jednom GPU serveri?

Existuje Docker image pre self-hosting?

Akú verziu Pythonu potrebujem pre self-hosting?

Môžem pomocou týchto modelov vytvoriť komerčný produkt?

Vyskúšajte Open Source TTS ešte dnes