Open Source modely prevodu textu na reč

Každý model TTS na našej platforme je open source s komerčne priateľskými licenciami. MIT, Apache 2.0 — žiadne proprietárne uzamknutie, žiadne obmedzenia používania, žiadne prekvapujúce licenčné poplatky.Používajte ich prostredníctvom nášho hosťovaného API alebo ich hosťujte na vlastnej infraštruktúre s plnou kontrolou.

Open source softvér Licencia MIT Apache 2.0 Self-hostable GitHub

Vyskúšajte si to teraz

Zadarmo s Kokoro, Piper, VITS, MeloTTS
Vygenerovaný zvuk sa zobrazí tu
Generované
Stiahnuť
Láska TTS.ai? Povedzte svojim priateľom!

Open Source TTS Výhody

Prečo sú open source modely dôležité pre vaše projekty

Všetky Open-Source licencované

Každý model na TTS.ai používa permisívnu open-source licenciu, žiadne proprietárne čierne skrinky, žiadny vendor lock-in, žiadne neočakávané licenčné poplatky.

MIT / Apache 2.0

Modely sú licencované pod MIT alebo Apache 2.0, najviac tolerantnými open-source licenciami, ktoré umožňujú komerčné použitie, modifikáciu, redistribuciu — bez obmedzení.

Self-hostable

Stiahnite si akýkoľvek model a spustite ho na vlastnom hardvéri. Úplná kontrola nad vašimi dátami, latenciou a infraštruktúrou, bez nutnosti závislosti od cloudu.

Optimalizované pre GPU

Modely sú optimalizované pre grafické procesory NVIDIA s podporou CUDA. Piper beží iba na CPU, väčšina modelov potrebuje 2-8 GB VRAM pre efektívne odvodenie.

Komunita udržiavaná

Aktívne open-source komunity udržiavajú a vylepšujú tieto modely.Príspevky sú vítané — odošlite chyby, vylepšenia a nové hlasy na GitHub.

Komerčné použitie OK

Všetky modely umožňujú komerčné použitie v rámci ich licencií.Vytvárajte produkty, predávajte služby a vytvárajte komerčný obsah bez licenčných poplatkov alebo poplatkov za používanie.

Náš katalóg modelov s otvoreným zdrojovým kódom

Každý model, jeho licencia a to, čo robí najlepšie

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najlepšie pre: Apache 2.0 — najkvalitnejší voľný model, 82M parametrov, ľahký self-host

Skúste to. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najlepšie pre: MIT — len CPU, ideálne pre hraničné zariadenia a vstavaný self-hosting

Skúste to. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Najlepšie pre: MIT — základná architektúra používaná mnohými downstream modelmi

Skúste to. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najlepšie pre: MIT — jedinečné možnosti generovania zvuku nad rámec štandardného TTS

Skúste to. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klonovanie hlasu

Najlepšie pre: Apache 2.0 — maximálna kvalita, široko študovaná referenčná implementácia

Skúste to. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonovanie hlasu

Najlepšie pre: MIT — open source klonovanie hlasu s granulárnym ovládaním štýlu

Skúste to. OpenVoice

Ako používať Open Source TTS

Použite naše hosťované rozhranie API alebo spustite modely sami

1

Preskúmajte open-source modely

Prejdite si náš katalóg viac ako 20 open-source TTS modelov.Každá stránka modelu zobrazuje licenciu, architektúru, možnosti a požiadavky na self-hosting.

2

Vyskúšajte vo svojom prehliadači

Testujte akýkoľvek model priamo na TTS.ai bez toho, aby ste museli čokoľvek inštalovať.Naše GPU servery sa starajú o spracovanie, takže môžete vyhodnotiť kvalitu predtým, ako sa zaviažete k samohostovaniu.

3

Self-Host alebo použite naše API

Klonujte repozitáre modelov z GitHubu a spustite ich lokálne alebo použite naše hosťované rozhranie API na produkciu.Vlastný hosting poskytuje úplnú kontrolu; naše rozhranie API poskytuje spravovanú infraštruktúru.

4

Vytvorte si svoju aplikáciu

Integrujte TTS do svojho produktu pomocou self-hosted modelov alebo nášho REST API Všetky modely sú komerčne využiteľné bez licenčných poplatkov alebo licenčných poplatkov.

Porovnanie licencií

Všetky modely na TTS.ai používajú komerčne priateľské open-source licencie

Model Licencia Pre komerčné použitie Zmena Self-Host Atribúcia
Kokoro Apache 2.0 Povinné
Piper MIT Voliteľné
VITS MIT Voliteľné
MeloTTS MIT Voliteľné
Chatterbox MIT Voliteľné
Tortoise TTS Apache 2.0 Povinné
StyleTTS 2 MIT Voliteľné
OpenVoice MIT Voliteľné
Sesame CSM Apache 2.0 Povinné
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs hosťované API

Spustite modely sami alebo nechajte infraštruktúru na nás

Self-Host na vašom hardvéri

Každý model na TTS.ai je dostupný ako open source projekt na GitHub alebo Hugging Face. Stiahnite si váhy, nainštalujte závislosti a spustite dedukciu na svojich vlastných grafických procesoroch.Máte plnú kontrolu nad latenciou, súkromím a škálovaním.

  • Úplné súkromie dát – zvuk nikdy neopúšťa váš server
  • Žiadne náklady na požiadavku po počiatočnom nastavení
  • Vlastné doladenie na základe vlastných údajov
  • Vyžaduje hardvér GPU (odporúča sa NVIDIA)
  • Spravujete aktualizácie, škálovanie a závislosti

Použitie TTS.ai hosťovaného rozhrania API

Získajte okamžitý prístup k viac ako 20 modelom prostredníctvom jedného rozhrania REST API. Postaráme sa o zriadenie grafických procesorov, aktualizácie modelov, správu frontov a škálovanie.Jeden kľúč rozhrania API vám poskytne prístup ku každému modelu – nie je potrebné spravovať samostatné nasadenie.

  • Nie je potrebný žiadny hardvér GPU
  • Všetkých 20+ modelov cez jedno API
  • Automatické aktualizácie a vylepšenia modelov
  • 99,9 % dostupnosť s redundantnou infraštruktúrou
  • Platíte len za to, čo používate

Rýchly štart: API alebo Self-Host

Použite naše hosťované API alebo nainštalujte Kokoro lokálne v priebehu niekoľkých minút

Možnosť 1: TTS.ai Hosťované rozhranie API Najjednoduchšie
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Možnosť 2: Self-Host s pip Plná kontrola nad
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Source, cenovo dostupné ceny

Naše hosťované rozhranie API sprístupňuje TTS s otvoreným zdrojovým kódom bez správy grafických procesorov.

Free Tier 2

$0

15 kreditov pri registrácii

  • 4 open-source modely zadarmo
  • Žiadna registrácia pre základné použitie
  • Povolené komerčné použitie

Štart

$9

500 000 znakov/mesiac

  • Všetkých 20+ open-source modelov
  • Klonovanie hlasu
  • Prístup k API

Pre

$29

2 000 000 znakov/mesiac

  • Prioritné spracovanie GPU
  • Všetky prémiové modely
  • Podpora pre podniky
Zobraziť plnú cenu

Často kladené otázky

Časté otázky o prevode textu na reč s otvoreným zdrojovým kódom

Áno. Každý model na TTS.ai používa permisívnu open-source licenciu — buď MIT alebo Apache 2.0. Výslovne vylučujeme modely s obmedzujúcimi licenciami (ako Coquiho CPML alebo nekomerčné CC-BY-NC). Môžete overiť licenciu každého modelu na jeho GitHub repozitári.

Obe sú permisívne open source licencie, ktoré umožňujú komerčné použitie, modifikáciu a redistribuciu. Apache 2.0 pridáva explicitné patentové udelenie a vyžaduje uvedenie zmien, ak upravujete kód. MIT je jednoduchší s menším počtom požiadaviek. Obe sú priateľské k podnikaniu.

Každý model môže byť hosťovaný samostatne.Naklonujte úložisko modelu z GitHubu, nainštalujte závislosti, stiahnite si váhy modelu a spustite odvodenie.Poskytujeme dokumentáciu pre požiadavky na vlastný hosting každého modelu vrátane GPU, RAM a verzie Pythonu.

Požiadavky sa líšia v závislosti od modelu. Piper nevyžaduje GPU (iba CPU). Kokoro a MeloTTS vyžadujú 1 až 2 GB pamäte VRAM. Väčšina štandardných modelov vyžaduje 4 GB pamäte VRAM. Tortoise a Sesame CSM vyžadujú 8 GB.

Modely ako GPT-SoVITS a Bark poskytujú skripty na jemné ladenie. Modely môžete trénovať na základe vlastných hlasových údajov, aby ste vytvorili vlastné hlasy alebo zlepšili výkon pre konkrétne jazyky.

Špičkové open-source modely (Kokoro, StyleTTS 2, Chatterbox) sa v súčasnosti vyrovnávajú alebo dokonca prekonávajú komerčné služby ako ElevenLabs a Google TTS v oblasti kvality, pričom hlavnou výhodou komerčných služieb je spravovaná infraštruktúra a podpora, nie kvalita zvuku.

XTTS/XTTS-v2 (Coquiho CPML — nekomerčné), F5-TTS (CC-BY-NC — nekomerčné) a Higgs-v2 (Bozónová licencia — obmedzujúca) boli všetky odstránené. Každý model na TTS.ai je overený ako bezpečný pre komerčné použitie.

Väčšina modelov prijíma príspevky komunity prostredníctvom GitHubu. Môžete odoslať hlásenia o chybách, hlasové nahrávky pre nové jazyky, vylepšenia kódu a dokumentáciu.Pozri GitHub repozitár každého modelu pre pokyny pre prispievanie a aktívne problémy.

Načítajte modely na požiadanie a uvoľnite ich, keď sú nečinné, aby ste zdieľali pamäť GPU. Náš GPU server spúšťa viac ako 20 modelov na 4x Tesla P40 (96 GB celkovej pamäte VRAM) pomocou dynamického načítania.

Mnohé modely poskytujú oficiálne obrazy Docker alebo Dockerfiles. Ak chcete spustiť viacero modelov, môžete vytvoriť vlastné nastavenie Docker s NVIDIA Container Toolkit pre prístup k GPU.Naša architektúra servera API môže slúžiť ako referenčná implementácia.

Väčšina modelov vyžaduje Python 3.10-3.12. Coqui TTS (VITS) vyžaduje Python 3.11. Pre väčšinu modelov odporúčame Python 3.12. Skontrolujte si requirements.txt každého modelu pre presnú kompatibilitu verzií.

Licencie MIT a Apache 2.0 výslovne povoľujú komerčné použitie. Môžete vytvárať produkty SaaS, mobilné aplikácie, hry a služby pomocou týchto modelov bez licenčných poplatkov, licenčných poplatkov alebo požiadaviek na uvedenie autorstva (aj keď uvedenie autorstva je vítané).
5.0/5 (1)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Vyskúšajte Open Source TTS ešte dnes

Viac ako 20 open-source modelov, všetky komerčne licencované. Použite naše API alebo self-host — voľba je na vás.