Nahlásit chybu / žádost o funkci

Otevřít zdrojový text pro mluvené modely

Každý model TTS na naší platformě je otevřený zdroj s komerčně přívětivými licencemi. MIT, Apache 2.0 Žádné vlastní zamykání, žádná omezení použití, žádné překvapivé licenční poplatky. Použijte je prostřednictvím našeho hostovaného API, nebo self-host je na vlastní infrastruktuře s plnou kontrolou.

Otevřít zdroj Licence MIT Apache 2. 0 Self-hostable GitHub

Kompletní TTS editor API Doktoři

Zkus to teď.

Text
Soubory

0/500

Zdarma s Kokoro, Piper, VITS, Melotts

Váš vygenerovaný zvuk se objeví zde

Otevřít celý editor TTS

Výhody pro otevřený zdroj TTS

Proč na modelech open-source záleží pro vaše projekty

Všechny licence na Open-Source

Každý model na TTS.ai používá povolnou open-source licenci. Žádné proprietární černé boxy, žádné uzamykatelné prodejce, žádné neočekávané licenční poplatky.

MIT / Apache 2.0

Modely jsou licencovány pod MIT nebo Apache 2.0, nejpovolanější open-source licence. Používejte komerčně, modifikovat, redistribuovat bez omezení.

Self-hostable

Stáhněte si jakýkoliv model a spusťte jej na vlastním hardwaru. Plná kontrola nad vašimi daty, latencí a infrastrukturou. Nevyžaduje se žádná cloudová závislost.

GPU optimalizované

Modely jsou optimalizovány pro NVIDIA GPU s podporou CUDA. Piper běží pouze na procesoru. Většina modelů potřebuje 2-8GB VRAM pro efektivní inferenci.

Udržované Společenství

Aktivní open-source komunity udržují a vylepšují tyto modely.Příspěvky vítají! Předložte chyby, vylepšení a nové hlasy na GitHubu.

Komerční využití OK

Všechny modely umožňují komerční využití pod jejich licencemi. Vybudovat produkty, prodávat služby a vytvářet komerční obsah bez licenčních poplatků nebo poplatků za užívání.

Náš katalog Open Source Model

Každý model, jeho licence a to, co dělá nejlépe

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Nejlepší pro: Apache 2.0 Nejlepší kvalita zdarma model, 82M params, snadné self-host

Zkus to. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Nejlepší pro: MIT pouze pro CPU, ideální pro hrany a vložené samohosting

Zkus to. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Nejlepší pro: Základní architektura MIT používaná mnoha navazujícími modely

Zkus to. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Nejlepší pro: Unikátní schopnosti generování zvuku MIT mimo standardní TTS

Zkus to. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klonování hlasu

Nejlepší pro: Apache 2.0 maximální kvalita, široce studováná referenční implementace

Zkus to. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonování hlasu

Nejlepší pro: MIT Open-source hlasové klonování s granulovanou kontrolou stylu

Zkus to. OpenVoice

Jak používat Open Source TTS

Použijte naše hostované API nebo spustit modely sami

Prozkoumejte modely Open-Source

Prohlédněte si náš katalog 20+ open-source TTS modelů. Každá modelová stránka zobrazuje požadavky na licenci, architekturu, schopnosti a sebehosting.

Zkuste ve svém prohlížeči

Otestujte libovolný model přímo na TTS.ai bez instalace čehokoliv. Naše GPU servery zvládnou zpracování tak, abyste mohli hodnotit kvalitu dříve, než se zavážete k self-hostingu.

Self-host nebo používat naše API

Klon model repos od GitHub a provozovat lokálně, nebo používat naše hosted API pro výrobu. Self-hosting dává plnou kontrolu; naše API poskytuje řízenou infrastrukturu.

Vybudujte si aplikaci

Integrujte TTS do vašeho produktu pomocí samohostovaných modelů nebo našeho REST API. Všechny modely jsou komerčně použitelné bez licenčních poplatků nebo licenčních poplatků.

Srovnání licencí

Všechny modely na TTS.ai používají komerčně přívětivé open-source licence

Vzor	Licence	Příspěvek
Kokoro	Apache 2.0	Požadované
Piper	MIT	Nepovinné
VITS	MIT	Nepovinné
MeloTTS	MIT	Nepovinné
Chatterbox	MIT	Nepovinné
Tortoise TTS	Apache 2.0	Požadované
StyleTTS 2	MIT	Nepovinné
OpenVoice	MIT	Nepovinné
Sesame CSM	Apache 2.0	Požadované
Orpheus	Llama 3.2	"Built with Llama"

Zkuste tyto modely zdarma

Self-hosting vs Hosted API

Spusťte modely sami nebo nás nechte řídit infrastrukturu

Self-host on Your Hardware

Každý model na TTS.ai je k dispozici jako open-source projekt na GitHub nebo Hugging Face. Stáhněte si závaží, nainstalujte závislosti, a spusťte inferenci na vlastní GPU. Máte plnou kontrolu nad latence, soukromí, a škálování.

Plné soukromí dat Audio nikdy neopustí váš server
Žádné náklady na žádost po počátečním nastavení
Vlastní fine-ladění na vlastních datech
Vyžaduje GPU hardware (doporučeno NVIDIA)
Zvládáte aktualizace, škálování a závislosti

Použití TTS.ai Hosted API

Získejte okamžitý přístup ke všem 20+ modelům prostřednictvím jediného REST API. Zvládáme GPU poskytování, aktualizace modelu, správu fronty a škálování. Jeden API klíč vám umožní přístup ke každému modelu díry není třeba spravovat samostatné nasazení.

GPU hardware není potřeba
Všechny 20+ modely přes jedno API
Automatické aktualizace modelu a vylepšení
99,9% uptime s nadbytečnou infrastrukturou
Platit pouze za to, co používáte

Místo toho používat hostitelské API

Rychlý start: API nebo Self-Host

Použijte naše hostované API, nebo nainstalujte Kokoro lokálně během několika minut

Možnost 1: TTS.ai Hosted API Nejjednodušší

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Možnost 2: Self-host s pip Plné ovládání

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Zobrazit dokumentaci API

Open Source, cenově dostupné

Naše hostované API zpřístupňuje TTS open-source bez správy GPU.

Volný rozsah

15 000 znaků při přihlášení

4 open-source modely zdarma
Žádné přihlášení k základnímu použití
Komerční použití povoleno

Starter

500 000 znaků/měsíc

Všechny modely 20+ open-source
Klonování hlasu
Přístup API

Pro

$29

2 000 000 znaků/měsíc

Prioritní zpracování GPU
Všechny modely prémií
Podpora podnikání

Zobrazit plnou cenu

Často kladené otázky

Časté otázky k open source textu do řeči

Ano. Každý model na TTS.ai používá povolenou open-source licenci MIT nebo Apache 2.0. Speciálně vylučujeme modely s omezujícími licencemi (jako Coqui CPML nebo nekomerční CC-BY-NC). Můžete si ověřit licenci každého modelu na jeho GitHub úložiště.

Oba jsou povolné open-source licence umožňující komerční použití, modifikace a redistribuce. Apache 2.0 přidává explicitní patentové granty a vyžaduje uvedení změn, pokud změníte kód. MIT je jednodušší s menšími požadavky. Oba jsou obchodně přívětivé.

Ano. Každý model může být sám-hostován. Klonovat model repozitář z GitHub, nainstalovat závislosti, stáhnout model závaží, a spustit inference. Poskytujeme dokumentaci pro každý model je samo-hostovací požadavky včetně GPU, RAM, a Python verze.

Požadavky se liší podle modelu. Piper nepotřebuje GPU (pouze CPU). Kokoro a Melotts potřebují 1-2GB VRAM. Většina standardních modelů potřebuje 4GB VRAM. Tortoise a Sezam CSM potřebují 8GB. NVIDIA RTX 3060 (12GB) může provozovat většinu modelů pohodlně.

Ano. Licence Open-source umožňují modifikaci včetně jemného ladění. Modely jako GPT-SoviTS a Bark poskytují skripty jemného doladění. Na vlastních hlasových datech můžete trénovat modely, které vytvoří vlastní hlasy nebo zlepší výkon pro konkrétní jazyky.

Top open-source modely (Kokoro, Styletts 2, Chatterbox) nyní zápas nebo překročit komerční služby, jako jsou ElevenLabs a Google TTS v kvalitativních referenčních hodnotách. Hlavní výhodou komerčních služeb je řízena infrastruktura a podpora, nikoli kvalita zvuku.

Již jsme je vyloučili. XTTS/XTTS-v2 (Coqui's CPML și non-commercial), F5-TTS (CC-BY-NC NGO non-commercial), a Higgs-v2 (Boson License Repriving) byly odstraněny. Každý model na TTS.ai je ověřen komerční-use sejf.

Ano. Většina modelů přijímá příspěvky komunit přes GitHub. Můžete odesílat zprávy o chybách, hlasové záznamy pro nové jazyky, vylepšení kódu a dokumentaci. Zkontrolujte každý repozitář modelu GitHub pro pokyny pro příspěvky a aktivní problémy.

Naše GPU server běží 20+ modely na 4x Tesla P40 (96GB celkem VRAM) pomocí dynamického zatížení. Pro samohostování může jeden 24GB GPU současně sloužit 3-5 modelů.

Mnoho modelů poskytuje oficiální Docker obrázky nebo Dockerfiles. Pro spuštění více modelů můžete vytvořit vlastní nastavení Docker s NVIDIA Container Toolkit pro GPU přístup. Naše architektura API serveru může sloužit jako referenční implementace.

Většina modelů vyžaduje Python 3.10-3.12. Coqui TTS (VITS) speciálně potřebuje Python 3.11. Doporučujeme Python 3.12 pro většinu modelů. Zkontrolujte požadavky každého modelu.txt pro přesnou kompatibilitu verzí.

Ano. Licence MIT a Apache 2.0 výslovně umožňují komerční použití. Můžete stavět produkty SaaS, mobilní aplikace, hry a služby, které používají tyto modely bez licenčních poplatků, licenčních poplatků nebo alokačních požadavků (ačkoli je oceňována alokace).

5.0/5 (1)

Zkuste otevřít zdroj TTS dnes

20+ open-source modely, všechny komerčně-licencované. Použijte naše API nebo self-host dírka volba je vaše.

Zaregistrovat se zdarma Zobrazit ceny

Otevřít zdrojový text pro mluvené modely

Zkus to teď.

Miluju TTS.ai? Řekni to svým přátelům!

Výhody pro otevřený zdroj TTS

Všechny licence na Open-Source

MIT / Apache 2.0

Self-hostable

GPU optimalizované

Udržované Společenství

Komerční využití OK

Náš katalog Open Source Model

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Jak používat Open Source TTS

Prozkoumejte modely Open-Source

Zkuste ve svém prohlížeči

Self-host nebo používat naše API

Vybudujte si aplikaci

Srovnání licencí

Self-hosting vs Hosted API

Self-host on Your Hardware

Použití TTS.ai Hosted API

Rychlý start: API nebo Self-Host

Open Source, cenově dostupné

Volný rozsah

Starter

Pro

Často kladené otázky

Je všech TTS.ai modelů opravdu otevřený zdroj?

Jaký je rozdíl mezi licencemi MIT a Apache 2.0?

Můžu si tyhle modely objednat na svém vlastním serveru?

Jaké GPU potřebuju pro vlastní TTS modely?

Můžu doladit modely TTS open-source?

Jak se open-source TTS modely porovnávají s komerčními službami?

Jsou tu nějaké modely s omezujícími licencemi, kterým bych se měl vyhnout?

Mohu přispět k těmto modelům open-source?

Jak spustím více modelů na jednom serveru GPU?

Existuje image Dockera pro self-hosting?

Jakou Python verzi potřebuju pro sebehosting?

Mohu postavit komerční produkt pomocí těchto modelů?

Zkuste otevřít zdroj TTS dnes