Otevřít zdrojový text pro mluvené modely

Každý model TTS na naší platformě je otevřený zdroj s komerčně přívětivými licencemi. MIT, Apache 2.0 Žádné vlastní zamykání, žádná omezení použití, žádné překvapivé licenční poplatky. Použijte je prostřednictvím našeho hostovaného API, nebo self-host je na vlastní infrastruktuře s plnou kontrolou.

Otevřít zdroj Licence MIT Apache 2. 0 Self-hostable GitHub

Zkus to teď.

Zdarma s Kokoro, Piper, VITS, Melotts
Váš vygenerovaný zvuk se objeví zde
Generován
Stáhnout
Miluju TTS.ai? Řekni to svým přátelům!

Výhody pro otevřený zdroj TTS

Proč na modelech open-source záleží pro vaše projekty

Všechny licence na Open-Source

Každý model na TTS.ai používá povolnou open-source licenci. Žádné proprietární černé boxy, žádné uzamykatelné prodejce, žádné neočekávané licenční poplatky.

MIT / Apache 2.0

Modely jsou licencovány pod MIT nebo Apache 2.0, nejpovolanější open-source licence. Používejte komerčně, modifikovat, redistribuovat bez omezení.

Self-hostable

Stáhněte si jakýkoliv model a spusťte jej na vlastním hardwaru. Plná kontrola nad vašimi daty, latencí a infrastrukturou. Nevyžaduje se žádná cloudová závislost.

GPU optimalizované

Modely jsou optimalizovány pro NVIDIA GPU s podporou CUDA. Piper běží pouze na procesoru. Většina modelů potřebuje 2-8GB VRAM pro efektivní inferenci.

Udržované Společenství

Aktivní open-source komunity udržují a vylepšují tyto modely.Příspěvky vítají! Předložte chyby, vylepšení a nové hlasy na GitHubu.

Komerční využití OK

Všechny modely umožňují komerční využití pod jejich licencemi. Vybudovat produkty, prodávat služby a vytvářet komerční obsah bez licenčních poplatků nebo poplatků za užívání.

Náš katalog Open Source Model

Každý model, jeho licence a to, co dělá nejlépe

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Nejlepší pro: Apache 2.0 Nejlepší kvalita zdarma model, 82M params, snadné self-host

Zkus to. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Nejlepší pro: MIT pouze pro CPU, ideální pro hrany a vložené samohosting

Zkus to. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Nejlepší pro: Základní architektura MIT používaná mnoha navazujícími modely

Zkus to. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Nejlepší pro: Unikátní schopnosti generování zvuku MIT mimo standardní TTS

Zkus to. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klonování hlasu

Nejlepší pro: Apache 2.0 maximální kvalita, široce studováná referenční implementace

Zkus to. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonování hlasu

Nejlepší pro: MIT Open-source hlasové klonování s granulovanou kontrolou stylu

Zkus to. OpenVoice

Jak používat Open Source TTS

Použijte naše hostované API nebo spustit modely sami

1

Prozkoumejte modely Open-Source

Prohlédněte si náš katalog 20+ open-source TTS modelů. Každá modelová stránka zobrazuje požadavky na licenci, architekturu, schopnosti a sebehosting.

2

Zkuste ve svém prohlížeči

Otestujte libovolný model přímo na TTS.ai bez instalace čehokoliv. Naše GPU servery zvládnou zpracování tak, abyste mohli hodnotit kvalitu dříve, než se zavážete k self-hostingu.

3

Self-host nebo používat naše API

Klon model repos od GitHub a provozovat lokálně, nebo používat naše hosted API pro výrobu. Self-hosting dává plnou kontrolu; naše API poskytuje řízenou infrastrukturu.

4

Vybudujte si aplikaci

Integrujte TTS do vašeho produktu pomocí samohostovaných modelů nebo našeho REST API. Všechny modely jsou komerčně použitelné bez licenčních poplatků nebo licenčních poplatků.

Srovnání licencí

Všechny modely na TTS.ai používají komerčně přívětivé open-source licence

Vzor Licence Obchodní využití Změna Self-host Příspěvek
Kokoro Apache 2.0 Požadované
Piper MIT Nepovinné
VITS MIT Nepovinné
MeloTTS MIT Nepovinné
Chatterbox MIT Nepovinné
Tortoise TTS Apache 2.0 Požadované
StyleTTS 2 MIT Nepovinné
OpenVoice MIT Nepovinné
Sesame CSM Apache 2.0 Požadované
Orpheus Llama 3.2 "Built with Llama"

Self-hosting vs Hosted API

Spusťte modely sami nebo nás nechte řídit infrastrukturu

Self-host on Your Hardware

Každý model na TTS.ai je k dispozici jako open-source projekt na GitHub nebo Hugging Face. Stáhněte si závaží, nainstalujte závislosti, a spusťte inferenci na vlastní GPU. Máte plnou kontrolu nad latence, soukromí, a škálování.

  • Plné soukromí dat Audio nikdy neopustí váš server
  • Žádné náklady na žádost po počátečním nastavení
  • Vlastní fine-ladění na vlastních datech
  • Vyžaduje GPU hardware (doporučeno NVIDIA)
  • Zvládáte aktualizace, škálování a závislosti

Použití TTS.ai Hosted API

Získejte okamžitý přístup ke všem 20+ modelům prostřednictvím jediného REST API. Zvládáme GPU poskytování, aktualizace modelu, správu fronty a škálování. Jeden API klíč vám umožní přístup ke každému modelu díry není třeba spravovat samostatné nasazení.

  • GPU hardware není potřeba
  • Všechny 20+ modely přes jedno API
  • Automatické aktualizace modelu a vylepšení
  • 99,9% uptime s nadbytečnou infrastrukturou
  • Platit pouze za to, co používáte

Rychlý start: API nebo Self-Host

Použijte naše hostované API, nebo nainstalujte Kokoro lokálně během několika minut

Možnost 1: TTS.ai Hosted API Nejjednodušší
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Možnost 2: Self-host s pip Plné ovládání
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Source, cenově dostupné

Naše hostované API zpřístupňuje TTS open-source bez správy GPU.

Volný rozsah

$0

15 000 znaků při přihlášení

  • 4 open-source modely zdarma
  • Žádné přihlášení k základnímu použití
  • Komerční použití povoleno

Starter

$9

500 000 znaků/měsíc

  • Všechny modely 20+ open-source
  • Klonování hlasu
  • Přístup API

Pro

$29

2 000 000 znaků/měsíc

  • Prioritní zpracování GPU
  • Všechny modely prémií
  • Podpora podnikání
Zobrazit plnou cenu

Často kladené otázky

Časté otázky k open source textu do řeči

Ano. Každý model na TTS.ai používá povolenou open-source licenci MIT nebo Apache 2.0. Speciálně vylučujeme modely s omezujícími licencemi (jako Coqui CPML nebo nekomerční CC-BY-NC). Můžete si ověřit licenci každého modelu na jeho GitHub úložiště.

Oba jsou povolné open-source licence umožňující komerční použití, modifikace a redistribuce. Apache 2.0 přidává explicitní patentové granty a vyžaduje uvedení změn, pokud změníte kód. MIT je jednodušší s menšími požadavky. Oba jsou obchodně přívětivé.

Ano. Každý model může být sám-hostován. Klonovat model repozitář z GitHub, nainstalovat závislosti, stáhnout model závaží, a spustit inference. Poskytujeme dokumentaci pro každý model je samo-hostovací požadavky včetně GPU, RAM, a Python verze.

Požadavky se liší podle modelu. Piper nepotřebuje GPU (pouze CPU). Kokoro a Melotts potřebují 1-2GB VRAM. Většina standardních modelů potřebuje 4GB VRAM. Tortoise a Sezam CSM potřebují 8GB. NVIDIA RTX 3060 (12GB) může provozovat většinu modelů pohodlně.

Ano. Licence Open-source umožňují modifikaci včetně jemného ladění. Modely jako GPT-SoviTS a Bark poskytují skripty jemného doladění. Na vlastních hlasových datech můžete trénovat modely, které vytvoří vlastní hlasy nebo zlepší výkon pro konkrétní jazyky.

Top open-source modely (Kokoro, Styletts 2, Chatterbox) nyní zápas nebo překročit komerční služby, jako jsou ElevenLabs a Google TTS v kvalitativních referenčních hodnotách. Hlavní výhodou komerčních služeb je řízena infrastruktura a podpora, nikoli kvalita zvuku.

Již jsme je vyloučili. XTTS/XTTS-v2 (Coqui's CPML și non-commercial), F5-TTS (CC-BY-NC NGO non-commercial), a Higgs-v2 (Boson License Repriving) byly odstraněny. Každý model na TTS.ai je ověřen komerční-use sejf.

Ano. Většina modelů přijímá příspěvky komunit přes GitHub. Můžete odesílat zprávy o chybách, hlasové záznamy pro nové jazyky, vylepšení kódu a dokumentaci. Zkontrolujte každý repozitář modelu GitHub pro pokyny pro příspěvky a aktivní problémy.

Naše GPU server běží 20+ modely na 4x Tesla P40 (96GB celkem VRAM) pomocí dynamického zatížení. Pro samohostování může jeden 24GB GPU současně sloužit 3-5 modelů.

Mnoho modelů poskytuje oficiální Docker obrázky nebo Dockerfiles. Pro spuštění více modelů můžete vytvořit vlastní nastavení Docker s NVIDIA Container Toolkit pro GPU přístup. Naše architektura API serveru může sloužit jako referenční implementace.

Většina modelů vyžaduje Python 3.10-3.12. Coqui TTS (VITS) speciálně potřebuje Python 3.11. Doporučujeme Python 3.12 pro většinu modelů. Zkontrolujte požadavky každého modelu.txt pro přesnou kompatibilitu verzí.

Ano. Licence MIT a Apache 2.0 výslovně umožňují komerční použití. Můžete stavět produkty SaaS, mobilní aplikace, hry a služby, které používají tyto modely bez licenčních poplatků, licenčních poplatků nebo alokačních požadavků (ačkoli je oceňována alokace).
5.0/5 (1)

Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.

Zkuste otevřít zdroj TTS dnes

20+ open-source modely, všechny komerčně-licencované. Použijte naše API nebo self-host dírka volba je vaše.