Nyílt forráskódú szöveg a beszédmodellekhez

Minden TTS modell a platformunkon nyílt forráskódú, kereskedelmileg környezetbarát licencekkel. MIT, Apache 2.0 - nincs szabadalmaztatott zárolás, nincs használati korlátozás, nincs meglepetés engedélyezési díj. Használja őket a mi házigazdánk API, vagy ön-hosting őket a saját infrastruktúra teljes ellenőrzés.

Nyílt forrás MIT licenc Apache 2. 0 Önálló GitHubCity name (optional, probably does not need a translation)

Teljes TTS-szerkesztő API Dokumentumok

Próbáld ki most.

0/500

Szabad Kokoro, Piper, VITS, MelotTS

Itt fog megjelenni a generált audio.

Teljes TTS szerkesztő megnyitása

Nyílt forráskódú TTS-előnyök

Miért fontosak a nyílt forráskódú modellek a projektjeidhez?

Minden nyílt forráskódú licenc

Minden modell a TTS.ai egy engedékeny nyílt forráskódú licencet használ, nincs szabadalmaztatott fekete doboz, nincs eladói zárolás, nincs váratlan engedélyezési díj.

MIT / Apache 2.0

Modellek licenc alatt MIT vagy Apache 2.0, a legengedékenyebb nyílt forráskódú licencek. Használja kereskedelmi, módosítani, redistribution • nincsenek korlátozások.

Önálló

Töltse le a modell és futtassa a saját hardver. Teljes ellenőrzés az adatok, latencia, és az infrastruktúra. Nem felhő függőség szükséges.

GPU optimalizálva

Modellek optimalizált NVIDIA GPU CUDA támogatással. Piper fut CPU csak. A legtöbb modell szükség 2-8GB VRAM hatékony következtetések.

Fenntartott közösség

Aktív nyílt forráskódú közösségek tartják fenn és javítják ezeket a modelleket. Hozzászólások üdvözlik a hibák, fejlesztések, és új hangok GitHub.

Kereskedelmi felhasználás OK

Minden modell lehetővé teszi a kereskedelmi hasznosítást licencek alatt.Termékek építése, értékesítési szolgáltatások, és hozzon létre kereskedelmi tartalmak jogdíjak és használati díjak nélkül.

Nyílt forráskódú modellkatalógus

Minden modell, a jogosítványa, és hogy mit csinál a legjobban.

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Legjobb: Apache 2.0 - legjobb minőségű ingyenes modell, 82M params, könnyen önálló

Próbáld meg. Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Legjobb: MIT csak CPU-val, tökéletes élezőeszközökhöz és beágyazott önhostinghoz

Próbáld meg. Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Legjobb: Számos downstream modell által használt MIT - alapítványi architektúra

Próbáld meg. VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Legjobb: MIT - egyedi hangtermelési képességek a szabványos TTS-en túl

Próbáld meg. Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Hang klónozása

Legjobb: Apache 2.0 - maximális minőség, széles körben tanulmányozott referencia implementáció

Próbáld meg. Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Hang klónozása

Legjobb: MIT - nyílt forráskódú hang klónozás szemcsés stílusvezérléssel

Próbáld meg. OpenVoice

Hogyan használjuk a nyílt forráskódú TTS-t?

Használd a házigazdánk API-ját vagy fuss modelleket magad

Nyílt forráskódú modellek feltárása

Böngésszen katalógusunkban a 20+ nyílt forráskódú TTS modelleket. Minden modell oldal az licencet, architektúrát, képességeket és önkiszolgáló követelményeket mutatja.

Próbáld ki a böngésződben

Teszt bármely modell közvetlenül a TTS.ai telepítése nélkül. GPU szervereink feldolgozzák, így értékelni tudja a minőséget, mielőtt elkötelezi magát az önkiszolgáló.

Önvédelem vagy az API használata

Clone modell repos a GitHub és futni helyben, vagy használja a házigazdát API a termelés. Ön-hosting ad teljes körű ellenőrzést; API biztosítja a kezelt infrastruktúra.

Az alkalmazás szerkesztése

A TTS integrálása a termékbe saját házigazda modellekkel vagy a REST API-val. Minden modell kereskedelmileg használható licencdíjak és jogdíjak nélkül.

A licenc összehasonlítása

Minden modell TTS.ai használ kereskedelmi-barát nyílt forráskódú licencek

Minta	Jogosítvány	Attribúció
Kokoro	Apache 2.0	Szükséges
Piper	MIT	Opcionális
VITS	MIT	Opcionális
MeloTTS	MIT	Opcionális
Chatterbox	MIT	Opcionális
Tortoise TTS	Apache 2.0	Szükséges
StyleTTS 2	MIT	Opcionális
OpenVoice	MIT	Opcionális
Sesame CSM	Apache 2.0	Szükséges
Orpheus	Llama 3.2	"Built with Llama"

Próbáld ki ezeket a modelleket ingyen

Önfenntartó vs. vendéglátó API

Futtasd le magad a modelleket, vagy hagyd, hogy mi intézzük az infrastruktúrát.

Önvédelem a hardvereden

Minden modell a TTS.ai elérhető, mint egy nyílt forráskódú projekt GitHub vagy Hugging Face. Töltse le a súlyokat, telepítse a függőségek, és futtassa a következtetéseket a saját GPU-k. Van teljes körű ellenőrzése a latencia, a magánélet, és a méretezés.

A teljes adatvédelemmel kapcsolatos adatok védelme Audio soha nem hagyja el a szerverét
Kérelmenként nem merül fel költség a kezdeti beállítást követően
Egyedi finomhangolás a saját adataidon
GPU hardvert igényel (NVIDIA ajánlott)
Te kezeled a frissítéseket, a méretezést és a függőségeket

Használja a TTS.ai hosted API-t

Get instant access to all 20+ models through a single REST API. We handle GPU provisioning, model updates, quere management, and scalage. One API key gives give you access to every model.

Nincs szükség GPU hardverre
Az összes 20+ modell egy API-n keresztül
Automatikus modellfrissítések és fejlesztések
99,9%-os üzemidő a felesleges infrastruktúrával
Csak azért fizess, amit használsz.

Helyette a házigazdának adott API használata

Gyors indítás: API vagy Self-Host

Használja a házigazdát API, vagy telepítse Kokoro helyben percek alatt

1. lehetőség: TTS.ai Fogadott API A legegyszerűbb

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

2. lehetőség: Önvédelem pip-pel Teljes irányítás

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Az API dokumentációjának megtekintése

Nyílt forrás, megfizethető árak

A házigazdánk a GPU-k kezelése nélkül teszi elérhetővé a nyílt forráskódú TTS-t.

Free Tier

15.000 karakter a regisztrációkor

4 nyílt forráskódú modell ingyenes
Nincs regisztráció az alapfelhasználásra
Kereskedelmi célú felhasználás megengedett

Indító

500 000 karakter/hónap

Összes 20+ nyílt forráskódú modell
Hang klónozása
API-hozzáférés

Pro

$29

2.000.000 karakter/hónap

Prioritású GPU-feldolgozás
Valamennyi prémium modell
Vállalkozások támogatása

Teljes ár megtekintése

Gyakran ismételt kérdések

Közös kérdések a nyílt forráskódú szövegről a beszédre

Igen. A TTS.ai-es modell egy engedékeny nyílt forráskódú licencet használ, vagy az MIT-t vagy az Apache 2.0-t. Kifejezetten kizárjuk a korlátozó licencekkel rendelkező modelleket (például a Coqui CPML-ét vagy a nem kereskedelmi CC-BY-NC-t). Minden modell licencét ellenőrizni lehet a GitHub adattárában.

Mindkettő engedélyezett nyílt forráskódú licencek, amelyek lehetővé teszik a kereskedelmi felhasználást, a módosítást és az újraelosztást. Az Apache 2.0 explicit szabadalmi támogatásokat ad hozzá, és változtatásokat követel meg, ha módosítod a kódot. Az MIT egyszerűbb, kevesebb követelménnyel. Mindkettő üzleti-barát.

Igen. Minden modell lehet saját házigazda. Clone a modell adattár GitHub, telepítse függőségek, letöltése modell súlyok, és futtassa következtetés. Mi biztosítja dokumentáció minden modell önhosting követelmények, beleértve a GPU, RAM, és Python verzió.

A követelmények modellenként változnak. Piper-nek nem kell GPU (csak CPU). Kokoro-nak és MelotTS-nek 1-2GB VRAM-ra van szüksége. A legtöbb standard modellnek 4GB VRAM-ra van szüksége. Tortoise-nak és Szezám CSM-nek 8GB-ra van szüksége. Az NVIDIA RTX 3060 (12GB) a legtöbb modellt kényelmesen tudja futtatni.

Igen. A nyílt forráskódú licencek lehetővé teszik a módosítást, beleértve a finomhangolást is. Az olyan modellek, mint a GPT-Sovits és a Bark finomhangoló szkripteket biztosítanak. A saját hangadatokon is vonatozhat modelleket, hogy egyéni hangokat hozzon létre, vagy javítson bizonyos nyelvek teljesítményén.

Top nyílt forráskódú modellek (Kokoro, StyletTS 2, Chatterbox) most megfelelnek vagy meghaladják az olyan kereskedelmi szolgáltatásokat, mint az ElevenLabs és a Google TTS minőségi referenciaértékek. A kereskedelmi szolgáltatások fő előnye az infrastruktúra és támogatás, nem pedig a hangminőség.

Már kizártuk őket. XTTS/XTTS-v2 (Coqui's CPML - non-commercial), F5-TTS (CC-BY-NC - non-commercial) és Higgs-v2 (Boson License - korlátozó) mind eltűntek. Minden modell TTS.ai igazolt kereskedelmi célú biztonságos.

Igen. A legtöbb modell a GitHub-on keresztül fogadja el a közösségi hozzájárulásokat. Beküldheti a hibabejelentéseket, az új nyelvek hangfelvételeit, a kódfejlesztéseket és a dokumentációt. Ellenőrizze az egyes modellek GitHub adattárát a hozzájárulási irányelvek és az aktív kérdések tekintetében.

A GPU szerverünk 20+ modelleket futtat 4x Tesla P40-en (96GB teljes VRAM), dinamikus terheléssel. Önkiszolgálóként egy 24GB-os GPU 3-5 modellt tud egyszerre szolgálni.

Sok modell ad hivatalos Docker képeket vagy Dockerfiles. Több modell futtatásához lehet építeni egy egyedi Docker beállítást NVIDIA Container Toolkit GPU hozzáférés. API szerver architektúra szolgálhat referencia implementáció.

A legtöbb modell Python 3.10-3.12. Coqui TTS (VITS) kifejezetten szüksége Python 3.11. Javasoljuk Python 3.12 a legtöbb modell. Ellenőrizze minden modell követelményeinek.txt a pontos verzió kompatibilitás.

Igen. Az MIT és az Apache 2.0 licencek kifejezetten lehetővé teszik a kereskedelmi felhasználást. A SaaS termékeket, mobil alkalmazásokat, játékokat és szolgáltatásokat ezeken a modelleken lehet építeni licencdíjak, jogdíjak vagy odaítélési követelmények nélkül (bár a hozzárendelést értékelik).

5.0/5 (1)

Próbálja ki az Open Source TTS-t ma

20+ nyílt forráskódú modellek, minden kereskedelmileg engedélyezett. Használja az API-t vagy az ön-hostit, a választás az Öné.

Regisztráció Ingyenes Tekintse meg az árakat

Nyílt forráskódú szöveg a beszédmodellekhez

Próbáld ki most.

Mondd el a barátaidnak!

Nyílt forráskódú TTS-előnyök

Minden nyílt forráskódú licenc

MIT / Apache 2.0

Önálló

GPU optimalizálva

Fenntartott közösség

Kereskedelmi felhasználás OK

Nyílt forráskódú modellkatalógus

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Hogyan használjuk a nyílt forráskódú TTS-t?

Nyílt forráskódú modellek feltárása

Próbáld ki a böngésződben

Önvédelem vagy az API használata

Az alkalmazás szerkesztése

A licenc összehasonlítása

Önfenntartó vs. vendéglátó API

Önvédelem a hardvereden

Használja a TTS.ai hosted API-t

Gyors indítás: API vagy Self-Host

Nyílt forrás, megfizethető árak

Free Tier

Indító

Pro

Gyakran ismételt kérdések

Mind a TTS.ai modell valóban nyílt forráskódú?

Mi a különbség az MIT és az Apache 2.0 licencek között?

Saját magam irányíthatom ezeket a modelleket a saját szerveremen?

Milyen GPU-ra van szükségem a TTS-modellekhez?

Tudok finomhangoló nyílt forráskódú TTS modellek?

Hogyan hasonlítják össze a nyílt forráskódú TTS modelleket a kereskedelmi szolgáltatásokkal?

Vannak olyan modellek, amiket el kellene kerülnöm?

Hozzájárulhatok ezekhez a nyílt forráskódú modellekhez?

Hogyan futtathatok több modellt egy GPU szerveren?

Van Docker kép az önfoglalkoztatásról?

Milyen Python verzióra van szükségem az önfoglalkoztatáshoz?

Építhetek kereskedelmi terméket ezekkel a modellekkel?

Próbálja ki az Open Source TTS-t ma