Nyílt forráskódú szöveg a beszédmodellekhez

Minden TTS modell a platformunkon nyílt forráskódú, kereskedelmileg környezetbarát licencekkel. MIT, Apache 2.0 - nincs szabadalmaztatott zárolás, nincs használati korlátozás, nincs meglepetés engedélyezési díj. Használja őket a mi házigazdánk API, vagy ön-hosting őket a saját infrastruktúra teljes ellenőrzés.

Nyílt forrás MIT licenc Apache 2. 0 Önálló GitHubCity name (optional, probably does not need a translation)

Próbáld ki most.

Szabad Kokoro, Piper, VITS, MelotTS
Itt fog megjelenni a generált audio.
Létrehozva
Letöltés
Mondd el a barátaidnak!

Nyílt forráskódú TTS-előnyök

Miért fontosak a nyílt forráskódú modellek a projektjeidhez?

Minden nyílt forráskódú licenc

Minden modell a TTS.ai egy engedékeny nyílt forráskódú licencet használ, nincs szabadalmaztatott fekete doboz, nincs eladói zárolás, nincs váratlan engedélyezési díj.

MIT / Apache 2.0

Modellek licenc alatt MIT vagy Apache 2.0, a legengedékenyebb nyílt forráskódú licencek. Használja kereskedelmi, módosítani, redistribution • nincsenek korlátozások.

Önálló

Töltse le a modell és futtassa a saját hardver. Teljes ellenőrzés az adatok, latencia, és az infrastruktúra. Nem felhő függőség szükséges.

GPU optimalizálva

Modellek optimalizált NVIDIA GPU CUDA támogatással. Piper fut CPU csak. A legtöbb modell szükség 2-8GB VRAM hatékony következtetések.

Fenntartott közösség

Aktív nyílt forráskódú közösségek tartják fenn és javítják ezeket a modelleket. Hozzászólások üdvözlik a hibák, fejlesztések, és új hangok GitHub.

Kereskedelmi felhasználás OK

Minden modell lehetővé teszi a kereskedelmi hasznosítást licencek alatt.Termékek építése, értékesítési szolgáltatások, és hozzon létre kereskedelmi tartalmak jogdíjak és használati díjak nélkül.

Nyílt forráskódú modellkatalógus

Minden modell, a jogosítványa, és hogy mit csinál a legjobban.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Legjobb: Apache 2.0 - legjobb minőségű ingyenes modell, 82M params, könnyen önálló

Próbáld meg. Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Legjobb: MIT csak CPU-val, tökéletes élezőeszközökhöz és beágyazott önhostinghoz

Próbáld meg. Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Legjobb: Számos downstream modell által használt MIT - alapítványi architektúra

Próbáld meg. VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Legjobb: MIT - egyedi hangtermelési képességek a szabványos TTS-en túl

Próbáld meg. Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Hang klónozása

Legjobb: Apache 2.0 - maximális minőség, széles körben tanulmányozott referencia implementáció

Próbáld meg. Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Hang klónozása

Legjobb: MIT - nyílt forráskódú hang klónozás szemcsés stílusvezérléssel

Próbáld meg. OpenVoice

Hogyan használjuk a nyílt forráskódú TTS-t?

Használd a házigazdánk API-ját vagy fuss modelleket magad

1

Nyílt forráskódú modellek feltárása

Böngésszen katalógusunkban a 20+ nyílt forráskódú TTS modelleket. Minden modell oldal az licencet, architektúrát, képességeket és önkiszolgáló követelményeket mutatja.

2

Próbáld ki a böngésződben

Teszt bármely modell közvetlenül a TTS.ai telepítése nélkül. GPU szervereink feldolgozzák, így értékelni tudja a minőséget, mielőtt elkötelezi magát az önkiszolgáló.

3

Önvédelem vagy az API használata

Clone modell repos a GitHub és futni helyben, vagy használja a házigazdát API a termelés. Ön-hosting ad teljes körű ellenőrzést; API biztosítja a kezelt infrastruktúra.

4

Az alkalmazás szerkesztése

A TTS integrálása a termékbe saját házigazda modellekkel vagy a REST API-val. Minden modell kereskedelmileg használható licencdíjak és jogdíjak nélkül.

A licenc összehasonlítása

Minden modell TTS.ai használ kereskedelmi-barát nyílt forráskódú licencek

Minta Jogosítvány Kereskedelmi célú felhasználás Módosítás Önkiszolgáló Attribúció
Kokoro Apache 2.0 Szükséges
Piper MIT Opcionális
VITS MIT Opcionális
MeloTTS MIT Opcionális
Chatterbox MIT Opcionális
Tortoise TTS Apache 2.0 Szükséges
StyleTTS 2 MIT Opcionális
OpenVoice MIT Opcionális
Sesame CSM Apache 2.0 Szükséges
Orpheus Llama 3.2 "Built with Llama"

Önfenntartó vs. vendéglátó API

Futtasd le magad a modelleket, vagy hagyd, hogy mi intézzük az infrastruktúrát.

Önvédelem a hardvereden

Minden modell a TTS.ai elérhető, mint egy nyílt forráskódú projekt GitHub vagy Hugging Face. Töltse le a súlyokat, telepítse a függőségek, és futtassa a következtetéseket a saját GPU-k. Van teljes körű ellenőrzése a latencia, a magánélet, és a méretezés.

  • A teljes adatvédelemmel kapcsolatos adatok védelme Audio soha nem hagyja el a szerverét
  • Kérelmenként nem merül fel költség a kezdeti beállítást követően
  • Egyedi finomhangolás a saját adataidon
  • GPU hardvert igényel (NVIDIA ajánlott)
  • Te kezeled a frissítéseket, a méretezést és a függőségeket

Használja a TTS.ai hosted API-t

Get instant access to all 20+ models through a single REST API. We handle GPU provisioning, model updates, quere management, and scalage. One API key gives give you access to every model.

  • Nincs szükség GPU hardverre
  • Az összes 20+ modell egy API-n keresztül
  • Automatikus modellfrissítések és fejlesztések
  • 99,9%-os üzemidő a felesleges infrastruktúrával
  • Csak azért fizess, amit használsz.

Gyors indítás: API vagy Self-Host

Használja a házigazdát API, vagy telepítse Kokoro helyben percek alatt

1. lehetőség: TTS.ai Fogadott API A legegyszerűbb
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2. lehetőség: Önvédelem pip-pel Teljes irányítás
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Nyílt forrás, megfizethető árak

A házigazdánk a GPU-k kezelése nélkül teszi elérhetővé a nyílt forráskódú TTS-t.

Free Tier

$0

15.000 karakter a regisztrációkor

  • 4 nyílt forráskódú modell ingyenes
  • Nincs regisztráció az alapfelhasználásra
  • Kereskedelmi célú felhasználás megengedett

Indító

$9

500 000 karakter/hónap

  • Összes 20+ nyílt forráskódú modell
  • Hang klónozása
  • API-hozzáférés

Pro

$29

2.000.000 karakter/hónap

  • Prioritású GPU-feldolgozás
  • Valamennyi prémium modell
  • Vállalkozások támogatása
Teljes ár megtekintése

Gyakran ismételt kérdések

Közös kérdések a nyílt forráskódú szövegről a beszédre

Igen. A TTS.ai-es modell egy engedékeny nyílt forráskódú licencet használ, vagy az MIT-t vagy az Apache 2.0-t. Kifejezetten kizárjuk a korlátozó licencekkel rendelkező modelleket (például a Coqui CPML-ét vagy a nem kereskedelmi CC-BY-NC-t). Minden modell licencét ellenőrizni lehet a GitHub adattárában.

Mindkettő engedélyezett nyílt forráskódú licencek, amelyek lehetővé teszik a kereskedelmi felhasználást, a módosítást és az újraelosztást. Az Apache 2.0 explicit szabadalmi támogatásokat ad hozzá, és változtatásokat követel meg, ha módosítod a kódot. Az MIT egyszerűbb, kevesebb követelménnyel. Mindkettő üzleti-barát.

Igen. Minden modell lehet saját házigazda. Clone a modell adattár GitHub, telepítse függőségek, letöltése modell súlyok, és futtassa következtetés. Mi biztosítja dokumentáció minden modell önhosting követelmények, beleértve a GPU, RAM, és Python verzió.

A követelmények modellenként változnak. Piper-nek nem kell GPU (csak CPU). Kokoro-nak és MelotTS-nek 1-2GB VRAM-ra van szüksége. A legtöbb standard modellnek 4GB VRAM-ra van szüksége. Tortoise-nak és Szezám CSM-nek 8GB-ra van szüksége. Az NVIDIA RTX 3060 (12GB) a legtöbb modellt kényelmesen tudja futtatni.

Igen. A nyílt forráskódú licencek lehetővé teszik a módosítást, beleértve a finomhangolást is. Az olyan modellek, mint a GPT-Sovits és a Bark finomhangoló szkripteket biztosítanak. A saját hangadatokon is vonatozhat modelleket, hogy egyéni hangokat hozzon létre, vagy javítson bizonyos nyelvek teljesítményén.

Top nyílt forráskódú modellek (Kokoro, StyletTS 2, Chatterbox) most megfelelnek vagy meghaladják az olyan kereskedelmi szolgáltatásokat, mint az ElevenLabs és a Google TTS minőségi referenciaértékek. A kereskedelmi szolgáltatások fő előnye az infrastruktúra és támogatás, nem pedig a hangminőség.

Már kizártuk őket. XTTS/XTTS-v2 (Coqui's CPML - non-commercial), F5-TTS (CC-BY-NC - non-commercial) és Higgs-v2 (Boson License - korlátozó) mind eltűntek. Minden modell TTS.ai igazolt kereskedelmi célú biztonságos.

Igen. A legtöbb modell a GitHub-on keresztül fogadja el a közösségi hozzájárulásokat. Beküldheti a hibabejelentéseket, az új nyelvek hangfelvételeit, a kódfejlesztéseket és a dokumentációt. Ellenőrizze az egyes modellek GitHub adattárát a hozzájárulási irányelvek és az aktív kérdések tekintetében.

A GPU szerverünk 20+ modelleket futtat 4x Tesla P40-en (96GB teljes VRAM), dinamikus terheléssel. Önkiszolgálóként egy 24GB-os GPU 3-5 modellt tud egyszerre szolgálni.

Sok modell ad hivatalos Docker képeket vagy Dockerfiles. Több modell futtatásához lehet építeni egy egyedi Docker beállítást NVIDIA Container Toolkit GPU hozzáférés. API szerver architektúra szolgálhat referencia implementáció.

A legtöbb modell Python 3.10-3.12. Coqui TTS (VITS) kifejezetten szüksége Python 3.11. Javasoljuk Python 3.12 a legtöbb modell. Ellenőrizze minden modell követelményeinek.txt a pontos verzió kompatibilitás.

Igen. Az MIT és az Apache 2.0 licencek kifejezetten lehetővé teszik a kereskedelmi felhasználást. A SaaS termékeket, mobil alkalmazásokat, játékokat és szolgáltatásokat ezeken a modelleken lehet építeni licencdíjak, jogdíjak vagy odaítélési követelmények nélkül (bár a hozzárendelést értékelik).
5.0/5 (1)

Mit lehetne javítani? A visszajelzés segít megoldani a problémákat.

Próbálja ki az Open Source TTS-t ma

20+ nyílt forráskódú modellek, minden kereskedelmileg engedélyezett. Használja az API-t vagy az ön-hostit, a választás az Öné.