Raporto një gabim / kërkesë për funksion

Modele të hapura të tekstit në fjalë

Çdo model TTS në platformën tonë është me burim të hapur me licenca të përshtatshme komerciale. MIT, Apache 2.0 — pa bllokime të pronësisë, pa kufizime përdorimi, pa pagesa të papritur licensimi. Përdori ato nëpërmjet API-së sonë të pritur, ose vetë-priti ato në infrastrukturën tënde me kontroll të plotë.

Burimi i hapur Liçenca MIT Apache 2.0 Vetë-Hostues GitHub

Editori i plotë TTS Dokumentimi i API

Provoje tani

Teksti
File

0/500

Pa pagesë me Kokoro, Piper, VITS, MeloTTS

Zëri juaj i gjeneruar do të shfaqet këtu

Hap editorin e plotë të TTS

Përfitimet e TTS me burim të hapur

Përse modelet me burim të hapur kanë rëndësi për projektet tuaja

Të gjitha me licensë të hapur

Çdo model në TTS.ai përdor një licencë të hapur të lejueshme. Pa kuti të zeza të pronësisë, pa bllokime të shitësit, pa pagesa të papritur licensimi.

MIT / Apache 2.0

Modelet janë të licensuara nën MIT ose Apache 2.0, licencat më të lejueshme të burimit të hapur. Përdorimi komercial, modifikimi, ridistribuimi — pa kufizime.

Vetë-Hostues

Shkarko çdo model dhe zbatoje në hardware-in tënd. Kontroll të plotë mbi të dhënat, kohën e pritjes dhe infrastrukturën. Nuk kërkohet varësi nga retë.

Optimizuar për GPU

Modelet janë optimizuar për GPU NVIDIA me suport CUDA. Piper funksionon vetëm në CPU. Shumica e modeleve kanë nevojë për 2-8GB VRAM për të arritur përfundime të efektshme.

Komuniteti

Komunitete aktive të burimit të hapur i mbajnë dhe i përmirësojnë këto modele. Kontributet janë të mirëpritura — dërgoni gabime, përmirësime dhe zëra të rinj në GitHub.

Përdorimi komercial OK

Të gjithë modelet lejojnë përdorim komercial nën licensat e tyre. Ndërtoni produkte, shitni shërbime dhe krijoni përmbajtje komerciale pa pagesa apo pagesa përdorimi.

Katalogu ynë i modelit me burim të hapur

Çdo model, licensën e tij, dhe atë që ai bën më mirë

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Me shpejtësi 5/5

Më i miri për: Apache 2.0 — modeli me cilësinë më të mirë të lirë, 82M parametra, i lehtë për vetë-hostim

Provo Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Me shpejtësi 3/5

Më i miri për: MIT — CPU-only, perfekt për pajisjet e skajit dhe vetë-hostimin e ndërlidhur

Provo Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Me shpejtësi 3/5

Më i miri për: MIT — arkitektura themelore e përdorur nga shumë modele të mëposhtme

Provo VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Ngadalë 4/5

Më i miri për: MIT — aftësitë unike të gjenerimit të zërit përtej standardit TTS

Provo Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Ngadalë 5/5 Klonimi i zërit

Më i miri për: Apache 2.0 — cilësi maksimale, zbatim i studjuar gjerësisht

Provo Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonimi i zërit

Më i miri për: MIT — klonimi i zërit me burim të hapur me kontroll të stilit të hollë

Provo OpenVoice

Si të përdorësh TTS me burim të hapur

Përdor API tonë të pritur ose ekzekutoj vetë modelet

Eksploro Modelet e Burimeve të Hapura

Shfleto katalogun tonë me mbi 20 modele të TTS me burim të hapur. Çdo faqe modeli tregon licencën, arkitekturën, aftësitë dhe kërkesat për vetë-pritje.

Provo në shfletuesin tënd

Testo çdo model drejtpërsëdrejti në TTS.ai pa instaluar asgjë. Serverët tanë GPU trajtojnë përpunimin kështu që mund të vlerësoni cilësinë para se të angazhoheni për vetë-pritjen.

Vetë-Host ose Përdor API Tonë

Klonoje modelin e repos nga GitHub dhe ekzekutoj lokalisht, ose përdore API-në tonë të pritur për prodhim. Vetë-pritja jep kontroll të plotë; API-ja jonë ofron infrastrukturë të menazhuar.

Ndërto aplikimin tënd

Integro TTS në produktin tënd duke përdorur modele të vetë-hostuara ose API-në tonë REST. Të gjithë modelet janë të përdorshëm komercialisht pa pagesa apo pagesa licensimi.

Krahasimi i Liçensave

Të gjithë modelet në TTS.ai përdorin licenca të hapura komerciale

Modeli	Liçenca	Atribuimi
Kokoro	Apache 2.0	E nevojshme
Piper	MIT	Opsionale
VITS	MIT	Opsionale
MeloTTS	MIT	Opsionale
Chatterbox	MIT	Opsionale
Tortoise TTS	Apache 2.0	E nevojshme
StyleTTS 2	MIT	Opsionale
OpenVoice	MIT	Opsionale
Sesame CSM	Apache 2.0	E nevojshme
Orpheus	Llama 3.2	"Built with Llama"

Provo këto modele falas

Self-Hosting vs Hosted API

Ekzekuto modele vetë ose na lejo të kujdesemi për infrastrukturën.

Host i vetë-organizuar në hardware tuaj

Çdo model në TTS.ai është në dispozicion si një projekt me burim të hapur në GitHub ose Hugging Face. Shkarko peshat, instalo varësitë dhe kryej deduktimin në GPU-të e tua. Ke kontroll të plotë mbi vonesën, privatësinë dhe shkallëzimin.

Privatësia e plotë e të dhënave — zëri nuk largohet kurrë nga serveri juaj
Asnjë kosto për kërkesë pas konfigurimit fillestar
Përshtatje e personalizuar e të dhënave tuaja
Nevoitet hardware GPU (NVIDIA rekomandohet)
Ju menazhoni rifreskimet, shkallëzimin dhe varësitë

Përdor TTS.ai Hosted API

Merr akses të menjëhershëm tek të gjithë 20+ modelet nëpërmjet një API të vetme REST. Ne trajtojmë furnizimin e GPU, përditësimet e modelit, menazhimin e rreshtave dhe shkallëzimin. Një kyç API të jep akses tek çdo model — nuk ka nevojë për të menazhuar shpërndarje të veçanta.

Nuk nevojitet hardware GPU
Të gjithë 20+ modelet nëpërmjet një API
Përditësime dhe përmirësime automatike të modelit
99.9% kohë aktive me infrastrukturë të tepërt
Paguaj vetëm për atë që përdor

Përdor në vend të kësaj API të pritur

Fillimi i shpejtë: API ose vetë-host

Përdor API tonë të pritur, ose instalo Kokoro lokalisht brenda minutave

Opsion 1: TTS.ai Hosted API Më e lehtë

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opsion 2: Self-Host me pip Kontroll i plotë

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Shiko dokumentacionin e API

Burimi i Hapur, Çmime të Përshtatshme

API jonë e mirëpritur bën të hapur-burimeve TTS të arritshme pa menaxhuar GPUs.

Niveli i lirë

15 kredite në regjistrim

4 modele të hapura të lirë
Asnjë regjistrim për përdorim bazë
Përdorimi komercial është i lejuar

Fillues

500,000 karakterë/muaj

Të gjithë 20+ modelet e burimit të hapur
Klonimi i zërit
Hyrja në API

Pro

$29

2,000,000 karakterë/muaj

Prioriteti i përpunimit GPU
Të gjithë modelet premium
Suporti i Enterprise

Shiko çmimin e plotë

Pyetje të shpeshta

Pyetja e zakonshme rreth burimit të hapur tekst-në-folje

Po. Çdo model në TTS.ai përdor një licencë të hapur të hapur — ose MIT ose Apache 2.0. Ne veçanërisht përjashtojmë modelet me licenca kufizimi (si CPML e Coqui ose CC-BY-NC jo-komerciale). Mund të verifikoni licencën e çdo modeli në depozitën e tij GitHub.

Të dyja janë licenca të hapura që lejojnë përdorim komercial, modifikim dhe ridistribuim. Apache 2.0 shton dhënien e patentave të hapura dhe kërkon të deklarosh ndryshimet nëse modifikon kodin. MIT është më e thjeshtë me më pak kërkesa. Të dyja janë të përshtatshme për biznesin.

Po. Çdo model mund të jetë i vetë-pritur. Klono depozitën e modelit nga GitHub, instalo varësitë, shkarko peshën e modelit dhe kryej deduktimin. Ne ofrojmë dokumentacion për çdo kërkesë të vetë-pritjes së modelit duke përfshirë GPU, RAM dhe versionin Python.

Kërkesat ndryshojnë në varësi të modelit. Piper nuk ka nevojë për GPU (vetëm CPU). Kokoro dhe MeloTTS kanë nevojë për 1-2GB VRAM. Shumica e modeleve standarde kanë nevojë për 4GB VRAM. Tortoise dhe Sesame CSM kanë nevojë për 8GB. Një NVIDIA RTX 3060 (12GB) mund të funksionojë në shumicën e modeleve.

Po. Liçensat me burim të hapur lejojnë modifikime duke përfshirë rregullimin e hollësishëm. Modelet si GPT-SoVITS dhe Bark ofrojnë script-e për rregullimin e hollësishëm. Mund të trajnoni modelet në të dhënat tuaja të zërit për të krijuar zëra të personalizuar ose për të përmirësuar performancën për gjuhë të veçanta.

Modelet e burimit të hapur (Kokoro, StyleTTS 2, Chatterbox) tani barazojnë ose tejkalojnë shërbimet komerciale si ElevenLabs dhe Google TTS në standartet e cilësisë. Përfitimi kryesor i shërbimeve komerciale është infrastruktura e menazhuar dhe mbështetja, jo cilësia e zërit.

Ne i kemi përjashtuar tashmë. XTTS/XTTS-v2 (Coqui's CPML — jo-komerciale), F5-TTS (CC-BY-NC — jo-komerciale), dhe Higgs-v2 (Liçenca e Bosonit — kufizime) janë të gjitha të hequr. Çdo model në TTS.ai është verifikuar i sigurtë për përdorim komercial.

Po. Shumica e modeleve pranojnë kontributet e komunitetit nëpërmjet GitHub. Mund të dërgosh raporte të gabimeve, regjistrime zëri për gjuhë të reja, përmirësime të kodit dhe dokumentacion. Kontrollo depozitën GitHub të çdo modeli për udhëzimet e kontributit dhe çështjet aktive.

Ngarko modele sipas kërkesës dhe zhbëj kur nuk përdoret për të ndarë kujtesën e GPU. Serveri ynë i GPU-së përdor më shumë se 20 modele në 4x Tesla P40 (96GB VRAM total) duke përdorur ngarkimin dinamik. Për vetë-pritjen, një GPU e vetme 24GB mund të shërbej 3-5 modele në të njëjtën kohë.

Shumë modele ofrojnë imazhe zyrtare Docker ose Dockerfiles. Për të kryer modele të shumta, mund të ndërtosh një konfigurim të personalizuar Docker me NVIDIA Container Toolkit për hyrje në GPU. Arkitektura jonë e serverit API mund të shërbejë si një implementim referencë.

Shumica e modeleve kërkojnë Python 3.10-3.12. Coqui TTS (VITS) kërkon veçanërisht Python 3.11. Ne rekomandojmë Python 3.12 për shumicën e modeleve. Kontrollo çdo model requirements.txt për përputhshmërinë e saktë të versionit.

Po. Liçensat MIT dhe Apache 2.0 lejojnë eksplicitisht përdorimin komercial. Mund të ndërtoni produkte SaaS, aplikacione mobile, lojëra dhe shërbime duke përdorur këto modele pa pagesa licensimi, royalties, apo kërkesa për atribuim (edhe pse atribuimi është i vlerësuar).

5.0/5 (1)

Provo sot TTS me burim të hapur

20+ modele me burim të hapur, të gjitha me licencë komerciale. Përdor API tonë ose vetë-host — zgjedhja është juaja.

Regjistrohu pa pagesë Shiko çmimin

Modele të hapura të tekstit në fjalë

Provoje tani

Të pëlqen TTS.ai?

Përfitimet e TTS me burim të hapur

Të gjitha me licensë të hapur

MIT / Apache 2.0

Vetë-Hostues

Optimizuar për GPU

Komuniteti

Përdorimi komercial OK

Katalogu ynë i modelit me burim të hapur

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Si të përdorësh TTS me burim të hapur

Eksploro Modelet e Burimeve të Hapura

Provo në shfletuesin tënd

Vetë-Host ose Përdor API Tonë

Ndërto aplikimin tënd

Krahasimi i Liçensave

Self-Hosting vs Hosted API

Host i vetë-organizuar në hardware tuaj

Përdor TTS.ai Hosted API

Fillimi i shpejtë: API ose vetë-host

Burimi i Hapur, Çmime të Përshtatshme

Niveli i lirë

Fillues

Pro

Pyetje të shpeshta

A janë të gjithë modelet TTS.ai me të vërtetë të hapur?

Cili është dallimi midis MIT dhe Apache 2.0 licencave?

Mund t'i vendos këto modele në serverin tim?

Çfarë GPU më duhet për të vetë-hostuar modelet TTS?

Mund të rregulloj modelet e TTS-së me burim të hapur?

Si krahasohen modelet e TTS me burim të hapur me shërbimet komerciale?

A ka modele me licensa kufizuese që duhet t'i shmang?

A mund të kontribuoj në këto modele të hapura?

Si mund të bëj të ekzekutohen modele të shumta në një server GPU?

A ka një imazh Docker për vetë-pritje?

Çfarë versioni Python më duhet për vetë-pritjen?

A mund të ndërtoj një produkt komercial duke përdorur këto modele?

Provo sot TTS me burim të hapur