Modele të hapura të tekstit në fjalë

Çdo model TTS në platformën tonë është me burim të hapur me licenca të përshtatshme komerciale. MIT, Apache 2.0 — pa bllokime të pronësisë, pa kufizime përdorimi, pa pagesa të papritur licensimi. Përdori ato nëpërmjet API-së sonë të pritur, ose vetë-priti ato në infrastrukturën tënde me kontroll të plotë.

Burimi i hapur Liçenca MIT Apache 2.0 Vetë-Hostues GitHub

Provoje tani

Pa pagesë me Kokoro, Piper, VITS, MeloTTS
Zëri juaj i gjeneruar do të shfaqet këtu
Gjenerat
Shkarko
Të pëlqen TTS.ai?

Përfitimet e TTS me burim të hapur

Përse modelet me burim të hapur kanë rëndësi për projektet tuaja

Të gjitha me licensë të hapur

Çdo model në TTS.ai përdor një licencë të hapur të lejueshme. Pa kuti të zeza të pronësisë, pa bllokime të shitësit, pa pagesa të papritur licensimi.

MIT / Apache 2.0

Modelet janë të licensuara nën MIT ose Apache 2.0, licencat më të lejueshme të burimit të hapur. Përdorimi komercial, modifikimi, ridistribuimi — pa kufizime.

Vetë-Hostues

Shkarko çdo model dhe zbatoje në hardware-in tënd. Kontroll të plotë mbi të dhënat, kohën e pritjes dhe infrastrukturën. Nuk kërkohet varësi nga retë.

Optimizuar për GPU

Modelet janë optimizuar për GPU NVIDIA me suport CUDA. Piper funksionon vetëm në CPU. Shumica e modeleve kanë nevojë për 2-8GB VRAM për të arritur përfundime të efektshme.

Komuniteti

Komunitete aktive të burimit të hapur i mbajnë dhe i përmirësojnë këto modele. Kontributet janë të mirëpritura — dërgoni gabime, përmirësime dhe zëra të rinj në GitHub.

Përdorimi komercial OK

Të gjithë modelet lejojnë përdorim komercial nën licensat e tyre. Ndërtoni produkte, shitni shërbime dhe krijoni përmbajtje komerciale pa pagesa apo pagesa përdorimi.

Katalogu ynë i modelit me burim të hapur

Çdo model, licensën e tij, dhe atë që ai bën më mirë

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Më i miri për: Apache 2.0 — modeli me cilësinë më të mirë të lirë, 82M parametra, i lehtë për vetë-hostim

Provo Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Më i miri për: MIT — CPU-only, perfekt për pajisjet e skajit dhe vetë-hostimin e ndërlidhur

Provo Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Më i miri për: MIT — arkitektura themelore e përdorur nga shumë modele të mëposhtme

Provo VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Më i miri për: MIT — aftësitë unike të gjenerimit të zërit përtej standardit TTS

Provo Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Klonimi i zërit

Më i miri për: Apache 2.0 — cilësi maksimale, zbatim i studjuar gjerësisht

Provo Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Klonimi i zërit

Më i miri për: MIT — klonimi i zërit me burim të hapur me kontroll të stilit të hollë

Provo OpenVoice

Si të përdorësh TTS me burim të hapur

Përdor API tonë të pritur ose ekzekutoj vetë modelet

1

Eksploro Modelet e Burimeve të Hapura

Shfleto katalogun tonë me mbi 20 modele të TTS me burim të hapur. Çdo faqe modeli tregon licencën, arkitekturën, aftësitë dhe kërkesat për vetë-pritje.

2

Provo në shfletuesin tënd

Testo çdo model drejtpërsëdrejti në TTS.ai pa instaluar asgjë. Serverët tanë GPU trajtojnë përpunimin kështu që mund të vlerësoni cilësinë para se të angazhoheni për vetë-pritjen.

3

Vetë-Host ose Përdor API Tonë

Klonoje modelin e repos nga GitHub dhe ekzekutoj lokalisht, ose përdore API-në tonë të pritur për prodhim. Vetë-pritja jep kontroll të plotë; API-ja jonë ofron infrastrukturë të menazhuar.

4

Ndërto aplikimin tënd

Integro TTS në produktin tënd duke përdorur modele të vetë-hostuara ose API-në tonë REST. Të gjithë modelet janë të përdorshëm komercialisht pa pagesa apo pagesa licensimi.

Krahasimi i Liçensave

Të gjithë modelet në TTS.ai përdorin licenca të hapura komerciale

Modeli Liçenca Përdorim komercial Ndrysho Host Atribuimi
Kokoro Apache 2.0 E nevojshme
Piper MIT Opsionale
VITS MIT Opsionale
MeloTTS MIT Opsionale
Chatterbox MIT Opsionale
Tortoise TTS Apache 2.0 E nevojshme
StyleTTS 2 MIT Opsionale
OpenVoice MIT Opsionale
Sesame CSM Apache 2.0 E nevojshme
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API

Ekzekuto modele vetë ose na lejo të kujdesemi për infrastrukturën.

Host i vetë-organizuar në hardware tuaj

Çdo model në TTS.ai është në dispozicion si një projekt me burim të hapur në GitHub ose Hugging Face. Shkarko peshat, instalo varësitë dhe kryej deduktimin në GPU-të e tua. Ke kontroll të plotë mbi vonesën, privatësinë dhe shkallëzimin.

  • Privatësia e plotë e të dhënave — zëri nuk largohet kurrë nga serveri juaj
  • Asnjë kosto për kërkesë pas konfigurimit fillestar
  • Përshtatje e personalizuar e të dhënave tuaja
  • Nevoitet hardware GPU (NVIDIA rekomandohet)
  • Ju menazhoni rifreskimet, shkallëzimin dhe varësitë

Përdor TTS.ai Hosted API

Merr akses të menjëhershëm tek të gjithë 20+ modelet nëpërmjet një API të vetme REST. Ne trajtojmë furnizimin e GPU, përditësimet e modelit, menazhimin e rreshtave dhe shkallëzimin. Një kyç API të jep akses tek çdo model — nuk ka nevojë për të menazhuar shpërndarje të veçanta.

  • Nuk nevojitet hardware GPU
  • Të gjithë 20+ modelet nëpërmjet një API
  • Përditësime dhe përmirësime automatike të modelit
  • 99.9% kohë aktive me infrastrukturë të tepërt
  • Paguaj vetëm për atë që përdor

Fillimi i shpejtë: API ose vetë-host

Përdor API tonë të pritur, ose instalo Kokoro lokalisht brenda minutave

Opsion 1: TTS.ai Hosted API Më e lehtë
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opsion 2: Self-Host me pip Kontroll i plotë
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Burimi i Hapur, Çmime të Përshtatshme

API jonë e mirëpritur bën të hapur-burimeve TTS të arritshme pa menaxhuar GPUs.

Niveli i lirë

$0

15 kredite në regjistrim

  • 4 modele të hapura të lirë
  • Asnjë regjistrim për përdorim bazë
  • Përdorimi komercial është i lejuar

Fillues

$9

500,000 karakterë/muaj

  • Të gjithë 20+ modelet e burimit të hapur
  • Klonimi i zërit
  • Hyrja në API

Pro

$29

2,000,000 karakterë/muaj

  • Prioriteti i përpunimit GPU
  • Të gjithë modelet premium
  • Suporti i Enterprise
Shiko çmimin e plotë

Pyetje të shpeshta

Pyetja e zakonshme rreth burimit të hapur tekst-në-folje

Po. Çdo model në TTS.ai përdor një licencë të hapur të hapur — ose MIT ose Apache 2.0. Ne veçanërisht përjashtojmë modelet me licenca kufizimi (si CPML e Coqui ose CC-BY-NC jo-komerciale). Mund të verifikoni licencën e çdo modeli në depozitën e tij GitHub.

Të dyja janë licenca të hapura që lejojnë përdorim komercial, modifikim dhe ridistribuim. Apache 2.0 shton dhënien e patentave të hapura dhe kërkon të deklarosh ndryshimet nëse modifikon kodin. MIT është më e thjeshtë me më pak kërkesa. Të dyja janë të përshtatshme për biznesin.

Po. Çdo model mund të jetë i vetë-pritur. Klono depozitën e modelit nga GitHub, instalo varësitë, shkarko peshën e modelit dhe kryej deduktimin. Ne ofrojmë dokumentacion për çdo kërkesë të vetë-pritjes së modelit duke përfshirë GPU, RAM dhe versionin Python.

Kërkesat ndryshojnë në varësi të modelit. Piper nuk ka nevojë për GPU (vetëm CPU). Kokoro dhe MeloTTS kanë nevojë për 1-2GB VRAM. Shumica e modeleve standarde kanë nevojë për 4GB VRAM. Tortoise dhe Sesame CSM kanë nevojë për 8GB. Një NVIDIA RTX 3060 (12GB) mund të funksionojë në shumicën e modeleve.

Po. Liçensat me burim të hapur lejojnë modifikime duke përfshirë rregullimin e hollësishëm. Modelet si GPT-SoVITS dhe Bark ofrojnë script-e për rregullimin e hollësishëm. Mund të trajnoni modelet në të dhënat tuaja të zërit për të krijuar zëra të personalizuar ose për të përmirësuar performancën për gjuhë të veçanta.

Modelet e burimit të hapur (Kokoro, StyleTTS 2, Chatterbox) tani barazojnë ose tejkalojnë shërbimet komerciale si ElevenLabs dhe Google TTS në standartet e cilësisë. Përfitimi kryesor i shërbimeve komerciale është infrastruktura e menazhuar dhe mbështetja, jo cilësia e zërit.

Ne i kemi përjashtuar tashmë. XTTS/XTTS-v2 (Coqui's CPML — jo-komerciale), F5-TTS (CC-BY-NC — jo-komerciale), dhe Higgs-v2 (Liçenca e Bosonit — kufizime) janë të gjitha të hequr. Çdo model në TTS.ai është verifikuar i sigurtë për përdorim komercial.

Po. Shumica e modeleve pranojnë kontributet e komunitetit nëpërmjet GitHub. Mund të dërgosh raporte të gabimeve, regjistrime zëri për gjuhë të reja, përmirësime të kodit dhe dokumentacion. Kontrollo depozitën GitHub të çdo modeli për udhëzimet e kontributit dhe çështjet aktive.

Ngarko modele sipas kërkesës dhe zhbëj kur nuk përdoret për të ndarë kujtesën e GPU. Serveri ynë i GPU-së përdor më shumë se 20 modele në 4x Tesla P40 (96GB VRAM total) duke përdorur ngarkimin dinamik. Për vetë-pritjen, një GPU e vetme 24GB mund të shërbej 3-5 modele në të njëjtën kohë.

Shumë modele ofrojnë imazhe zyrtare Docker ose Dockerfiles. Për të kryer modele të shumta, mund të ndërtosh një konfigurim të personalizuar Docker me NVIDIA Container Toolkit për hyrje në GPU. Arkitektura jonë e serverit API mund të shërbejë si një implementim referencë.

Shumica e modeleve kërkojnë Python 3.10-3.12. Coqui TTS (VITS) kërkon veçanërisht Python 3.11. Ne rekomandojmë Python 3.12 për shumicën e modeleve. Kontrollo çdo model requirements.txt për përputhshmërinë e saktë të versionit.

Po. Liçensat MIT dhe Apache 2.0 lejojnë eksplicitisht përdorimin komercial. Mund të ndërtoni produkte SaaS, aplikacione mobile, lojëra dhe shërbime duke përdorur këto modele pa pagesa licensimi, royalties, apo kërkesa për atribuim (edhe pse atribuimi është i vlerësuar).
5.0/5 (1)

Çfarë mund të përmirësojmë? Feedback-i juaj na ndihmon të zgjidhim problemet.

Provo sot TTS me burim të hapur

20+ modele me burim të hapur, të gjitha me licencë komerciale. Përdor API tonë ose vetë-host — zgjedhja është juaja.