Raportează cererea de eroare / caracteristică

Deschide textul sursă pentru modele de vorbire

Fiecare model TTS de pe platforma noastră este open source cu licențe comercial-friendly. MIT, Apache 2.0 — fără blocare proprietară, fără restricții de utilizare, fără taxe de licență surpriză. Utilizați-le prin API găzduite, sau auto-găzduiți-le pe propria infrastructură cu control complet.

Sursă deschisă Licență MIT Apache 2.0 Auto-Hostable GitHub

Editor complet TTS Docs API

Încearcă acum

0/500

Gratuit cu Kokoro, Piper, VITS, MeloTTS

Audio generat va apărea aici

Deschide editorul complet TTS

Beneficii deschise ale sursei TTS

De ce modelele de open-source contează pentru proiectele dvs.

Toate licențiate cu sursă deschisă

Fiecare model de pe TTS.ai folosește o licență permisivă de open-source. Fără cutii negri proprietare, fără blocare de vânzător, fără taxe neașteptate de licență.

MIT / Apache 2.0

Modelele sunt licențiate sub MIT sau Apache 2.0, cele mai permisive licențe de open-source. Utilizați comercial, modificați, redistribuiți — fără restricții.

Auto-Hostable

Descărcați orice model și executați-l pe propriul hardware. Control complet asupra datelor, latență și infrastructură. Nu este nevoie de dependență cloud.

GPU optimizat

Modelele sunt optimizate pentru GPU NVIDIA cu suport CUDA. Piper rulează doar pe CPU. Majoritatea modelelor au nevoie de 2-8GB VRAM pentru inferință eficientă.

Comunitate menținută

Comunitățile active de surse deschise mențin și îmbunătățesc aceste modele. Contribuții binevenite — depune bug-uri, îmbunătățiri și noi voci pe GitHub.

Utilizare comercială OK

Toate modelele permit utilizarea comercială sub licențele lor. Construiți produse, vindeți servicii și creați conținut comercial fără redevențe sau taxe de utilizare.

Catalogul nostru de model de sursă deschisă

Fiecare model, licența, și ceea ce face cel mai bine

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Cel mai bun pentru: Apache 2.0 — cel mai bun model gratuit de calitate, parame de 82M, ușor de găzduit

Încearcă Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Cel mai bun pentru: MIT – exclusiv CPU, perfect pentru dispozitive de bord și auto-hoteazing încorporat

Încearcă Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Cel mai bun pentru: MIT – arhitectura fundațională utilizată de multe modele aval

Încearcă VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Cel mai bun pentru: MIT – capacități unice de generație audio dincolo de standardul TTS

Încearcă Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clonarea vocală

Cel mai bun pentru: Apache 2.0 – calitatea maximă, implementarea de referinţă studiată la scară largă

Încearcă Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clonarea vocală

Cel mai bun pentru: MIT – clonarea vocală deschisă cu controlul stilului granular

Încearcă OpenVoice

Cum să utilizați sursa deschisă TTS

Folosește API-ul nostru găzduit sau rulați modele singur

Explorează modelele cu sursă deschisă

Explorați catalogul nostru de modele TTS de 20+ de surse deschise. Fiecare pagină de model arată licența, arhitectura, capacitatea și cerințele de auto-găzduire.

Încearcă în browserul tău

Testați orice model direct pe TTS.ai fără a instala nimic. serverele noastre GPU se ocupă de prelucrarea astfel încât să puteți evalua calitatea înainte de a se comite pentru auto-hosting.

Self-Host sau folosiți API-ul nostru

Clone model repos de GitHub și rula local, sau folosiți API-ul nostru găzduit pentru producție. Auto-hosting oferă control complet; API nostru oferă infrastructură gestionată.

Construiește aplicația dumneavoastră

Integrați TTS în produsul dvs. folosind modele auto-hoted sau API REST. Toate modelele sunt utilizabile comercial, fără taxe de licență sau redevențe.

Compararea licențelor

Toate modelele de pe TTS.ai folosesc licențe comercial-friendly de open-source

Model	Licență	Atribuția
Kokoro	Apache 2.0	Necesită
Piper	MIT	Opțional
VITS	MIT	Opțional
MeloTTS	MIT	Opțional
Chatterbox	MIT	Opțional
Tortoise TTS	Apache 2.0	Necesită
StyleTTS 2	MIT	Opțional
OpenVoice	MIT	Opțional
Sesame CSM	Apache 2.0	Necesită
Orpheus	Llama 3.2	"Built with Llama"

Încearcă aceste modele gratis

Auto-Hosting vs API găzduită

Fugi modele sau lasă-ne să ne ocupăm de infrastructură.

Self-Host pe hardware-ul tau

Fiecare model de pe TTS.ai este disponibil ca un proiect de open-source pe GitHub sau Hugging Face. Descarcă greutatea, instala dependențele și rula inferența pe propriile GPU. Aveți control complet asupra latenței, confidențialității și escalarea.

Confidențialitate completă a datelor — audio nu părăsește niciodată serverul dumneavoastră
Nu există costuri per-request după înființarea inițială
Ajustări fine personalizate pe propriile date
Necesită hardware GPU (NVIDIA recomandată)
Gestionați actualizări, scalare și dependențe

Folosește TTS.ai API găzduită

Obțineți acces instantaneu la toate modelele 20+ prin intermediul unei singure API REST. Ne ocupăm de furnizarea GPU, actualizările modelului, gestionarea cozii și scalarea. O cheie API vă oferă acces la fiecare model — nu este nevoie pentru a gestiona implementații separate.

Nu este nevoie de hardware GPU
Toate modelele 20+ prin o API
Actualizări și îmbunătățiri automate a modelului
99,9% timp de întrerupere cu infrastructură redundantă
Plăteşte doar pentru ceea ce utilizaţi

Folosește API gazdă în schimb

Pornire rapidă: API sau auto-host

Folosește API-ul nostru găzduit, sau instalează Kokoro local în minute

Opțiunea 1: TTS.ai API găzduită Cel mai ușor

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Opțiunea 2: Auto-Host cu pip Control complet

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Afișează documentarea API

Sursă deschisă, prețuri accesibile

API-ul nostru găzduit face acces la TTS open-source fără a gestiona GPU.

Titru liber

15.000 de caractere pe înscriere

4 modele de sursă deschisă gratuit
Nicio înscriere pentru utilizare de bază
Utilizarea comercială permisă

Pornitor

500 000 de caractere/luna

Toate modelele de 20+ de surse deschise
Clonarea vocală
Acces API

Pro

$29

2.000.000 de caractere/luna

Prelucrarea prioritară a GPU
Toate modelele premium
Sprijin pentru întreprinderi

Vizualizare preţuri complete

Întrebări frecvente

Întrebări comune cu privire la textul sursă deschisă la discurs

Da. Fiecare model de pe TTS.ai folosește o licență permisivă de open-source — fie MIT sau Apache 2.0. Excludem modelele cu licențe restrictive (cum ar fi CPML Coqui sau CC-BY-NC necomerciale). Puteți verifica licența fiecărui model pe depozitul GitHub.

Ambele sunt permisive licențe de open-source care permit utilizarea comercială, modificarea și redistribuirea. Apache 2.0 adaugă subvenții de brevet explicite și necesită indicarea modificărilor dacă modificați codul. MIT este mai simplu cu mai puține cerințe. Ambele sunt favorabile pentru afaceri.

Da. Fiecare model poate fi auto-hosted. Clonează depozitul modelului de la GitHub, instalează dependențe, descărcă greutatea modelului și execută inferență. Noi furnizează documentație pentru cerințele de auto-hosting ale fiecărui model, inclusiv GPU, RAM și versiunea Python.

Cerințe variază după model. Piper are nevoie de GPU (numai CPU). Kokoro și MeloTTS au nevoie de 1-2GB VRAM. Cele mai multe modele standard au nevoie de 4GB VRAM. Tortoise și Sesame CSM are nevoie de 8GB. O NVIDIA RTX 3060 (12GB) poate rula majoritatea modelelor confortabil.

Da. Licențe de sursă deschisă permit modificarea incluzând afinarea. Modelele cum ar fi GPT-SoVITS și Bark furnizează scripturi de afinare. Puteți forma modele pe propriile date vocale pentru a crea voci personalizate sau pentru a îmbunătăți performanța pentru anumite limbi.

Top open-source models (Kokoro, StyleTTS 2, Chatterbox) acum se potrivesc sau depășesc servicii comerciale cum ar fi ElevenLabs și Google TTS în puncte de referință de calitate. Principalul avantaj al serviciilor comerciale este administrat infrastructură și suport, nu calitate audio.

Deja le-am exclus. XTTS/XTTS-v2 (CPML Coqui — necomercial), F5-TTS (CC-BY-NC — necomercial) și Higgs-v2 (Licența Boson — restrictivă) au fost toate eliminate. Fiecare model de la TTS.ai este verificat siguranță de utilizare comercială.

Da. Cele mai multe modele acceptă contribuții comunitare prin GitHub. Puteți trimite rapoarte de bug, înregistrări vocale pentru noi limbi, îmbunătățiri de cod și documentație. Verificați depozitul GitHub de fiecare model pentru liniile directoare de contribuție și probleme active.

Încarcă modele la cerere și descarcă atunci când inactiv pentru a împărtăși memoria GPU. serverul nostru GPU execută 20+ modele pe 4x Tesla P40 (96GB total VRAM) folosind încărcare dinamică. Pentru auto-găzduire, un singur GPU 24GB poate servi 3-5 modele în consecință.

Multe modele furnizează imagini oficiale de docker sau dockerfiles. Pentru a rula mai multe modele, puteți construi o configurare personalizată de docker cu NVIDIA Container Toolkit pentru accesul GPU. Arhitectura serverului API poate servi ca o implementare de referință.

Cele mai multe modele necesită Python 3.10-3.12. Coqui TTS (VITS) are nevoie în mod specific de Python 3.11. Vă recomandăm Python 3.12 pentru majoritatea modelelor. Verificați cerințele fiecărui model.txt pentru compatibilitatea exactă a versiunii.

Da. licențe MIT și Apache 2.0 permit utilizarea comercială explicit. Puteți construi produse SaaS, aplicații mobile, jocuri și servicii folosind aceste modele fără taxe de licență, redevențe sau cerințe de atribuire (deși atribuția este apreciată).

5.0/5 (1)

Încearcă să deschizi sursa TTS astăzi

20+ de modele de surse deschise, toate licențiate comercial. Utilizați API-ul nostru sau auto-gazdă — alegerea este a ta.

Inscrie-te gratis Vizualizare preţuri

Deschide textul sursă pentru modele de vorbire

Încearcă acum

Spune-i prietenilor tăi!

Beneficii deschise ale sursei TTS

Toate licențiate cu sursă deschisă

MIT / Apache 2.0

Auto-Hostable

GPU optimizat

Comunitate menținută

Utilizare comercială OK

Catalogul nostru de model de sursă deschisă

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Cum să utilizați sursa deschisă TTS

Explorează modelele cu sursă deschisă

Încearcă în browserul tău

Self-Host sau folosiți API-ul nostru

Construiește aplicația dumneavoastră

Compararea licențelor

Auto-Hosting vs API găzduită

Self-Host pe hardware-ul tau

Folosește TTS.ai API găzduită

Pornire rapidă: API sau auto-host

Sursă deschisă, prețuri accesibile

Titru liber

Pornitor

Pro

Întrebări frecvente

Toate modelele sunt TTS.ai cu adevărat sursă deschisă?

Care este diferenţa dintre licenţele MIT şi Apache 2.0?

Pot să găzduiesc modelele astea pe propriul meu server?

Ce GPU am nevoie pentru a auto-gazda modele TTS?

Pot aranja modelele TTS de surse deschise?

Cum se compară modelele TTS de surse deschise cu serviciile comerciale?

Sunt vreun model cu licenţe restrictive pe care ar trebui să le evit?

Pot contribui la aceste modele de surse deschise?

Cum pot rula mai multe modele pe un server GPU?

Există o imagine Docker pentru auto-găzduirea?

Ce versiune Python am nevoie pentru auto-găzduirea?

Pot construi un produs comercial folosind aceste modele?

Încearcă să deschizi sursa TTS astăzi