Deschide textul sursă pentru modele de vorbire

Fiecare model TTS de pe platforma noastră este open source cu licențe comercial-friendly. MIT, Apache 2.0 — fără blocare proprietară, fără restricții de utilizare, fără taxe de licență surpriză. Utilizați-le prin API găzduite, sau auto-găzduiți-le pe propria infrastructură cu control complet.

Sursă deschisă Licență MIT Apache 2.0 Auto-Hostable GitHub

Încearcă acum

Gratuit cu Kokoro, Piper, VITS, MeloTTS
Audio generat va apărea aici
Generat
Descărcare
Spune-i prietenilor tăi!

Beneficii deschise ale sursei TTS

De ce modelele de open-source contează pentru proiectele dvs.

Toate licențiate cu sursă deschisă

Fiecare model de pe TTS.ai folosește o licență permisivă de open-source. Fără cutii negri proprietare, fără blocare de vânzător, fără taxe neașteptate de licență.

MIT / Apache 2.0

Modelele sunt licențiate sub MIT sau Apache 2.0, cele mai permisive licențe de open-source. Utilizați comercial, modificați, redistribuiți — fără restricții.

Auto-Hostable

Descărcați orice model și executați-l pe propriul hardware. Control complet asupra datelor, latență și infrastructură. Nu este nevoie de dependență cloud.

GPU optimizat

Modelele sunt optimizate pentru GPU NVIDIA cu suport CUDA. Piper rulează doar pe CPU. Majoritatea modelelor au nevoie de 2-8GB VRAM pentru inferință eficientă.

Comunitate menținută

Comunitățile active de surse deschise mențin și îmbunătățesc aceste modele. Contribuții binevenite — depune bug-uri, îmbunătățiri și noi voci pe GitHub.

Utilizare comercială OK

Toate modelele permit utilizarea comercială sub licențele lor. Construiți produse, vindeți servicii și creați conținut comercial fără redevențe sau taxe de utilizare.

Catalogul nostru de model de sursă deschisă

Fiecare model, licența, și ceea ce face cel mai bine

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Cel mai bun pentru: Apache 2.0 — cel mai bun model gratuit de calitate, parame de 82M, ușor de găzduit

Încearcă Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Cel mai bun pentru: MIT – exclusiv CPU, perfect pentru dispozitive de bord și auto-hoteazing încorporat

Încearcă Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Cel mai bun pentru: MIT – arhitectura fundațională utilizată de multe modele aval

Încearcă VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Cel mai bun pentru: MIT – capacități unice de generație audio dincolo de standardul TTS

Încearcă Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Clonarea vocală

Cel mai bun pentru: Apache 2.0 – calitatea maximă, implementarea de referinţă studiată la scară largă

Încearcă Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Clonarea vocală

Cel mai bun pentru: MIT – clonarea vocală deschisă cu controlul stilului granular

Încearcă OpenVoice

Cum să utilizați sursa deschisă TTS

Folosește API-ul nostru găzduit sau rulați modele singur

1

Explorează modelele cu sursă deschisă

Explorați catalogul nostru de modele TTS de 20+ de surse deschise. Fiecare pagină de model arată licența, arhitectura, capacitatea și cerințele de auto-găzduire.

2

Încearcă în browserul tău

Testați orice model direct pe TTS.ai fără a instala nimic. serverele noastre GPU se ocupă de prelucrarea astfel încât să puteți evalua calitatea înainte de a se comite pentru auto-hosting.

3

Self-Host sau folosiți API-ul nostru

Clone model repos de GitHub și rula local, sau folosiți API-ul nostru găzduit pentru producție. Auto-hosting oferă control complet; API nostru oferă infrastructură gestionată.

4

Construiește aplicația dumneavoastră

Integrați TTS în produsul dvs. folosind modele auto-hoted sau API REST. Toate modelele sunt utilizabile comercial, fără taxe de licență sau redevențe.

Compararea licențelor

Toate modelele de pe TTS.ai folosesc licențe comercial-friendly de open-source

Model Licență Utilizare comercială Modificare Auto-Host Atribuția
Kokoro Apache 2.0 Necesită
Piper MIT Opțional
VITS MIT Opțional
MeloTTS MIT Opțional
Chatterbox MIT Opțional
Tortoise TTS Apache 2.0 Necesită
StyleTTS 2 MIT Opțional
OpenVoice MIT Opțional
Sesame CSM Apache 2.0 Necesită
Orpheus Llama 3.2 "Built with Llama"

Auto-Hosting vs API găzduită

Fugi modele sau lasă-ne să ne ocupăm de infrastructură.

Self-Host pe hardware-ul tau

Fiecare model de pe TTS.ai este disponibil ca un proiect de open-source pe GitHub sau Hugging Face. Descarcă greutatea, instala dependențele și rula inferența pe propriile GPU. Aveți control complet asupra latenței, confidențialității și escalarea.

  • Confidențialitate completă a datelor — audio nu părăsește niciodată serverul dumneavoastră
  • Nu există costuri per-request după înființarea inițială
  • Ajustări fine personalizate pe propriile date
  • Necesită hardware GPU (NVIDIA recomandată)
  • Gestionați actualizări, scalare și dependențe

Folosește TTS.ai API găzduită

Obțineți acces instantaneu la toate modelele 20+ prin intermediul unei singure API REST. Ne ocupăm de furnizarea GPU, actualizările modelului, gestionarea cozii și scalarea. O cheie API vă oferă acces la fiecare model — nu este nevoie pentru a gestiona implementații separate.

  • Nu este nevoie de hardware GPU
  • Toate modelele 20+ prin o API
  • Actualizări și îmbunătățiri automate a modelului
  • 99,9% timp de întrerupere cu infrastructură redundantă
  • Plăteşte doar pentru ceea ce utilizaţi

Pornire rapidă: API sau auto-host

Folosește API-ul nostru găzduit, sau instalează Kokoro local în minute

Opțiunea 1: TTS.ai API găzduită Cel mai ușor
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Opțiunea 2: Auto-Host cu pip Control complet
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Sursă deschisă, prețuri accesibile

API-ul nostru găzduit face acces la TTS open-source fără a gestiona GPU.

Titru liber

$0

15.000 de caractere pe înscriere

  • 4 modele de sursă deschisă gratuit
  • Nicio înscriere pentru utilizare de bază
  • Utilizarea comercială permisă

Pornitor

$9

500 000 de caractere/luna

  • Toate modelele de 20+ de surse deschise
  • Clonarea vocală
  • Acces API

Pro

$29

2.000.000 de caractere/luna

  • Prelucrarea prioritară a GPU
  • Toate modelele premium
  • Sprijin pentru întreprinderi
Vizualizare preţuri complete

Întrebări frecvente

Întrebări comune cu privire la textul sursă deschisă la discurs

Da. Fiecare model de pe TTS.ai folosește o licență permisivă de open-source — fie MIT sau Apache 2.0. Excludem modelele cu licențe restrictive (cum ar fi CPML Coqui sau CC-BY-NC necomerciale). Puteți verifica licența fiecărui model pe depozitul GitHub.

Ambele sunt permisive licențe de open-source care permit utilizarea comercială, modificarea și redistribuirea. Apache 2.0 adaugă subvenții de brevet explicite și necesită indicarea modificărilor dacă modificați codul. MIT este mai simplu cu mai puține cerințe. Ambele sunt favorabile pentru afaceri.

Da. Fiecare model poate fi auto-hosted. Clonează depozitul modelului de la GitHub, instalează dependențe, descărcă greutatea modelului și execută inferență. Noi furnizează documentație pentru cerințele de auto-hosting ale fiecărui model, inclusiv GPU, RAM și versiunea Python.

Cerințe variază după model. Piper are nevoie de GPU (numai CPU). Kokoro și MeloTTS au nevoie de 1-2GB VRAM. Cele mai multe modele standard au nevoie de 4GB VRAM. Tortoise și Sesame CSM are nevoie de 8GB. O NVIDIA RTX 3060 (12GB) poate rula majoritatea modelelor confortabil.

Da. Licențe de sursă deschisă permit modificarea incluzând afinarea. Modelele cum ar fi GPT-SoVITS și Bark furnizează scripturi de afinare. Puteți forma modele pe propriile date vocale pentru a crea voci personalizate sau pentru a îmbunătăți performanța pentru anumite limbi.

Top open-source models (Kokoro, StyleTTS 2, Chatterbox) acum se potrivesc sau depășesc servicii comerciale cum ar fi ElevenLabs și Google TTS în puncte de referință de calitate. Principalul avantaj al serviciilor comerciale este administrat infrastructură și suport, nu calitate audio.

Deja le-am exclus. XTTS/XTTS-v2 (CPML Coqui — necomercial), F5-TTS (CC-BY-NC — necomercial) și Higgs-v2 (Licența Boson — restrictivă) au fost toate eliminate. Fiecare model de la TTS.ai este verificat siguranță de utilizare comercială.

Da. Cele mai multe modele acceptă contribuții comunitare prin GitHub. Puteți trimite rapoarte de bug, înregistrări vocale pentru noi limbi, îmbunătățiri de cod și documentație. Verificați depozitul GitHub de fiecare model pentru liniile directoare de contribuție și probleme active.

Încarcă modele la cerere și descarcă atunci când inactiv pentru a împărtăși memoria GPU. serverul nostru GPU execută 20+ modele pe 4x Tesla P40 (96GB total VRAM) folosind încărcare dinamică. Pentru auto-găzduire, un singur GPU 24GB poate servi 3-5 modele în consecință.

Multe modele furnizează imagini oficiale de docker sau dockerfiles. Pentru a rula mai multe modele, puteți construi o configurare personalizată de docker cu NVIDIA Container Toolkit pentru accesul GPU. Arhitectura serverului API poate servi ca o implementare de referință.

Cele mai multe modele necesită Python 3.10-3.12. Coqui TTS (VITS) are nevoie în mod specific de Python 3.11. Vă recomandăm Python 3.12 pentru majoritatea modelelor. Verificați cerințele fiecărui model.txt pentru compatibilitatea exactă a versiunii.

Da. licențe MIT și Apache 2.0 permit utilizarea comercială explicit. Puteți construi produse SaaS, aplicații mobile, jocuri și servicii folosind aceste modele fără taxe de licență, redevențe sau cerințe de atribuire (deși atribuția este apreciată).
5.0/5 (1)

Feedback-ul vostru ne ajută să rezolvăm problemele.

Încearcă să deschizi sursa TTS astăzi

20+ de modele de surse deschise, toate licențiate comercial. Utilizați API-ul nostru sau auto-gazdă — alegerea este a ta.