Bug / Feature Request mellen

Open Source Text-to-Speech Modeller

All TTS-Modell op eiser Plattform ass Open Source mat kommerziell frëndleche Lizenzen. MIT, Apache 2.0 — keng proprietär Lock-in, keng Benotzungsbeschränkungen, keng iwwerraschend Lizenzgebühren. Benotzt se duerch eis gehostete API, oder hosten se selwer op Ärer eegener Infrastruktur mat voller Kontroll.

Open Source MIT-Lizenz Apache Self-Hostable GitHub

Volle TTS-Editor API-Dokumente

Probéiert et elo aus

Text
Dateien

0/500

Free mat Kokoro, Piper, VITS, MeloTTS

Äert generéiert Audio wäert hei erscheinen

Vollstännege TTS-Editor opmaachen

Lëscht vun de lëtzebuergesche Gemengen

Firwat Open-Source-Modeller fir Är Projeten wichteg sinn

Open-Source-Lizenz

All Modell op TTS.ai benotzt eng permissiv Open-Source Lizenz. Keng proprietär schwarz Boxen, keng Verkeefer Lock-in, keng onerwaart Lizenzgebühren.

MIT / Apache 2.0

D'Modeller sinn ënner MIT oder Apache 2.0 lizenzéiert, d'permissivsten Open-Source-Lizenzen. Kommerziell benotze, änneren, weiderverdeelen - keng Restriktiounen.

Self-Hostable

All Modell erofzelueden an op Ärer eegene Hardware lafen ze loossen. Volle Kontroll iwwer Är Donnéeën, Latenz an Infrastruktur. Keng Wollekabhängegkeet erfuerderlech.

GPU-optiméiert

Modeller si fir NVIDIA Grafikprozessoren mat CUDA-Unterstützung optiméiert. Piper leeft nëmmen op CPU. Déi meescht Modeller brauchen 2-8GB VRAM fir effizient Inferenzen.

Communautéit

Aktiv Open-Source Communautéiten ënnerhalen an verbesseren dës Modeller. Beiträg sinn wëllkomm — schéckt Bugs, Verbesserungen a nei Stimmen op GitHub.

Kommerziell Benotzung OK

All Modeller erlaben eng kommerziell Benotzung ënner hirer Lizenz. Baue Produkter, verkafen Servicer, a kreéieren kommerziell Inhalter ouni Lizenzgebühren oder Benotzungsgebühren.

Portal Astronomie Lëscht vun den Asteroiden

All Modell, seng Lizenz, wat et am Beschten mécht

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Bescht fir: Den Apache 2.0 - best quality free model, 82M params, einfach fir sech selwer ze hosten

Versuchen Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Bescht fir: D'Gréisst vun der Uewerfläch vun der Äerd ass ideal fir d'Entwécklung vun engem Planéit.

Versuchen Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Bescht fir: D'Architektur vun der Uertschaft baséiert op verschiddene Stiler.

Versuchen VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Bescht fir: Lëscht vu lëtzebuergesche Komponisten Lëscht vu lëtzebuergesche Komponisten

Versuchen Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Stëmmklonung

Bescht fir: Mee 2000, war e lëtzebuergesche Moler a Grafiker.

Versuchen Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Stëmmklonung

Bescht fir: Lëscht vu lëtzebuergesche Schrëftsteller Lëscht vu lëtzebuergesche Literaturkritiker

Versuchen OpenVoice

Lëscht vun de lëtzebuergesche Gemengen

Benotzt eis gehostete API oder féiert Modeller selwer aus

Open-Source-Modeller entdecken

Bléck op eise Katalog mat méi wéi 20 Open-Source TTS-Modeller. All Modellsäit weist d'Lizenz, d'Architektur, d'Fäegkeeten an d'Self-Hosting-Ufuerderungen.

Probéiert et an Ärem Browser

Testt all Modell direkt op TTS.ai ouni eppes ze installéieren. Eis GPU-Server këmmeren sech ëm d'Veraarbechtung, sou datt Dir d'Qualitéit evaluéiere kënnt, ier Dir Iech selwer hoste kënnt.

D'Applikatioun ass gratis an open-source.

Klonen Modell Repositories vun GitHub a lafen lokal, oder benotzen eis gehost API fir d'Produktioun. Self-hosting gëtt voll Kontroll; eis API bitt verwaltete Infrastruktur.

Är Applikatioun bauen

Integratioun vun TTS an Ärem Produkt mat self-hosted Modeller oder eiser REST API. All Modeller sinn kommerziell benotzt ouni Lizenzgebühren oder Lizenzgebühren.

Lizenzverglach

All Modeller vun der TTS.ai benotzen kommerziell-frëndlech Open-Source-Lizenzen.

Modell	Lizenz	Attributioun
Kokoro	Apache 2.0	Erfuerderlech
Piper	MIT	Optional
VITS	MIT	Optional
MeloTTS	MIT	Optional
Chatterbox	MIT	Optional
Tortoise TTS	Apache 2.0	Erfuerderlech
StyleTTS 2	MIT	Optional
OpenVoice	MIT	Optional
Sesame CSM	Apache 2.0	Erfuerderlech
Orpheus	Llama 3.2	"Built with Llama"

Dës Modeller gratis ausprobéieren

Lëscht vu lëtzebuergesche Schrëftsteller

Modeller selwer ausféieren oder eis d'Infrastruktur verwalten loossen

Den Haaptuert ass Hardicourt.

All Modell op TTS.ai ass als Open-Source-Projet op GitHub oder Hugging Face verfügbar. Luet d'Gewiicht erof, installéiert d'Ofhängegkeeten a féiert Inferenzen op Ären eegene Grafikprozessoren aus. Dir hutt voll Kontroll iwwer Latenz, Privatsphär a Skaléierung.

Vollstänneg Privatsphär — Audio verléisst ni Äre Server
Keng Käschte pro Ufro no der initialer Installatioun
Personaliséiert Finetuning op Ären eegene Daten
Benötigt GPU-Hardware (NVIDIA empfohlen)
Dir verwaltet Updates, Skaléierung an Ofhängegkeeten

TTS.ai gehostete API benotzen

Gitt direkt Zougang zu all 20+ Modeller duerch eng eenzeg REST API. Mir këmmeren eis ëm GPU Provisioning, Modell Updates, Queue Management an Scaling. Eng API Schlëssel gëtt Iech Zougang zu all Modell - keng Notwendegkeet fir separat Deployments ze managen.

Keng GPU-Hardware néideg
20 Säiten an 150 Biller.
Automatiséiert Modellupdates a Verbesserungen
99,9 % vun der Bevëlkerung liewen an der Stad.
Bezuele just fir dat wat Dir benotzt

Hosted API stattdessen benotzen

Lëscht vu lëtzebuergesche Schrëftsteller

Benotzt eis gehostete API, oder installéiert Kokoro lokal an e puer Minutten

Optioun 1: TTS.ai Hosted API Eelst

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Optioun 2: Self-Host mat pip Volle Kontroll

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API-Dokumentatioun

Lëscht vu lëtzebuergesche Präisser

D'Gréisst vun der Uewerfläch vun der Uewerfläch ass net bekannt.

Free-Tier

50 Säiten.

Lëscht vu lëtzebuergesche Moler
Keng Anmeldung fir einfache Gebrauch
Kommerziell Benotzung erlaabt

Starter

500 Punkten/Mount

All 20+ Open-Source-Modeller
Stëmmklonung
API-Zugang

Pro

$29

Mäerz 2000

Prioritéit GPU-Veraarbechtung
All Premium Modeller
Enterprise-Unterstützung

Komplett Präislëscht

Häufig gestallte Froen

Lëscht vu lëtzebuergesche Literaturpräisser

Ja. All Modell op TTS.ai benotzt eng permissiv Open-Source-Lizenz — entweder MIT oder Apache 2.0. Modeller mat restriktiven Lizenzen (wéi Coqui's CPML oder non-commercial CC-BY-NC) gi speziell ausgeschloss. Dir kënnt d'Lizenz vun all Modell op sengem GitHub-Repository iwwerpréiwen.

Beide sinn permissiv Open-Source-Lizenzen, déi kommerziell Benotzung, Modifikatioun a Wiederverbreedung erlaben. Apache 2.0 füügt explizit Patentgewährungen bäi an erfuerdert Ännerungen, wann Dir de Code ännert. MIT ass einfacher mat manner Ufuerderungen. Beide sinn geschäftsfrëndlech.

Ja. All Modell ka selwer gehost ginn. Klont de Modell-Repository vu GitHub, installéiert Ofhängegkeeten, lued Modell-Gewiicht erof a féiert Inferenzen aus. Mir bidden Dokumentatioun fir all Modell-self-hosting Ufuerderunge mat GPU, RAM, a Python-Versioun.

D'Bedierfnesser variéieren je no Modell. Piper brauch keng GPU (nëmme CPU). Kokoro a MeloTTS brauchen 1-2GB VRAM. Déi meescht Standardmodelle brauchen 4GB VRAM. Tortoise a Sesame CSM brauchen 8GB. Eng NVIDIA RTX 3060 (12GB) kann déi meescht Modeller komfortabel lafen.

Ja. Open-Source-Lizenzen erlaben Ännerungen, inklusiv Feineinstellungen. Modeller wéi GPT-SoVITS a Bark bidden Feineinstellungsskripten. Dir kënnt Modeller op Ären eegene Stëmmdaten trainéieren, fir eege Stimmen ze kreéieren oder d'Performance fir spezifesch Sproochen ze verbesseren.

Top Open-Source Modeller (Kokoro, StyleTTS 2, Chatterbox) entspriechen elo oder iwwertreffen kommerziell Servicer wéi ElevenLabs a Google TTS a Qualitéitsbenchmarks. Den Haaptvirdeel vun kommerzielle Servicer ass verwaltete Infrastruktur an Ënnerstëtzung, net Audioqualitéit.

XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), an Higgs-v2 (Boson License — restrictive) goufen all ewechgeholl. All Modell op TTS.ai ass verifizéiert fir kommerziell Benotzung.

Ja. Déi meescht Modeller akzeptéieren Community-Beiträg iwwer GitHub. Dir kënnt Fehlerberichter, Stëmmopnamen fir nei Sproochen, Codeverbesserungen a Dokumentatioun ubidden. Kontrolléiert d'GitHub-Repository vun all Modell fir Richtlinnen an aktiv Problemer.

Modeller on-demand laden an ofladen, wann se net gebraucht ginn, fir de GPU-Späicher ze deelen. Eise GPU-Server leeft mat méi wéi 20 Modeller op 4x Tesla P40 (96 GB VRAM am Ganzen) mat dynamesche Ladung. Fir selwer ze hosten, kann eng eenzeg 24 GB GPU 3-5 Modeller gläichzäiteg bedienen.

Vill Modeller bidden offiziell Docker-Bilder oder Docker-Dateien. Fir méi Modeller ze lafen, kënnt Dir en eegene Docker-Setup mat NVIDIA Container Toolkit fir GPU-Zugang bauen. Eis API-Server-Architektur kann als Referenzimplementatioun dienen.

Déi meescht Modeller erfuerderen Python 3.10-3.12. Coqui TTS (VITS) erfuerdert speziell Python 3.11. Mir empfeelen Python 3.12 fir déi meescht Modeller. Kontrolléiert d'Requirements.txt vun all Modell fir d'exakt Versiounskompatibilitéit.

Ja. MIT an Apache 2.0 Lizenzen erlaben explizit kommerziell Benotzung. Dir kënnt SaaS Produkter, mobil Apps, Spiller a Servicer mat dëse Modeller bauen ouni Lizenzgebühren, Lizenzgebühren oder Attributiounsfuerderungen (och wann Attributioun geschätzt gëtt).

5.0/5 (1)

Open Source TTS haut ausprobéieren

20+ Open-Source Modeller, all kommerziell lizenzéiert. Benotzt eis API oder self-host - d'Wahl ass Är.

Gratis anmelden Präislëscht

Open Source Text-to-Speech Modeller

Probéiert et elo aus

Liewe TTS.ai? Erzielt Är Frënn!

Lëscht vun de lëtzebuergesche Gemengen

Open-Source-Lizenz

MIT / Apache 2.0

Self-Hostable

GPU-optiméiert

Communautéit

Kommerziell Benotzung OK

Portal Astronomie Lëscht vun den Asteroiden

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Lëscht vun de lëtzebuergesche Gemengen

Open-Source-Modeller entdecken

Probéiert et an Ärem Browser

D'Applikatioun ass gratis an open-source.

Är Applikatioun bauen

Lizenzverglach

Lëscht vu lëtzebuergesche Schrëftsteller

Den Haaptuert ass Hardicourt.

TTS.ai gehostete API benotzen

Lëscht vu lëtzebuergesche Schrëftsteller

Lëscht vu lëtzebuergesche Präisser

Free-Tier

Starter

Pro

Häufig gestallte Froen

All d'Modeller vun TTS.ai sinn Open Source.

Wat ass den Ënnerscheed tëscht MIT an Apache 2.0 Lizenzen?

Kann ech dës Modeller op mengem eegene Server hosten?

Wat fir eng GPU brauch ech fir d'TTS-Modeller selwer ze hosten?

Kann ech d'Open-Source-TTS-Modeller feinjustéieren?

Wat sinn d'Virdeeler vun der Open Source Software am Verglach mat kommerziellen Uwendungen?

Et gi verschidde Modeller mat restriktiven Lizenzen, déi ech vermeide soll?

Kann ech zu dësen Open-Source-Modeller bäidroen?

Wéi kann ech verschidde Modeller op engem GPU-Server lafen?

Ass et e Docker-Image fir selwer ze hosten?

Wéi eng Python-Versioun brauch ech fir mech selwer ze hosten?

Kann ech mat dëse Modeller e kommerzielle Produit bauen?

Open Source TTS haut ausprobéieren