Lëscht vun den Asteroiden Text- op- Sprooch
33+ Open-Source-Modeller, 273+ Stimmen, 33+ Sproochen. Keen Kont erfuerderlech.
Alles wat Dir wësse musst
30+ Tools baséiert op Open-Source AI Modeller
33+ Lëscht vu Sproochen
Déi gréisst Sammlung vun Open-Source TTS-Modeller op enger Plattform
Kokoro Free
Kokoro ass en Text-zu-Sprooch-Modell mat 82 Milliounen Parameteren, deen iwwer seng Gewiichtsklass erauskënnt. Trotz senger klenger Gréisst produzéiert et bemierkenswäert natierlech a expressiv Sprooch. Kokoro ënnerstëtzt verschidde Sproochen, dorënner Englesch, Japanesch, Chinesesch a Koreanesch mat enger Vielfalt expressiver Stimmen. Et leeft onheemlech séier - et generéiert Audio bal 100x méi séier wéi Echtzäit op enger GPU.
Bescht fir: High-Quality TTS mat minimaler Latenz, Streaming-Applikatiounen
Gratis probéieren
Piper Free
Piper ass eng liicht Text-zu-Sprooch-Engine, déi vu Rhasspy entwéckelt gouf an déi VITS an larynx Architekturen benotzt. Si leeft komplett op CPU, wat se ideal fir Edge-Geräter, Home Automation an Applikatiounen mécht, déi offline TTS erfuerderen. Mat méi wéi 100 Stimmen a méi wéi 30 Sproochen, liwwert Piper natierlech klingend Sprooch mat Echtzäitgeschwindegkeet och op engem Raspberry Pi 4.
Bescht fir: Schnell Virschauen, Accessibilitéit, an abegraff Applikatiounen
Gratis probéieren
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) ass eng parallel End-to-End TTS-Methode, déi méi natierlech klengen Audio generéiert wéi aktuell zweestufig Modeller. Et hëlt variational Inference mat normaliséierende Flëssegkeeten an engem adversarialen Trainingsprozess un, wat eng bedeitend Verbesserung an der Natierlechkeet erzielt.
Bescht fir: General Purpose Text-to-Speech mat natürlicher Prosodie
Gratis probéieren
MeloTTS Free
MeloTTS by MyShell. ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at almost real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Bescht fir: Produktiounsapplikatiounen déi séier, méisproocheg TTS brauchen
Gratis probéieren
Kani TTS 2 Free
De Kani-TTS-2 vum NineNineSix ass e liichte 400M Parameter Modell, deen op LiquidAI LFM2 Backbone mat Nvidia NanoCodec baséiert. Et leeft op nëmmen 3GB VRAM an erzielt 10 Sekonnen Sprooch an ~2 Sekonnen (RTF 0.2).
Bescht fir: Schnell Generéierung, Ressource-ënnerstëtzend Ëmfeld, séier Virschauen
Gratis probéieren
OuteTTS Free
OuteTTS erweidert grouss Sproochmodeller mat Text-zu-Sprooch Fäegkeeten, während d'Original Architektur behalen gëtt. Et ënnerstëtzt verschidde Backends, dorënner llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, an och Browser Inferenz via Transformers.js. Features zero-shot Stëmm Klonen duerch Sprecherprofiler als JSON gespäichert.
Bescht fir: Lëscht vun de lëtzebuergesche Schrëftsteller, Literaturkritiker, Auteuren
Gratis probéieren
Pocket TTS Free
Pocket TTS vum Kyutai (Moshi-Schrëftsteller) ass e kompakte 100M Parameter Text-zu-Sprooch-Modell, deen iwwer säi Gewiicht erauskënnt. Et leeft effizient op der CPU, ënnerstëtzt Zero-Shot-Stëmmklonen aus engem eenzegen Audiosample, a produzéiert eng natierlech klengen Sprooch. D'Kleiner Modellgréisst mécht et ideal fir Edge-Deployment an Ëmfeld mat wéinege Ressourcen.
Bescht fir: D'Sprooch ass eng einfach, einfach ze verstoen, einfach ze léieren, einfach ze léieren.
Gratis probéieren
Kitten TTS Free
Kitten TTS by KittenML ass en ultraleichtes Text-zu-Sprooch-Modell, dat op ONNX baséiert ass. Mat Varianten vu 15M bis 80M Parameteren (25-80 MB op der Festplatte) bitt et eng héichwäerteg Sproochsynthese op der CPU ouni eng GPU ze brauchen. Et bitt 8 integréiert Stimmen, eng upassbar Sproochgeschwindegkeet an eng integréiert Textvirveraarbechtung fir Zuelen, Währungen an Eenheeten. Ideal fir Edge-Deployment an Applikatiounen mat niddrege Latenz.
Bescht fir: Schnell, liicht TTS, Edge-Deployment, Low-Latency-Applikatiounen
Gratis probéieren
Ming-Omni TTS Free
Ming-omni-tts-0.5B vun inclusionAI ass e kompakten omni-modalen Sproochmodell, deen op dem BailingMM-Backbone mat engem Patch-by-Patch-Flow-Matching-Audio-Decoder gebaut gouf. Et bitt 44.1kHz Ausgang (nëmmen CD-Qualitéit), ënnerstëtzt Zero-Shot-Stëmmklonen aus enger 3+ Sekonnen Referenz, an enthält eng integréiert Emotioun / Dialekt / BGM Kontroll iwwer JSON Instruktiounen. Exzellent Stabilitéit - 0.83% WER op chinesesche Benchmarks.
Bescht fir: D'Biographie vum Jean-Claude Schmit op der Websäit vun der Lëtzebuerger Sprooch
Gratis probéieren
MOSS-TTS Nano Free
MOSS-TTS-Nano-100M ass d'OpenMOSS-kompakt 100M-Parameter-Variante vun der MOSS-TTS-Famill, déi d'Delay-Transformer-Architektur deelt. Et ersetzt d'Top-Qualitéit vum 8B-Modell fir ~80x manner Gewiicht an e dramatisch nidderegen VRAM pro Ufro, wat et fir Free-Tier an High-Durchsatz-Deploymenter gëeegent mécht.
Bescht fir: D'Grupp ass eng vun de gréisste Produzenten, Verkeefer a Konsumenten vu Mikrochips.
Gratis probéieren
Bark Standard
D'Architektur vum Gebai ass eng Kombination aus moderner Architektur, traditioneller Architektur a moderner Musek.
Entwéckler: Suno · Lizenz: MIT
Probéieren
Bark Small Standard
D'Gréisst vun der Uewerfläch ass méi kleng wéi déi vun der Uewerfläch vun der Äerd.
Entwéckler: Suno · Lizenz: MIT
Probéieren
CosyVoice 2 Standard
D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.
Entwéckler: Alibaba (Tongyi Lab) · Lizenz: Apache 2.0
Probéieren
Dia TTS Standard
Et gëtt verschidden Aarte vu Gespréichstechniken, déi an der Kommunikatioun benotzt ginn.
Entwéckler: Nari Labs · Lizenz: Apache 2.0
Probéieren
Parler TTS Standard
D'Lëtzebuerger Sprooch ass déi offiziell Sprooch an d'Lëtzebuergescht ass déi offiziell Sprooch am Land.
Entwéckler: Hugging Face · Lizenz: Apache 2.0
Probéieren
IndexTTS-2 Standard
D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.
Entwéckler: Index Team · Lizenz: Bilibili Model License
Probéieren
Spark TTS Standard
D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.
Entwéckler: SparkAudio · Lizenz: CC BY-NC-SA 4.0
Probéieren
GPT-SoVITS Standard
D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.
Entwéckler: RVC-Boss · Lizenz: MIT
Probéieren
Orpheus Standard
D'Zuel vun den Asteroiden am Stärebild ass ongeféier 100.000.
Entwéckler: Canopy Labs · Lizenz: Llama 3.2 Community
Probéieren
Qwen3 TTS Standard
D'Sprooch huet eng grouss Varietéit u Sproochen, Dialekter a Sproochegruppen.
Entwéckler: Alibaba (Qwen) · Lizenz: Apache 2.0
Probéieren
VieNeu-TTS-v2 Standard
Vietnamesch + Englesch Code-Switching TTS mat 7 virprogramméiert Stimmen an Zero-Shot Stëmm Klonen. CPU-only, keng GPU erfuerderlech.
Entwéckler: Phạm Nguyễn Ngọc Bảo · Lizenz: Apache 2.0
Probéieren
Chatterbox Turbo Standard
D'Spill huet eng 200 Säiten a besteet aus 1200 verschiddene Figuren, déi sech ënnerschiddlech beweegen, lafen, fléien, fléien, fléien, fléien, fléien.
Entwéckler: Resemble AI · Lizenz: MIT
Probéieren
VoxCPM Standard
Den CR344 ass e Chemin repris am Kanton Réiden an der Gemeng Réiden.
Entwéckler: OpenBMB · Lizenz: Apache 2.0
Probéieren
VibeVoice Standard
Et gëtt eng grouss Varietéit vun Audio- a Videoformater.
Entwéckler: Microsoft · Lizenz: MIT
Probéieren
CosyVoice3 Standard
D'Sprooch ass eng multilingual, mat enger grousser Varietéit vu Sproochen, déi och an der Sproochegrupp vun de Semi-Originaler falen.
Entwéckler: Alibaba (FunAudioLLM) · Lizenz: Apache 2.0
Probéieren
NAMAA Saudi TTS Standard
D'Sprooch ass eng vun de gréisste Sproochen an der Welt, mat enger ongeféier 100 Milliounen Awunner.
Entwéckler: NAMAA Space · Lizenz: MIT
Probéieren
Darwin TTS Standard
D'Spill ass eng Versioun vum 3D-Spill-System 3D World, dat 1997 vum 3D Realms erauskoum.
Entwéckler: FINAL-Bench · Lizenz: Apache 2.0
Probéieren
MOSS-TTSD Standard
D'Serie besteet aus 10 Episoden, déi all ronn 50 Minutte gedréint ginn, an déi all ronn 15 Minutte verännert ginn.
Entwéckler: OpenMOSS · Lizenz: Apache 2.0
Probéieren
CosyVoice 2
D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.
Sproochen: en, zh, ja, ko, fr, de, it, es
Stëmm klonen
IndexTTS-2
D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.
Sproochen: en, zh
Stëmm klonen
Spark TTS
D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.
Sproochen: en, zh
Stëmm klonen
GPT-SoVITS
D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.
Sproochen: en, zh, ja, ko
Stëmm klonen
Chatterbox
D'Klassifikatioun vun de Stären no hirer visueller Magnitude gëtt duerch d'Spektralklass ausgedréckt.
Sproochen: en
Stëmm klonen
Tortoise TTS
Et gëtt verschidden Aarte vun Architektur a verschidden Aarte vun Architekten.
Sproochen: en
Stëmm klonen
OpenVoice
D'Klassifikatioun vun de Stären ënnerscheet sech no der Gréisst, der Form an dem Stil.
Sproochen: en, zh, ja, ko, fr, es
Stëmm klonen
VieNeu-TTS-v2
Vietnamesch + Englesch Code-Switching TTS mat 7 virprogramméiert Stimmen an Zero-Shot Stëmm Klonen. CPU-only, keng GPU erfuerderlech.
Sproochen: vi, en
Stëmm klonen
Chatterbox Turbo
D'Spill huet eng 200 Säiten a besteet aus 1200 verschiddene Figuren, déi sech ënnerschiddlech beweegen, lafen, fléien, fléien, fléien, fléien, fléien.
Sproochen: en
Stëmm klonen
VoxCPM
Den CR344 ass e Chemin repris am Kanton Réiden an der Gemeng Réiden.
Sproochen: en, zh
Stëmm klonen
Pocket TTS
De 100 mm-Parametermodell vum Kyūtai gouf mat enger Stëmmklonéierung aus engem eenzege Sample entwéckelt.
Sproochen: en, fr
Stëmm klonen
CosyVoice3
D'Sprooch ass eng multilingual, mat enger grousser Varietéit vu Sproochen, déi och an der Sproochegrupp vun de Semi-Originaler falen.
Sproochen: en, zh, ja, ko, de, es, fr, it, ru
Stëmm klonen
NAMAA Saudi TTS
D'Sprooch ass eng vun de gréisste Sproochen an der Welt, mat enger ongeféier 100 Milliounen Awunner.
Sproochen: ar
Stëmm klonen
Darwin TTS
D'Spill ass eng Versioun vum 3D-Spill-System 3D World, dat 1997 vum 3D Realms erauskoum.
Sproochen: en, ko, ja, zh
Stëmm klonen
MOSS-TTSD
D'Serie besteet aus 10 Episoden, déi all ronn 50 Minutte gedréint ginn, an déi all ronn 15 Minutte verännert ginn.
Sproochen: en, zh
Stëmm klonen
Ming-Omni TTS
Den NGC 5445 ass eng bal kugelfërmeg Galaxiëkéip mat enger visueller Magnitude vu +4,4 mag.
Sproochen: en, zh
Stëmm klonen
MOSS-TTS Nano
Den NGC 180 ass eng ronn 100 Liichtjoer grouss Kugelstärekëscht, déi ronn 80 Liichtjoer vun eis ewech ass.
Sproochen: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Stëmm klonenEntwéckler-first API
OpenAI-kompatibel REST API. Een Endpunkt, 22+ Modeller. Streaming-Unterstützung fir Echtzäit-Applikatiounen.
- OpenAI-kompatibelt Format
- Streaming TTS fir Echtzäit-Apps
- Batchveraarbechtung fir grouss Aufgaben
- Webhook Benachrichtigungen
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Lëscht vu lëtzebuergesche Präisser
D'Gréisst vun de Stären ännert sech mat der Distanz.
Fräi
15.000 Zeichen + 5.000/dag
- 7 Säiten, déi vum Kokoro
- 5000 Zeilen pro Generatioun
- API-Access inklusiv
Starter
500 Punkten/Mount
- All 22+ Modeller
- 100.000 Zeilen pro Generatioun
- Stëmmklonung
Pro
2.000 Punkten/Mount
- Alles am Starter
- API-Zugang
- Prioritéitsveraarbechtung
Geschäftlech
10.000.000 Zeichen/Mount
- D'Lëtzebuerger Land
- Bulk-API
- Prioritéitslëscht
Häufig gestallte Froen
Wat kéinte mir verbesseren? Äert Feedback hëlleft eis, Problemer ze léisen.
Den Haaptuert ass Aix-en-Provence.
Join Creatoren, Entwéckler, a Geschäfter mat TTS.ai