Lëscht vun den Asteroiden Text- op- Sprooch
31+ Open-Source-Modeller, 231+ Stimmen, 34+ Sproochen. Keen Kont erfuerderlech.
Alles wat Dir wësse musst
30+ Tools baséiert op Open-Source AI Modeller
31+ Lëscht vu Sproochen
Déi gréisst Sammlung vun Open-Source TTS-Modeller op enger Plattform
Kokoro Free
Kokoro ass en Text-zu-Sprooch-Modell mat 82 Milliounen Parameteren, deen iwwer seng Gewiichtsklass erauskënnt. Trotz senger klenger Gréisst produzéiert et bemierkenswäert natierlech a expressiv Sprooch. Kokoro ënnerstëtzt verschidde Sproochen, dorënner Englesch, Japanesch, Chinesesch a Koreanesch mat enger Vielfalt expressiver Stimmen. Et leeft onheemlech séier - et generéiert Audio bal 100x méi séier wéi Echtzäit op enger GPU.
Bescht fir: High-Quality TTS mat minimaler Latenz, Streaming-Applikatiounen
Gratis probéieren
Piper Free
Piper ass eng liicht Text-zu-Sprooch-Engine, déi vu Rhasspy entwéckelt gouf an déi VITS an larynx Architekturen benotzt. Si leeft komplett op CPU, wat se ideal fir Edge-Geräter, Home Automation an Applikatiounen mécht, déi offline TTS erfuerderen. Mat méi wéi 100 Stimmen a méi wéi 30 Sproochen, liwwert Piper natierlech klingend Sprooch mat Echtzäitgeschwindegkeet och op engem Raspberry Pi 4.
Bescht fir: Schnell Virschauen, Accessibilitéit, an abegraff Applikatiounen
Gratis probéieren
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) ass eng parallel End-to-End TTS-Methode, déi méi natierlech klengen Audio generéiert wéi aktuell zweestufig Modeller. Et hëlt variational Inference mat normaliséierende Flëssegkeeten an engem adversarialen Trainingsprozess un, wat eng bedeitend Verbesserung an der Natierlechkeet erzielt.
Bescht fir: General Purpose Text-to-Speech mat natürlicher Prosodie
Gratis probéieren
MeloTTS Free
MeloTTS by MyShell. ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at almost real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Bescht fir: Produktiounsapplikatiounen déi séier, méisproocheg TTS brauchen
Gratis probéieren
OuteTTS Free
OuteTTS erweidert grouss Sproochmodeller mat Text-zu-Sprooch Fäegkeeten, während d'Original Architektur behalen gëtt. Et ënnerstëtzt verschidde Backends, dorënner llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, an och Browser Inferenz via Transformers.js. Features zero-shot Stëmm Klonen duerch Sprecherprofiler als JSON gespäichert.
Bescht fir: Lëscht vun de lëtzebuergesche Schrëftsteller, Literaturkritiker, Auteuren
Gratis probéieren
Pocket TTS Free
Pocket TTS vum Kyutai (Moshi-Schrëftsteller) ass e kompakte 100M Parameter Text-zu-Sprooch-Modell, deen iwwer säi Gewiicht erauskënnt. Et leeft effizient op der CPU, ënnerstëtzt Zero-Shot-Stëmmklonen aus engem eenzegen Audiosample, a produzéiert eng natierlech klengen Sprooch. D'Kleiner Modellgréisst mécht et ideal fir Edge-Deployment an Ëmfeld mat wéinege Ressourcen.
Bescht fir: D'Sprooch ass eng einfach, einfach ze verstoen, einfach ze léieren, einfach ze léieren.
Gratis probéieren
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Bescht fir: Fast lightweight TTS, edge deployment, low-latency applications
Gratis probéieren
Bark Standard
D'Architektur vum Gebai ass eng Kombination aus moderner Architektur, traditioneller Architektur a moderner Musek.
Entwéckler: Suno · Lizenz: MIT
Probéieren
Bark Small Standard
D'Gréisst vun der Uewerfläch ass méi kleng wéi déi vun der Uewerfläch vun der Äerd.
Entwéckler: Suno · Lizenz: MIT
Probéieren
CosyVoice 2 Standard
D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.
Entwéckler: Alibaba (Tongyi Lab) · Lizenz: Apache 2.0
Probéieren
Dia TTS Standard
Et gëtt verschidden Aarte vu Gespréichstechniken, déi an der Kommunikatioun benotzt ginn.
Entwéckler: Nari Labs · Lizenz: Apache 2.0
Probéieren
Parler TTS Standard
D'Lëtzebuerger Sprooch ass déi offiziell Sprooch an d'Lëtzebuergescht ass déi offiziell Sprooch am Land.
Entwéckler: Hugging Face · Lizenz: Apache 2.0
Probéieren
GLM-TTS Standard
Et ass déi klengst vun de 4 bekannte Stärekéip am Stärebild.
Entwéckler: Zhipu AI · Lizenz: GLM-4 License
Probéieren
IndexTTS-2 Standard
D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.
Entwéckler: Index Team · Lizenz: Bilibili Model License
Probéieren
Spark TTS Standard
D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.
Entwéckler: SparkAudio · Lizenz: CC BY-NC-SA 4.0
Probéieren
GPT-SoVITS Standard
D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.
Entwéckler: RVC-Boss · Lizenz: MIT
Probéieren
Orpheus Standard
D'Zuel vun den Asteroiden am Stärebild ass ongeféier 100.000.
Entwéckler: Canopy Labs · Lizenz: Llama 3.2 Community
Probéieren
Qwen3 TTS Standard
D'Sprooch huet eng grouss Varietéit u Sproochen, Dialekter a Sproochegruppen.
Entwéckler: Alibaba (Qwen) · Lizenz: Apache 2.0
Probéieren
Chatterbox Turbo Standard
D'Spill huet eng 200 Säiten a besteet aus 1200 verschiddene Figuren, déi sech ënnerschiddlech beweegen, lafen, fléien, fléien, fléien, fléien, fléien.
Entwéckler: Resemble AI · Lizenz: MIT
Probéieren
Dia 2 Standard
D'Sprooche vun der Grupp sinn d'Sprooche vun der Proto-Sprooch, der Proto-Sprooch an der Proto-Sprooch.
Entwéckler: Nari Labs · Lizenz: Apache 2.0
Probéieren
VoxCPM Standard
Den CR344 ass e Chemin repris am Kanton Réiden an der Gemeng Réiden.
Entwéckler: OpenBMB · Lizenz: Apache 2.0
Probéieren
TADA Standard
D'Spill ass op engem 2D-Computer-Modul baséiert, deen op engem 3D-Computer-Modul baséiert.
Entwéckler: Hume AI · Lizenz: MIT
Probéieren
VibeVoice Standard
Et gëtt eng grouss Varietéit vun Audio- a Videoformater.
Entwéckler: Microsoft · Lizenz: MIT
Probéieren
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Entwéckler: Alibaba (FunAudioLLM) · Lizenz: Apache 2.0
Probéieren
CosyVoice 2
D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.
Sproochen: en, zh, ja, ko, fr, de, it, es
Stëmm klonen
IndexTTS-2
D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.
Sproochen: en, zh
Stëmm klonen
Spark TTS
D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.
Sproochen: en, zh
Stëmm klonen
GPT-SoVITS
D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.
Sproochen: en, zh, ja, ko
Stëmm klonen
Chatterbox
D'Klassifikatioun vun de Stären no hirer visueller Magnitude gëtt duerch d'Spektralklass ausgedréckt.
Sproochen: en
Stëmm klonen
Tortoise TTS
Et gëtt verschidden Aarte vun Architektur a verschidden Aarte vun Architekten.
Sproochen: en
Stëmm klonen
OpenVoice
D'Klassifikatioun vun de Stären ënnerscheet sech no der Gréisst, der Form an dem Stil.
Sproochen: en, zh, ja, ko, fr, de, es, it
Stëmm klonen
Qwen3 TTS
D'Sprooch huet eng grouss Varietéit u Sproochen, Dialekter a Sproochegruppen.
Sproochen: en, zh, ja, ko, de, fr, ru, pt, es, it
Stëmm klonen
Chatterbox Turbo
D'Spill huet eng 200 Säiten a besteet aus 1200 verschiddene Figuren, déi sech ënnerschiddlech beweegen, lafen, fléien, fléien, fléien, fléien, fléien.
Sproochen: en
Stëmm klonen
VoxCPM
Den CR344 ass e Chemin repris am Kanton Réiden an der Gemeng Réiden.
Sproochen: en, zh
Stëmm klonen
Pocket TTS
De 100 mm-Parametermodell vum Kyūtai gouf mat enger Stëmmklonéierung aus engem eenzege Sample entwéckelt.
Sproochen: en, fr
Stëmm klonen
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Sproochen: en, zh, ja, ko, de, es, fr, it, ru
Stëmm klonen
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Sproochen: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Stëmm klonen
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Sproochen: en, zh
Stëmm klonenEntwéckler-first API
OpenAI-kompatibel REST API. Een Endpunkt, 22+ Modeller. Streaming-Unterstützung fir Echtzäit-Applikatiounen.
- OpenAI-kompatibelt Format
- Streaming TTS fir Echtzäit-Apps
- Batchveraarbechtung fir grouss Aufgaben
- Webhook Benachrichtigungen
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Lëscht vu lëtzebuergesche Präisser
D'Gréisst vun de Stären ännert sech mat der Distanz.
Fräi
50 Punkten
- Kokoro, Piper, VITS, MeloTTS
- 500 Zeichen Limit
- 3 Gen/Stonn (keen Kont)
Starter
500 Punkten/Mount
- All 22+ Modeller
- 100.000 Zeilen pro Generatioun
- Stëmmklonung
Pro
2.000 Punkten/Mount
- Alles am Starter
- API-Zugang
- Prioritéitsveraarbechtung
Geschäftlech
10.000.000 Zeichen/Mount
- D'Lëtzebuerger Land
- Bulk-API
- Prioritéitslëscht
Häufig gestallte Froen
What could we improve? Your feedback helps us fix issues.
Den Haaptuert ass Aix-en-Provence.
Join Creatoren, Entwéckler, a Geschäfter mat TTS.ai