Lëscht vun den Asteroiden Text- op- Sprooch

22+ Open-Source Modeller, 100+ Stëmmen, 32+ Sproochen. Keen Kont erfuerderlech.

0/500 Zeichen Fräi
Keng Kreditkaart 50 gratis Credits 32+ Sproochen Kommerziell Benotzung OK
0:00 / 0:00
Audio erofgelueden Link expires in 24h
Wéi TTS.ai? Erzielt Är Frënn!

Lëscht vu lëtzebuergesche Moler

Déi gréisst Sammlung vun Open-Source TTS-Modeller op enger Plattform

KokoroKokoro Free

Kokoro ass en Text-zu-Sprooch-Modell mat 82 Milliounen Parameteren, deen iwwer seng Gewiichtsklass erauskënnt. Trotz senger klenger Gréisst produzéiert et bemierkenswäert natierlech a expressiv Sprooch. Kokoro ënnerstëtzt verschidde Sproochen, dorënner Englesch, Japanesch, Chinesesch a Koreanesch mat enger Vielfalt expressiver Stimmen. Et leeft onheemlech séier - et generéiert Audio bal 100x méi séier wéi Echtzäit op enger GPU.

Bescht fir: High-Quality TTS mat minimaler Latenz, Streaming-Applikatiounen

Gratis probéieren

PiperPiper Free

Piper ass eng liicht Text-zu-Sprooch-Engine, déi vu Rhasspy entwéckelt gouf an déi VITS an larynx Architekturen benotzt. Si leeft komplett op CPU, wat se ideal fir Edge-Geräter, Home Automation an Applikatiounen mécht, déi offline TTS erfuerderen. Mat méi wéi 100 Stimmen a méi wéi 30 Sproochen, liwwert Piper natierlech klingend Sprooch mat Echtzäitgeschwindegkeet och op engem Raspberry Pi 4.

Bescht fir: Schnell Virschauen, Accessibilitéit, an abegraff Applikatiounen

Gratis probéieren

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) ass eng parallel End-to-End TTS-Methode, déi méi natierlech klengen Audio generéiert wéi aktuell zweestufig Modeller. Et hëlt variational Inference mat normaliséierende Flëssegkeeten an engem adversarialen Trainingsprozess un, wat eng bedeitend Verbesserung an der Natierlechkeet erzielt.

Bescht fir: General Purpose Text-to-Speech mat natürlicher Prosodie

Gratis probéieren

MeloTTSMeloTTS Free

MeloTTS by MyShell. ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at almost real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Bescht fir: Produktiounsapplikatiounen déi séier, méisproocheg TTS brauchen

Gratis probéieren

BarkBark Standard

D'Architektur vum Gebai ass eng Kombination aus moderner Architektur, traditioneller Architektur a moderner Musek.

Entwéckler: Suno · Lizenz: MIT

Probéieren

Bark SmallBark Small Standard

D'Gréisst vun der Uewerfläch ass méi kleng wéi déi vun der Uewerfläch vun der Äerd.

Entwéckler: Suno · Lizenz: MIT

Probéieren

CosyVoice 2CosyVoice 2 Standard

D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.

Entwéckler: Alibaba (Tongyi Lab) · Lizenz: Apache 2.0

Probéieren

Dia TTSDia TTS Standard

Et gëtt verschidden Aarte vu Gespréichstechniken, déi an der Kommunikatioun benotzt ginn.

Entwéckler: Nari Labs · Lizenz: Apache 2.0

Probéieren

Parler TTSParler TTS Standard

D'Lëtzebuerger Sprooch ass déi offiziell Sprooch an d'Lëtzebuergescht ass déi offiziell Sprooch am Land.

Entwéckler: Hugging Face · Lizenz: Apache 2.0

Probéieren

IndexTTS-2IndexTTS-2 Standard

D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.

Entwéckler: Index Team · Lizenz: Apache 2.0

Probéieren

Spark TTSSpark TTS Standard

D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.

Entwéckler: SparkAudio · Lizenz: Apache 2.0

Probéieren

GPT-SoVITSGPT-SoVITS Standard

D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.

Entwéckler: RVC-Boss · Lizenz: MIT

Probéieren

OrpheusOrpheus Standard

D'Zuel vun den Asteroiden am Stärebild ass ongeféier 100.000.

Entwéckler: Canopy Labs · Lizenz: Llama 3.2 Community

Probéieren

Qwen3 TTSQwen3 TTS Standard

D'Sprooch huet eng grouss Varietéit u Sproochen, Dialekter a Sproochegruppen.

Entwéckler: Alibaba (Qwen) · Lizenz: Apache 2.0

Probéieren

ChatterboxChatterbox Premium

D'Klassifikatioun vun de Stären no hirer visueller Magnitude gëtt duerch d'Spektralklass ausgedréckt.

Qualitéit:

Probéieren

Tortoise TTSTortoise TTS Premium

Et gëtt verschidden Aarte vun Architektur a verschidden Aarte vun Architekten.

Qualitéit:

Probéieren

StyleTTS 2StyleTTS 2 Premium

D'Sproochewëssenschaft ass d'Wëssenschaft vun de Sproochen an hirer Verbreedung an Entwécklung.

Qualitéit:

Probéieren

OpenVoiceOpenVoice Premium

D'Klassifikatioun vun de Stären ënnerscheet sech no der Gréisst, der Form an dem Stil.

Qualitéit:

Probéieren

CosyVoice 2CosyVoice 2

D'Atmosphär vun der Äerd besteet haaptsächlech aus Sauerstoff a Waasserdamp.

Sproochen: en, zh, ja, ko, fr, de, it, es

Stëmm klonen

IndexTTS-2IndexTTS-2

D'Gréisst vun de Stären huet och e groussen Impakt op d'Gréisst vun der Äerd.

Sproochen: en, zh

Stëmm klonen

Spark TTSSpark TTS

D'Klassifikatioun vun de Sprooche gëtt duerch d'Sproochewëssenschaft an d'Sproochewëssenschaftler gemaach.

Sproochen: en, zh

Stëmm klonen

GPT-SoVITSGPT-SoVITS

D'Klassifikatioun vun de Stären no der Spektralklass gëtt all 500 Joer aktualiséiert.

Sproochen: en, zh, ja, ko

Stëmm klonen

ChatterboxChatterbox

D'Klassifikatioun vun de Stären no hirer visueller Magnitude gëtt duerch d'Spektralklass ausgedréckt.

Sproochen: en

Stëmm klonen

Tortoise TTSTortoise TTS

Et gëtt verschidden Aarte vun Architektur a verschidden Aarte vun Architekten.

Sproochen: en

Stëmm klonen

OpenVoiceOpenVoice

D'Klassifikatioun vun de Stären ënnerscheet sech no der Gréisst, der Form an dem Stil.

Sproochen: en, zh, ja, ko, fr, de, es, it

Stëmm klonen

Qwen3 TTSQwen3 TTS

D'Sprooch huet eng grouss Varietéit u Sproochen, Dialekter a Sproochegruppen.

Sproochen: en, zh, ja, ko, de, fr, ru, pt, es, it

Stëmm klonen

Entwéckler-first API

OpenAI-kompatibel REST API. Een Endpunkt, 22+ Modeller. Streaming-Unterstützung fir Echtzäit-Applikatiounen.

  • OpenAI-kompatibelt Format
  • Streaming TTS fir Echtzäit-Apps
  • Batchveraarbechtung fir grouss Aufgaben
  • Webhook Benachrichtigungen
API-Dokumentatioun
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Lëscht vu lëtzebuergesche Präisser

D'Gréisst vun de Stären ännert sech mat der Distanz.

Fräi

$0

50 Punkten

  • Kokoro, Piper, VITS, MeloTTS
  • 500 Zeichen Limit
  • 3 Gen/Stonn (keen Kont)
Gratis anmelden

Starter

$9/% 1 Mo

500 Punkten/Mount

  • All 22+ Modeller
  • 5.000 Zeichen Limit
  • Stëmmklonung
Starten
Déi populärst

Pro

$29/% 1 Mo

2.000 Punkten/Mount

  • Alles am Starter
  • API-Zugang
  • Prioritéitsveraarbechtung
Profi ginn

Enterprise

$99/% 1 Mo

10.000 Credits/Mount

  • D'Lëtzebuerger Land
  • Bulk-API
  • Prioritéitslëscht
Verkafskontakt

Sich all Pläng un, inklusiv Kreditpakete →

Häufig gestallte Froen

TTS.ai ass déi ëmfassendst AI-Stëmmplattform, déi méi wéi 22 Text-zu-Sprooch-Modeller, Sproochklonen, Sprooch-zu-Text an Audio-Tools ubitt. All Modeller sinn Open Source ouni Verkeefer Lock-in.

Ja! TTS.ai bitt gratis Text-to-Speech mat Kokoro, Piper, VITS, a MeloTTS Modeller. Keng Kont erfuerderlech. Registréiert Iech fir 50 gratis Credits ze kréien an Zougang zu all Modeller. Bezuelte Pläng starten bei $ 9 / Mount.

Fir Geschwindegkeet, benotzt Kokoro oder Piper. Fir Qualitéit, probéiert CosyVoice 2 oder StyleTTS 2. Fir Stëmmklonen, benotzt Chatterbox oder GPT-SoVITS. Fir Dialoge benotzt Dia TTS. Probéiert verschidde Modeller op dem selwechte Text ze vergläichen.

Ja. OpenAI-kompatibel REST API fir TTS, STT, Sproochklonen, an Audio-Tools. Verfügbar op Pro ($29/mo) an Enterprise ($99/mo) Pläng. Dokumentatioun op tts.ai/api/ kucken.

D'Stëmmqualitéit ass jee no Modell ënnerschiddlech. Premium-Modeller wéi CosyVoice 2, StyleTTS 2 a Chatterbox produzéieren eng Sprooch mat enger ähnlecher Qualitéit wéi déi vun engem Mënsch, mat enger natierlecher Intonatioun an Emotiounen. Gratis-Modeller wéi Kokoro bidden eng exzellent Qualitéit fir déi meescht Gebrauchsfäll.

TTS.ai ënnerstëtzt méi wéi 30 Sproochen a senger Modellbibliothéik. Englesch huet d'breetst Modellunterstützung, awer Modeller wéi CosyVoice 2 decken Chinesisch, Japanesch a Koreanesch; GPT-SoVITS behandelt Chinesisch, Japanesch, Koreanesch an Englesch; a MeloTTS ënnerstëtzt Englisch, Spanisch, Franséisch, Chinesisch, Japanesch a Koreanesch.

Ja. All Veraarbechtung geschitt op eise dedizéierte GPU-Serveren. Mir späicheren Är Textinput oder generéiert Audio no der Lieferung net. Héichgeladen Stëmmprouwen fir Klonen ginn nëmmen fir d'aktuell Sitzung benotzt a ginn net behalen. Mir ginn Är Donnéeën ni mat Drëtten deelen oder se fir Modeller ze trainéieren benotzen.

Ja. All Audio, deen op TTS.ai generéiert gëtt, ass fir Är kommerziell Benotzung, inklusiv fir YouTube-Videoen, Podcasts, Audiobicher, Apps, Annoncen a Produkter. Eis Modeller sinn Open Source ënner permissive Lizenzen (MIT, Apache 2.0). Keng Lizenzgebühren oder Attributioun erfuerderlech.

TTS.ai generéiert standardméisseg Audio am WAV-Format fir maximal Qualitéit. Dir kënnt an MP3, FLAC, OGG oder M4A konvertéieren mat eisem gratis Audiokonverter-Tool. D'API ënnerstëtzt d'Spezifizéierung vun Ärem bevorzugten Ausgabeformat direkt an der Ufro.

Laadt eng kuerz Audioprobe (bis zu 5 Sekonnen) vun der Stëmm erop, déi Dir klone wëllt, an da gitt en Text an, fir Sprooch an där Stëmm ze generéieren. Modeller wéi Chatterbox, GPT-SoVITS, a CosyVoice 2 ënnerstëtzen d'Sproochklonen. D'geklont Stëmm hëlt Ton, Akzent a Sproochstil op.

Gratis Modeller (Kokoro, Piper, VITS, MeloTTS) brauchen kee Kont a kaschten 0 Credits. Standard Modeller (2 Credits/1K Zeichen) enthalen Bark, CosyVoice 2, F5-TTS, a Dia. Premium Modeller (4 Credits/1K Zeichen) enthalen OpenVoice, Chatterbox, StyleTTS 2, a Tortoise. Bezuelte Modeller bidden normalerweis méi héich Qualitéit, méi Stimmen, an zousätzlech Featuren wéi Stimmklonen.

Ja. D'API ënnerstëtzt Batch-Veraarbechtung fir d'Konvertéierung vu grousse Volumen vu Text an Sprooch. Setzt vill Ufroen a kritt Resultater asynchron mat Job-UUIDen. Enterprise-Pläng ($99/mo) enthalen prioritäre Queue-Zugang fir eng séier Batch-Veraarbechtung. Ideal fir d'Produktioun vun Audiobicher, Kursinhalt a grouss Voiceover-Projeten.
5.0/5 (1)

Den Haaptuert ass Aix-en-Provence.

Join Creatoren, Entwéckler, a Geschäfter mat TTS.ai