Stëmmbibliothéik

Bléck, Virschau a vergläicht 100+ KI Stimmen iwwer 24+ Modeller. Fannt déi perfekt Stëmm fir Äert Projet.

101+ Stëmmen

101 Stimmen fonnt

--
Standard Chinese Female
Standard Chinese Male
Standard English Female
Standard English Female
Standard English Female
Standard English Female
Standard English Male
Standard English Male
Standard English Male
Standard English Male
Standard English Male
Standard English Male
Standard French Female
Standard French Male
Standard German Female
Standard German Male
Standard Hindi Male
Standard Italian Male
Standard Japanese Female
Standard Japanese Male
Standard Korean Female
Standard Korean Male
Standard Polish Male
Standard Portuguese Male
Standard Russian Male
Standard Spanish Female
Standard Spanish Male
Standard Turkish Male
Premium English Neutral
Standard Chinese Female
Standard English Female
Standard Japanese Female
Standard English Neutral
Standard English Neutral
Standard Chinese Neutral
Standard English Neutral
Fräi English Male
Fräi Portuguese Male
Fräi Spanish Male
Fräi Hindi Female
Fräi Japanese Female
Fräi English Female
Fräi Spanish Female
Fräi Portuguese Female
Fräi English Female
Fräi Japanese Female
Fräi English Female
Fräi English Male
Fräi Italian Male
Fräi English Female
Fräi Hindi Male
Fräi Italian Female
Fräi English Female
Fräi French Female
Fräi English Female
Fräi Chinese Female
Fräi Chinese Female
Fräi Chinese Female
Fräi Chinese Male
Fräi Chinese Female
Fräi English Female
Fräi French Female
Fräi Japanese Female
Fräi Korean Female
Fräi Spanish Female
Premium English Neutral
Standard English Male
Standard English Female
Standard English Female
Standard English Male
Standard English Female
Standard English Female
Standard English Male
Standard English Female
Standard English Neutral
Fräi English Male
Fräi English Female
Fräi English Female
Fräi English Female
Fräi English Male
Fräi English Male
Fräi English Male
Standard English Male
Standard English Male
Standard English Male
Standard Japanese Female
Standard English Male
Standard English Female
Standard Korean Female
Standard Chinese Male
Standard English Female
Standard English Neutral
Premium English Neutral
Premium English Neutral
Fräi English Neutral

Keng Stëmmen entspriechen Ären Filteren. Probéiert Är Sichkritären unzepassen.

Lëscht vun den Asteroiden

All TTS-Modell huet säin eegene Set vu Stëmmen mat eenzegaartege Charakteristiken. E puer Modeller ënnerstëtzen d'Stëmmklonen, wat Iech erlaabt all Stëmm als Referenz ze benotzen.

BarkBark 28 Stimmen Standard

Modell ausprobéieren

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Chinese Female 1

Chinese

Chinese Male 1

Chinese

English Female 1

English

English Female 2

English

English Female 3

English

English Female 4

English

English Male 1

English

English Male 2

English

All anzeigen 28 Bark Stimmen

ChatterboxChatterbox 1 Stimmen Premium

Modell ausprobéieren

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Default

English

CosyVoice 2CosyVoice 2 5 Stimmen Standard

Modell ausprobéieren

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Chinese Female

Chinese

Chinese Male

Chinese

English Female

English

English Male

English

Japanese Female

Japanese

Dia TTSDia TTS 2 Stimmen Standard

Modell ausprobéieren

Multi-speaker dialog generation model that creates natural conversations between speakers.

Speaker 1

English

Speaker 2

English

GPT-SoVITSGPT-SoVITS 1 Stimmen Standard

Modell ausprobéieren

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Default

Chinese

IndexTTS-2IndexTTS-2 1 Stimmen Standard

Modell ausprobéieren

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Default

English

KokoroKokoro 26 Stimmen Fräi

Modell ausprobéieren

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Adam

English

Alex

Portuguese

Alex

Spanish

Alpha

Hindi

Alpha

Japanese

Bella

English

Dora

Spanish

Dora

Portuguese

All anzeigen 26 Kokoro Stimmen

MeloTTSMeloTTS 7 Stimmen Fräi

Modell ausprobéieren

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Chinese

Chinese

English British

English

English US

English

French

French

Japanese

Japanese

Korean

Korean

Spanish

Spanish

OpenVoiceOpenVoice 1 Stimmen Premium

Modell ausprobéieren

Instant voice cloning with granular control over style, emotion, and accent.

Default

English

OrpheusOrpheus 8 Stimmen Standard

Modell ausprobéieren

Human-level emotional TTS model trained on 100K hours of speech data.

Dan

English

Jess

English

Leah

English

Leo

English

Mia

English

Tara

English

Zac

English

Zoe

English

Parler TTSParler TTS 1 Stimmen Standard

Modell ausprobéieren

Describe the voice you want in natural language and Parler generates matching speech.

Default

English

PiperPiper 7 Stimmen Fräi

Modell ausprobéieren

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Alan (UK)

English

Alba (UK)

English

Amy (US)

English

Jenny (UK)

English

Joe (US)

English

Lessac (US)

English

Ryan (US)

English

Qwen3 TTSQwen3 TTS 9 Stimmen Standard

Modell ausprobéieren

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Aiden

English

Dylan

English

Eric

English

Ono Anna

Japanese

Ryan

English

Serena

English

Sohee

Korean

Uncle Fu

Chinese

All anzeigen 9 Qwen3 TTS Stimmen

Spark TTSSpark TTS 1 Stimmen Standard

Modell ausprobéieren

Voice cloning TTS with controllable emotion and speaking style via prompts.

Default

English

StyleTTS 2StyleTTS 2 1 Stimmen Premium

Modell ausprobéieren

Human-level text-to-speech through style diffusion and adversarial training.

Default

English

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Random

English

VITSVITS 1 Stimmen Fräi

Modell ausprobéieren

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Default

English

Lëscht vu lëtzebuergeschen Dichter

Stëmmqualitätsniveauen

TTS.ai bitt Stimmen an dräi Qualitéitsniveauen un. Free-Tier Stimmen vu Piper, VITS, a MeloTTS liwweren eng séier, qualitativ héichwäerteg Synthese ouni Käschte. Standard-Tier Stimmen vu Modeller wéi Kokoro a CosyVoice 2 bidden méi natierlech Prosodie an Emotiounen. Premium-Tier Stimmen vun OpenVoice, Chatterbox, a StyleTTS 2 bidden déi realisteschst, mënschlech-ähnlech Sprooch déi an Open-Source TTS verfügbar ass.

Lëscht vu Lëtzebuerger Sproochen

Vill Stimmen ënnerstëtzen verschidde Sproochen. E puer Modeller wéi CosyVoice 2 a GPT-SoVITS ënnerstëtzen d'Synthese tëscht verschiddene Sproochen, woubäi eng Stëmm, déi an enger Sprooch trainéiert gouf, ganz normal an enger anerer Sprooch schwätzen kann. De Sproochfilter uewen erlaabt Iech Stimmen ze fannen, déi Är Zilsprooch nativ ënnerstëtzen, fir déi bescht Aussprooch an Intonatioun ze garantéieren.

Stëmmklonung

E puer Modeller ënnerstëtzen d'Stëmmklonen, dat heescht Dir kënnt all Stëmm als Referenz benotze fir Sprooch ze kreéieren déi wéi déi Persoun kléngt. Luet eng kuerz Audioprobe (10-30 Sekonnen) erop an de Modell passt sech un d'Stëmmcharakteristiken un. Modeller déi Klonen ënnerstëtzen sinn GPT-SoVITS, CosyVoice 2, a Chatterbox.

Den Haaptuert ass La Voulte.

Déi bescht Stëmm hänkt vun Ärem Gebrauchsfall of. Fir Audiobicher a Podcasten, benotzt Premium-Stëmmen mat natierlecher Prosodie. Fir Spillfiguren, erfuerscht verschidde Stimmen iwwer Modeller. Fir Accessibilitéit a Bildschiermleser, wielt kloer, gutt getaktete Stimmen. Fir séier Prototyping, free-tier Stimmen bidden direkt Resultater ouni Kredittkäschten. Kuckt Iech all Stëmm mat der Wiedergabe-Knäppchen vir, ier Dir Är Wiel maacht.

Häufig gestallte Froen

TTS.ai bitt méi wéi 100 KI-Stëmmen an 24 Text-zu-Sprooch-Modeller. Stimmen decken verschidde Sproochen, Geschlechter, Akzenter a Sproochstiler of. Nei Stimmen ginn regelméisseg bäigefüügt, wéi mir eis Modellbibliothéik erweideren.

Ja, vill Stimmen hunn Audio-Virschauen, déi Dir direkt op dëser Säit héieren kënnt. Klickt op d'Wiedergabe-Knäppchen nieft all Stëmm mat enger Virschau, fir e Beispill ze héieren. Dir kënnt och all Stëmm op der Text-zu-Sprooch-Säit mat Ärem eegene Text testen.

Benotzt d'Filterkontrollen uewen op der Säit fir Stimmen no Modell, Sprooch oder Geschlecht ze filteren. Dir kënnt Filteren kombinéieren fir genau déi Stëmm ze fannen déi Dir braucht - zum Beispill englesch weiblech Stimmen aus dem Kokoro-Modell.

Gratis Stimmen (Kokoro, Piper, VITS, MeloTTS) brauchen keng Credits. Standard Stimmen (Bark, CosyVoice 2, Dia, Fish Speech) kaschten 2 Credits pro 1K Zeichen. Premium Stimmen (Chatterbox, Tortoise) kaschten 4 Credits pro 1K Zeichen an bidden déi héchst Qualitéit.

Kokoro (free tier) gouf mat 5/5 fir seng Qualitéit bewäert an ass d'natierlechst klengend gratis Optioun. Fir Premium-Qualitéit bidden Chatterbox a Tortoise eng aussergewéinlech Natierlechkeet mat Stimmklonungsunterstützung. Héiert d'Virschauen, fir ze entscheeden, wéi eng Stëmm Iech am beschte passt.

Ja, all Stëmme kënnen kommerziell benotzt ginn. Eis Modeller benotzen Open-Source-Lizenzen (MIT, Apache 2.0). De generéierten Audio ass Ären fir a Videoen, Podcasts, Apps, Spiller an all aner kommerziell Applikatiounen ze benotzen.

Eis Sproochbibliothéik deckt méi wéi 30 Sproochen of, dorënner Englesch, Spuenesch, Franséisch, Däitsch, Italienesch, Portugisesch, Chinesesch, Japanesch, Koreanesch, Arabisch, Russesch, Hindi, Hollännesch, Polnesch, Tierkesch a vill méi.

Ja, benotzt eist Stëmm-Klon-Tool fir eng eege Stëmm aus nëmmen 5-30 Sekonnen Referenz-Audio ze kreéieren. Klonéiert Stëmmen erscheinen an Ärem Kont ënner "Meng Stëmmen" a kënne fir zukünfteg Text-zu-Sprooch-Generatiounen zréckverwandelt ginn.

Berécksiichtegt Äert Benotzungsfall: fir Audiobicher, wielt expressiv Stimmen wéi déi vu Bark oder Chatterbox. Fir Apps an IVR, wielt kloer Stimmen vu Kokoro oder MeloTTS. Fir méisproochegen Inhalt, benotzt CosyVoice 2 oder GPT-SoVITS. Virschau vun e puer Optiounen fir déi bescht Passform ze fannen.

Ja, e puer Modeller bidden Akzentvarianten un. MeloTTS bitt amerikaneschen, britesche, indischen an australeschen Engleschen Akzent. Aner Modeller hunn regional Stimmvarianten fir Spuenesch, Franséisch, Portugisesch a Chinesesch. Filtert no Sprooch fir Akzent-Optiounen ze entdecken.

Ja, all Stimmen sinn iwwer eis REST API zougänglech. Gitt d'Modell an d'Stëmm-ID an Ärer API-Ufro un, fir Sprooch mat all Stëmm programmatesch ze generéieren. Kuckt eis API Dokumentatiounssäit fir Code-Beispiller an Stëmm-ID-Referenzen.

Mir fügen regelméisseg nei Stëmmen bäi, well mir zusätzlech TTS-Modeller integréieren an d'existéierend erweideren. Verfollegt eis Updates, fir iwwer nei Stëmm-Add-Ons, Modellverbesserungen a Sproocherweiterungen informéiert ze bleiwen.

Ophuelen, verbesseren an Är Stëmm transforméieren

Benotzt de Voice Recorder mat eiser kompletter Suite vun AI Audio Tools. Klont Är Stëmm, transkribéiert Sprooch, verbessert d'Qualitéit a méi.