Fri AI Tekst til tale
31+ open source-modeller 231+ stemmer 34+ sprog. Ingen konto påkrævet.
Alt hvad du behøver til stemme AI
30+ værktøjer drevet af open source AI-modeller
31+ AI-stemmemodeller
Den mest omfattende samling af open source TTS-modeller i én platform
Kokoro Fri
Kokoro er en 82 millioner parameter tekst-til-tale model, der punches langt over sin vægtklasse. På trods af sin lille størrelse, det producerer bemærkelsesværdigt naturlig og udtryksfuld tale. Kokoro understøtter flere sprog, herunder engelsk, japansk, kinesisk og koreansk med en række udtryksfulde stemmer. Det kører utrolig hurtigt ~ genererer lyd næsten 100x hurtigere end realtid på en GPU.
Bedst til: Høj kvalitet TTS med minimal latenstid, streaming applikationer
Prøv gratis
Piper Fri
Piper er en letvægts tekst-til-tale motor udviklet af Rhasspy, der bruger VITS og larynx arkitekturer. Det kører udelukkende på CPU, hvilket gør den ideel til kant enheder, hjem automatisering, og applikationer, der kræver offline TTS. Med over 100 stemmer på tværs af 30 + sprog, Piper leverer naturlig klingende tale ved real-time hastigheder selv på en Raspberry Pi 4.
Bedst til: Hurtige forhåndsvisninger, tilgængelighed og indlejrede applikationer
Prøv gratis
VITS Fri
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) er en parallel end-to-end TTS metode, der genererer mere naturlig klingende lyd end nuværende to-trins modeller. Det vedtager variational inferens augmented med normaliserende flows og en adversarial uddannelsesproces, at opnå en betydelig forbedring i naturlighed.
Bedst til: Generelle formål tekst-til-tale med naturlig prosody
Prøv gratis
MeloTTS Fri
MeloTTS af MyShell.ai er et flersproget TTS-bibliotek, der understøtter engelsk (amerikansk, britisk, indisk, australsk), spansk, fransk, kinesisk, japansk og koreansk. Det er ekstremt hurtigt, behandling tekst på nær real-time hastighed på CPU alene. MeloTTS er designet til produktion brug og understøtter både CPU og GPU inferens.
Bedst til: Produktionsapplikationer, der kræver hurtige, flersprogede TTS
Prøv gratis
OuteTTS Fri
OutetTS udvider store sprogmodeller med tekst-til-tale kapaciteter samtidig bevare den oprindelige arkitektur. Det understøtter flere backends, herunder lama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, og endda browser inferens via Transformers.js. Funktioner nul-shot stemme kloning gennem højttalerprofiler gemt som JSON.
Bedst til: Kant implementering, browser-baserede TTS, lav-ressource miljøer
Prøv gratis
Pocket TTS Fri
Pocket TTS af Kyutai (skabere af Moshi) er en kompakt 100M parameter tekst-til-tale model, der punch langt over sin vægt. Det kører effektivt på CPU, understøtter nul-shot stemme kloning fra en enkelt lydprøve, og producerer naturlig klingende tale. Den lille model størrelse gør den ideel til kant implementering og lav-ressource miljøer.
Bedst til: Letvægts implementering, CPU-beskyttede miljøer, hurtig stemmekloning
Prøv gratis
Kitten TTS Fri
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Bedst til: Fast lightweight TTS, edge deployment, low-latency applications
Prøv gratis
Bark Standard
Transformer-baseret tekst-til-audio model, der genererer realistisk tale, musik og lydeffekter.
Udvikler: Suno · Licens: MIT
Prøv det.
Bark Small Standard
Lettere version af Bark med hurtigere inferens og lavere hukommelsesforbrug.
Udvikler: Suno · Licens: MIT
Prøv det.
CosyVoice 2 Standard
Alibaba skalerbar streaming TTS med menneskelig-paritet naturlighed og nær-nul latency.
Udvikler: Alibaba (Tongyi Lab) · Licens: Apache 2.0
Prøv det.
Dia TTS Standard
Multi-højttaler dialog generation model, der skaber naturlige samtaler mellem højttalere.
Udvikler: Nari Labs · Licens: Apache 2.0
Prøv det.
Parler TTS Standard
Beskriv den stemme, du ønsker i naturligt sprog og Parler genererer matchende tale.
Udvikler: Hugging Face · Licens: Apache 2.0
Prøv det.
GLM-TTS Standard
Opnår den laveste karakterfejlrate blandt open source TTS-modeller.
Udvikler: Zhipu AI · Licens: GLM-4 License
Prøv det.
IndexTTS-2 Standard
Zero-shot TTS med finkornet følelsesmæssig kontrol og høj ekspressivitet.
Udvikler: Index Team · Licens: Bilibili Model License
Prøv det.
Spark TTS Standard
Stemmekloning TTS med styrbar følelse og talestil via prompter.
Udvikler: SparkAudio · Licens: CC BY-NC-SA 4.0
Prøv det.
GPT-SoVITS Standard
Få-shot stemme kloning TTS, der replikerer enhver stemme fra kun 5 sekunder af lyd.
Udvikler: RVC-Boss · Licens: MIT
Prøv det.
Orpheus Standard
Human-level emotionel TTS model trænet på 100K timers taledata.
Udvikler: Canopy Labs · Licens: Llama 3.2 Community
Prøv det.
Qwen3 TTS Standard
Alibabas flersprogede TTS med stemmekloning, forudindstillede stemmer og stemmedesign fra tekst.
Udvikler: Alibaba (Qwen) · Licens: Apache 2.0
Prøv det.
Chatterbox Turbo Standard
Hurtigere Chatterbox med sub-200ms latency og paralsprog tags til grin, hoste og meget mere.
Udvikler: Resemble AI · Licens: MIT
Prøv det.
Dia 2 Standard
Streaming-første samtale TTS med multi-højttaler dialog og paralsprog stikord.
Udvikler: Nari Labs · Licens: Apache 2.0
Prøv det.
VoxCPM Standard
Tokenizer-fri TTS producerer 44,1kHz lyd med kontekst-aware afsnit konsistens.
Udvikler: OpenBMB · Licens: Apache 2.0
Prøv det.
TADA Standard
Nul-hallucination TTS med tekst-akustisk dobbelt justering, 5x hurtigere end sammenlignelige LLM TTS.
Udvikler: Hume AI · Licens: MIT
Prøv det.
VibeVoice Standard
Microsoft model til lang-form multi-højttaler indhold som podcasts og lydbøger.
Udvikler: Microsoft · Licens: MIT
Prøv det.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Udvikler: Alibaba (FunAudioLLM) · Licens: Apache 2.0
Prøv det.
CosyVoice 2
Alibaba skalerbar streaming TTS med menneskelig-paritet naturlighed og nær-nul latency.
Sprog: en, zh, ja, ko, fr, de, it, es
Klonstemme
GLM-TTS
Opnår den laveste karakterfejlrate blandt open source TTS-modeller.
Sprog: en, zh
Klonstemme
IndexTTS-2
Zero-shot TTS med finkornet følelsesmæssig kontrol og høj ekspressivitet.
Sprog: en, zh
Klonstemme
GPT-SoVITS
Få-shot stemme kloning TTS, der replikerer enhver stemme fra kun 5 sekunder af lyd.
Sprog: en, zh, ja, ko
Klonstemme
Chatterbox
Den nyeste nul-shot stemmekloning med følelsesmæssig kontrol fra Resemble AI.
Sprog: en
Klonstemme
Tortoise TTS
Multi-stemme tekst-til-tale fokuseret på kvalitet med autoregressiv arkitektur.
Sprog: en
Klonstemme
OpenVoice
Øjeblikkelig stemmekloning med granuleret kontrol over stil, følelser og accent.
Sprog: en, zh, ja, ko, fr, de, es, it
Klonstemme
Qwen3 TTS
Alibabas flersprogede TTS med stemmekloning, forudindstillede stemmer og stemmedesign fra tekst.
Sprog: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonstemme
Chatterbox Turbo
Hurtigere Chatterbox med sub-200ms latency og paralsprog tags til grin, hoste og meget mere.
Sprog: en
Klonstemme
VoxCPM
Tokenizer-fri TTS producerer 44,1kHz lyd med kontekst-aware afsnit konsistens.
Sprog: en, zh
Klonstemme
OuteTTS
LLM-baserede TTS, der kører på CPU, GPU, eller browser via lama.cpp og Transformers.js.
Sprog: en
Klonstemme
Pocket TTS
Letvægts 100M parametermodel af Kyutai med stemmekloning fra en enkelt prøve.
Sprog: en, fr
Klonstemme
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Sprog: en, zh, ja, ko, de, es, fr, it, ru
Klonstemme
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Sprog: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klonstemme
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Sprog: en, zh
KlonstemmeUdvikler- første API
OpenAI-kompatibel REST API. Et endpoint, 22 + modeller. Streaming støtte til real-time applikationer.
- OpenAI- kompatibelt format
- Streaming af TTS til real-time apps
- Batchforarbejdning til store job
- Webhook- meddelelserName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel, gennemsigtig prissætning
Start gratis. Skalér som du vokser.
Fri
15 kreditter
- Kokoro, Piper, VITS, MeloTTS
- 500 tegngrænse
- 3 gen/time (ingen konto)
Starter
500 kreditter/måned
- Alle 22+ modeller
- 100.000 tegn pr. generation
- Stemmekløvning
Pro
2.000 kreditter/måned
- Alt i starten
- API- adgang
- Prioriteret behandling
Ofte stillede spørgsmål
Hvad kan vi forbedre? Din feedback hjælper os med at løse problemer.
Begynd at bruge AI stemme i dag
Deltag skabere, udviklere og virksomheder ved hjælp af TTS.ai