Fri AI Tekst til tale
20+ open source-modeller 107+ stemmer 32+ sprog. Ingen konto påkrævet.
Alt hvad du behøver til stemme AI
30+ værktøjer drevet af open source AI-modeller
20+ AI-stemmemodeller
Den mest omfattende samling af open source TTS-modeller i én platform
Kokoro Free
Kokoro er en 82 millioner parameter tekst-til-tale model, der punches langt over sin vægtklasse. På trods af sin lille størrelse, det producerer bemærkelsesværdigt naturlig og udtryksfuld tale. Kokoro understøtter flere sprog, herunder engelsk, japansk, kinesisk og koreansk med en række udtryksfulde stemmer. Det kører utrolig hurtigt ~ genererer lyd næsten 100x hurtigere end realtid på en GPU.
Bedst til: Høj kvalitet TTS med minimal latenstid, streaming applikationer
Prøv gratis
Piper Free
Piper er en letvægts tekst-til-tale motor udviklet af Rhasspy, der bruger VITS og larynx arkitekturer. Det kører udelukkende på CPU, hvilket gør den ideel til kant enheder, hjem automatisering, og applikationer, der kræver offline TTS. Med over 100 stemmer på tværs af 30 + sprog, Piper leverer naturlig klingende tale ved real-time hastigheder selv på en Raspberry Pi 4.
Bedst til: Hurtige forhåndsvisninger, tilgængelighed og indlejrede applikationer
Prøv gratis
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) er en parallel end-to-end TTS metode, der genererer mere naturlig klingende lyd end nuværende to-trins modeller. Det vedtager variational inferens augmented med normaliserende flows og en adversarial uddannelsesproces, at opnå en betydelig forbedring i naturlighed.
Bedst til: Generelle formål tekst-til-tale med naturlig prosody
Prøv gratis
MeloTTS Free
MeloTTS af MyShell.ai er et flersproget TTS-bibliotek, der understøtter engelsk (amerikansk, britisk, indisk, australsk), spansk, fransk, kinesisk, japansk og koreansk. Det er ekstremt hurtigt, behandling tekst på nær real-time hastighed på CPU alene. MeloTTS er designet til produktion brug og understøtter både CPU og GPU inferens.
Bedst til: Produktionsapplikationer, der kræver hurtige, flersprogede TTS
Prøv gratis
Bark Standard
Transformer-baseret tekst-til-audio model, der genererer realistisk tale, musik og lydeffekter.
Udvikler: Suno · Licens: MIT
Prøv det.
Bark Small Standard
Lettere version af Bark med hurtigere inferens og lavere hukommelsesforbrug.
Udvikler: Suno · Licens: MIT
Prøv det.
CosyVoice 2 Standard
Alibaba skalerbar streaming TTS med menneskelig-paritet naturlighed og nær-nul latency.
Udvikler: Alibaba (Tongyi Lab) · Licens: Apache 2.0
Prøv det.
Dia TTS Standard
Multi-højttaler dialog generation model, der skaber naturlige samtaler mellem højttalere.
Udvikler: Nari Labs · Licens: Apache 2.0
Prøv det.
Parler TTS Standard
Beskriv den stemme, du ønsker i naturligt sprog og Parler genererer matchende tale.
Udvikler: Hugging Face · Licens: Apache 2.0
Prøv det.
GLM-TTS Standard
Opnår den laveste karakterfejlrate blandt open source TTS-modeller.
Udvikler: Zhipu AI · Licens: GLM-4 License
Prøv det.
IndexTTS-2 Standard
Zero-shot TTS med finkornet følelsesmæssig kontrol og høj ekspressivitet.
Udvikler: Index Team · Licens: Bilibili Model License
Prøv det.
Spark TTS Standard
Stemmekloning TTS med styrbar følelse og talestil via prompter.
Udvikler: SparkAudio · Licens: CC BY-NC-SA 4.0
Prøv det.
GPT-SoVITS Standard
Få-shot stemme kloning TTS, der replikerer enhver stemme fra kun 5 sekunder af lyd.
Udvikler: RVC-Boss · Licens: MIT
Prøv det.
Orpheus Standard
Human-level emotionel TTS model trænet på 100K timers taledata.
Udvikler: Canopy Labs · Licens: Llama 3.2 Community
Prøv det.
Qwen3 TTS Standard
Alibabas flersprogede TTS med stemmekloning, forudindstillede stemmer og stemmedesign fra tekst.
Udvikler: Alibaba (Qwen) · Licens: Apache 2.0
Prøv det.
CosyVoice 2
Alibaba skalerbar streaming TTS med menneskelig-paritet naturlighed og nær-nul latency.
Sprog: en, zh, ja, ko, fr, de, it, es
Klonstemme
GLM-TTS
Opnår den laveste karakterfejlrate blandt open source TTS-modeller.
Sprog: en, zh
Klonstemme
IndexTTS-2
Zero-shot TTS med finkornet følelsesmæssig kontrol og høj ekspressivitet.
Sprog: en, zh
Klonstemme
GPT-SoVITS
Få-shot stemme kloning TTS, der replikerer enhver stemme fra kun 5 sekunder af lyd.
Sprog: en, zh, ja, ko
Klonstemme
Chatterbox
Den nyeste nul-shot stemmekloning med følelsesmæssig kontrol fra Resemble AI.
Sprog: en
Klonstemme
Tortoise TTS
Multi-stemme tekst-til-tale fokuseret på kvalitet med autoregressiv arkitektur.
Sprog: en
Klonstemme
OpenVoice
Øjeblikkelig stemmekloning med granuleret kontrol over stil, følelser og accent.
Sprog: en, zh, ja, ko, fr, de, es, it
Klonstemme
Qwen3 TTS
Alibabas flersprogede TTS med stemmekloning, forudindstillede stemmer og stemmedesign fra tekst.
Sprog: en, zh, ja, ko, de, fr, ru, pt, es, it
KlonstemmeUdvikler- første API
OpenAI-kompatibel REST API. Et endpoint, 22 + modeller. Streaming støtte til real-time applikationer.
- OpenAI- kompatibelt format
- Streaming af TTS til real-time apps
- Batchforarbejdning til store job
- Webhook- meddelelserName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel, gennemsigtig prissætning
Start gratis. Skalér som du vokser.
Fri
15 kreditter
- Kokoro, Piper, VITS, MeloTTS
- 500 tegngrænse
- 3 gen/time (ingen konto)
Starter
500 kreditter/måned
- Alle 22+ modeller
- 100.000 tegn pr. generation
- Stemmekløvning
Pro
2.000 kreditter/måned
- Alt i starten
- API- adgang
- Prioriteret behandling
Ofte stillede spørgsmål
Begynd at bruge AI stemme i dag
Deltag skabere, udviklere og virksomheder ved hjælp af TTS.ai