Gratis AI Tekst naar spraak
31+ opensourcemodellen; 231+ stemmen, 34+ talen. Geen account vereist.
Alles wat je nodig hebt voor Voice AI
30+ gereedschappen aangedreven door open-source AI modellen
31+ AI Stem Modellen
De meest uitgebreide collectie van open-source TTS-modellen in één platform
Kokoro Free
Kokoro is een 82 miljoen parameter text-to-speech model dat stoten ver boven zijn gewichtsklasse. Ondanks zijn kleine grootte, het produceert opmerkelijk natuurlijke en expressieve spraak. Kokoro ondersteunt meerdere talen, waaronder Engels, Japans, Chinees, en Koreaans met een verscheidenheid van expressieve stemmen. Het loopt ongelooflijk snel en het genereren van audio bijna 100x sneller dan real-time op een GPU.
Beste voor: Hoogwaardige TTS met minimale latentie, streaming toepassingen
Probeer vrij
Piper Free
Piper is een lichtgewicht tekst-naar-spraak motor ontwikkeld door Rhasspy die gebruik maakt van VITS en larynx architecturen. Het draait volledig op CPU, waardoor het ideaal voor randapparatuur, domotica en toepassingen die offline TTS. Met meer dan 100 stemmen in meer dan 30 talen, Piper levert natuurlijk klinkende spraak bij real-time snelheden, zelfs op een Raspberry Pi 4.
Beste voor: Snelle previews, toegankelijkheid en ingebedde toepassingen
Probeer vrij
VITS Free
VITS (Variationele Inferentie met adversariaal leren voor end-to-end Text-to-Speech) is een parallelle end-to-end TTS-methode die meer natuurlijk klinkende audio genereert dan de huidige twee-traps modellen. Het neemt variatiele gevolgtrekking verhoogd met normaliserende stromen en een tegenstrijdig trainingsproces, waardoor een significante verbetering in natuurlijkheid.
Beste voor: Tekst-tot-spraak voor algemene doeleinden met natuurlijke prosody
Probeer vrij
MeloTTS Free
MeloTTS by MyShell.ai is een meertalige TTS-bibliotheek die Engels (Amerikaans, Brits, Indisch, Australisch), Spaans, Frans, Chinees, Japans en Koreaans ondersteunt. Het is extreem snel, het verwerken van tekst op bijna real-time snelheid op CPU alleen. MeloTTS is ontworpen voor productie gebruik en ondersteunt zowel CPU en GPU-inferentie.
Beste voor: Productietoepassingen die snel, meertalig TTS nodig hebben
Probeer vrij
OuteTTS Free
OuteTTS breidt grote taalmodellen uit met text-to-speech mogelijkheden terwijl het behoud van de oorspronkelijke architectuur. Het ondersteunt meerdere backends, waaronder lama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, en zelfs browser gevolggeving via Transformers.js. Kenmerken nul-shot stemklonen door speakerprofielen opgeslagen als JSON.
Beste voor: Rand-implementatie, browser-gebaseerde TTS, low-resource omgevingen
Probeer vrij
Pocket TTS Free
Pocket TTS van Kyutai (scheppers van Moshi) is een compacte 100M parameter text-to-speech model dat stoten ver boven zijn gewicht. Het werkt efficiënt op CPU, ondersteunt nul-shot stem klonen uit een enkel audio monster, en produceert natuurlijke klinkende spraak. De kleine modelgrootte maakt het ideaal voor rand implementatie en low-resource omgevingen.
Beste voor: Lichtgewicht implementatie, CPU-alleen omgevingen, snel klonen
Probeer vrij
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Beste voor: Fast lightweight TTS, edge deployment, low-latency applications
Probeer vrij
Bark Standard
Transformer-based text-to-audio model dat realistische spraak, muziek en geluidseffecten genereert.
Ontwikkelaar: Suno · Licentie: MIT
Probeer het.
Bark Small Standard
Lichtere versie van Bark met snellere gevolgtrekking en lager geheugengebruik.
Ontwikkelaar: Suno · Licentie: MIT
Probeer het.
CosyVoice 2 Standard
Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.
Ontwikkelaar: Alibaba (Tongyi Lab) · Licentie: Apache 2.0
Probeer het.
Dia TTS Standard
Multi-luidspreker dialoogvenster generatie model dat natuurlijke gesprekken tussen luidsprekers creëert.
Ontwikkelaar: Nari Labs · Licentie: Apache 2.0
Probeer het.
Parler TTS Standard
Beschrijf de stem die u wilt in natuurlijke taal en Parler genereert bijpassende spraak.
Ontwikkelaar: Hugging Face · Licentie: Apache 2.0
Probeer het.
GLM-TTS Standard
Bereikt het laagste foutenpercentage bij open-source TTS-modellen.
Ontwikkelaar: Zhipu AI · Licentie: GLM-4 License
Probeer het.
IndexTTS-2 Standard
Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.
Ontwikkelaar: Index Team · Licentie: Bilibili Model License
Probeer het.
Spark TTS Standard
Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.
Ontwikkelaar: SparkAudio · Licentie: CC BY-NC-SA 4.0
Probeer het.
GPT-SoVITS Standard
Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.
Ontwikkelaar: RVC-Boss · Licentie: MIT
Probeer het.
Orpheus Standard
Emotioneel TTS-model op menselijk niveau getraind op 100K uren spraakgegevens.
Ontwikkelaar: Canopy Labs · Licentie: Llama 3.2 Community
Probeer het.
Qwen3 TTS Standard
Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.
Ontwikkelaar: Alibaba (Qwen) · Licentie: Apache 2.0
Probeer het.
Chatterbox Turbo Standard
Snellere Chatterbox met sub-200ms latency en paralinguïstische tags voor lachen, hoesten, en nog veel meer.
Ontwikkelaar: Resemble AI · Licentie: MIT
Probeer het.
Dia 2 Standard
Streaming-eerste conversatie TTS met multi-speaker dialoog en paralinguïstische keus.
Ontwikkelaar: Nari Labs · Licentie: Apache 2.0
Probeer het.
VoxCPM Standard
Tokenizer-vrije TTS produceren 44.1kHz audio met context-aware alinea consistentie.
Ontwikkelaar: OpenBMB · Licentie: Apache 2.0
Probeer het.
TADA Standard
Zero-hallucinatie TTS met tekst-akoestische dubbele uitlijning, 5x sneller dan vergelijkbare LLM TTS.
Ontwikkelaar: Hume AI · Licentie: MIT
Probeer het.
VibeVoice Standard
Microsoft model voor lange-vorm multi-luidspreker inhoud zoals podcasts en audioboeken.
Ontwikkelaar: Microsoft · Licentie: MIT
Probeer het.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Ontwikkelaar: Alibaba (FunAudioLLM) · Licentie: Apache 2.0
Probeer het.
CosyVoice 2
Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.
Talen: en, zh, ja, ko, fr, de, it, es
Kloonstem
IndexTTS-2
Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.
Talen: en, zh
Kloonstem
Spark TTS
Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.
Talen: en, zh
Kloonstem
GPT-SoVITS
Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.
Talen: en, zh, ja, ko
Kloonstem
Tortoise TTS
Multi-voice text-to-speech gericht op kwaliteit met autoregressieve architectuur.
Talen: en
Kloonstem
OpenVoice
Instant voice klonen met korrelige controle over stijl, emotie en accent.
Talen: en, zh, ja, ko, fr, de, es, it
Kloonstem
Qwen3 TTS
Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.
Talen: en, zh, ja, ko, de, fr, ru, pt, es, it
Kloonstem
Chatterbox Turbo
Snellere Chatterbox met sub-200ms latency en paralinguïstische tags voor lachen, hoesten, en nog veel meer.
Talen: en
Kloonstem
VoxCPM
Tokenizer-vrije TTS produceren 44.1kHz audio met context-aware alinea consistentie.
Talen: en, zh
Kloonstem
OuteTTS
LLM-gebaseerde TTS die draait op CPU, GPU, of browser via lama.cpp en Transformers.js.
Talen: en
Kloonstem
Pocket TTS
Lichtgewicht 100M parameter model door Kyutai met stem klonen van een enkel monster.
Talen: en, fr
Kloonstem
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Talen: en, zh, ja, ko, de, es, fr, it, ru
Kloonstem
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Talen: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Kloonstem
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Talen: en, zh
KloonstemOntwikkelaar-eerste API
OpenAI-compatibele REST API. Eén eindpunt, 22+ modellen. Streaming ondersteuning voor real-time toepassingen.
- OpenAI-compatibel formaat
- Streaming TTS voor real-time apps
- Batchverwerking voor grote jobs
- Webhook notificaties
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Eenvoudige, transparante prijzen
Begin vrij, schuin naarmate je groeit.
Vrij
15 kredieten
- Kokoro, Piper, VITS, MeloTTS
- 500 tekenlimiet
- 3 gen/uur (geen rekening)
Starter
500 kredieten/maand
- Alle 22+ modellen
- 100.000 tekens per generatie
- Stemklonen
Pro
2000 kredieten/maand
- Alles in Starter
- API-toegang
- Prioritaire verwerking
Zaken
10.000.000 tekens/maand
- Alles in Pro
- Bulk API
- Prioriteitswachtrij
Veelgestelde vragen
Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.
Start met het gebruik van AI Voice vandaag
Sluit je aan bij makers, ontwikkelaars en bedrijven die TTS.ai gebruiken