Gratis AI Tekst naar spraak

31+ opensourcemodellen; 231+ stemmen, 34+ talen. Geen account vereist.

8K+
makers
30K+
generaties
31+
AI-modellen
231+
stemmen
Hou van TTS.ai? Vertel het je vrienden!

Alles wat je nodig hebt voor Voice AI

30+ gereedschappen aangedreven door open-source AI modellen

31+ AI Stem Modellen

De meest uitgebreide collectie van open-source TTS-modellen in één platform

KokoroKokoro Free

Kokoro is een 82 miljoen parameter text-to-speech model dat stoten ver boven zijn gewichtsklasse. Ondanks zijn kleine grootte, het produceert opmerkelijk natuurlijke en expressieve spraak. Kokoro ondersteunt meerdere talen, waaronder Engels, Japans, Chinees, en Koreaans met een verscheidenheid van expressieve stemmen. Het loopt ongelooflijk snel en het genereren van audio bijna 100x sneller dan real-time op een GPU.

Beste voor: Hoogwaardige TTS met minimale latentie, streaming toepassingen

Probeer vrij

PiperPiper Free

Piper is een lichtgewicht tekst-naar-spraak motor ontwikkeld door Rhasspy die gebruik maakt van VITS en larynx architecturen. Het draait volledig op CPU, waardoor het ideaal voor randapparatuur, domotica en toepassingen die offline TTS. Met meer dan 100 stemmen in meer dan 30 talen, Piper levert natuurlijk klinkende spraak bij real-time snelheden, zelfs op een Raspberry Pi 4.

Beste voor: Snelle previews, toegankelijkheid en ingebedde toepassingen

Probeer vrij

VITSVITS Free

VITS (Variationele Inferentie met adversariaal leren voor end-to-end Text-to-Speech) is een parallelle end-to-end TTS-methode die meer natuurlijk klinkende audio genereert dan de huidige twee-traps modellen. Het neemt variatiele gevolgtrekking verhoogd met normaliserende stromen en een tegenstrijdig trainingsproces, waardoor een significante verbetering in natuurlijkheid.

Beste voor: Tekst-tot-spraak voor algemene doeleinden met natuurlijke prosody

Probeer vrij

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is een meertalige TTS-bibliotheek die Engels (Amerikaans, Brits, Indisch, Australisch), Spaans, Frans, Chinees, Japans en Koreaans ondersteunt. Het is extreem snel, het verwerken van tekst op bijna real-time snelheid op CPU alleen. MeloTTS is ontworpen voor productie gebruik en ondersteunt zowel CPU en GPU-inferentie.

Beste voor: Productietoepassingen die snel, meertalig TTS nodig hebben

Probeer vrij

OuteTTSOuteTTS Free

OuteTTS breidt grote taalmodellen uit met text-to-speech mogelijkheden terwijl het behoud van de oorspronkelijke architectuur. Het ondersteunt meerdere backends, waaronder lama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, en zelfs browser gevolggeving via Transformers.js. Kenmerken nul-shot stemklonen door speakerprofielen opgeslagen als JSON.

Beste voor: Rand-implementatie, browser-gebaseerde TTS, low-resource omgevingen

Probeer vrij

Pocket TTSPocket TTS Free

Pocket TTS van Kyutai (scheppers van Moshi) is een compacte 100M parameter text-to-speech model dat stoten ver boven zijn gewicht. Het werkt efficiënt op CPU, ondersteunt nul-shot stem klonen uit een enkel audio monster, en produceert natuurlijke klinkende spraak. De kleine modelgrootte maakt het ideaal voor rand implementatie en low-resource omgevingen.

Beste voor: Lichtgewicht implementatie, CPU-alleen omgevingen, snel klonen

Probeer vrij

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Beste voor: Fast lightweight TTS, edge deployment, low-latency applications

Probeer vrij

BarkBark Standard

Transformer-based text-to-audio model dat realistische spraak, muziek en geluidseffecten genereert.

Ontwikkelaar: Suno · Licentie: MIT

Probeer het.

Bark SmallBark Small Standard

Lichtere versie van Bark met snellere gevolgtrekking en lager geheugengebruik.

Ontwikkelaar: Suno · Licentie: MIT

Probeer het.

CosyVoice 2CosyVoice 2 Standard

Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.

Ontwikkelaar: Alibaba (Tongyi Lab) · Licentie: Apache 2.0

Probeer het.

Dia TTSDia TTS Standard

Multi-luidspreker dialoogvenster generatie model dat natuurlijke gesprekken tussen luidsprekers creëert.

Ontwikkelaar: Nari Labs · Licentie: Apache 2.0

Probeer het.

Parler TTSParler TTS Standard

Beschrijf de stem die u wilt in natuurlijke taal en Parler genereert bijpassende spraak.

Ontwikkelaar: Hugging Face · Licentie: Apache 2.0

Probeer het.

GLM-TTSGLM-TTS Standard

Bereikt het laagste foutenpercentage bij open-source TTS-modellen.

Ontwikkelaar: Zhipu AI · Licentie: GLM-4 License

Probeer het.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.

Ontwikkelaar: Index Team · Licentie: Bilibili Model License

Probeer het.

Spark TTSSpark TTS Standard

Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.

Ontwikkelaar: SparkAudio · Licentie: CC BY-NC-SA 4.0

Probeer het.

GPT-SoVITSGPT-SoVITS Standard

Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.

Ontwikkelaar: RVC-Boss · Licentie: MIT

Probeer het.

OrpheusOrpheus Standard

Emotioneel TTS-model op menselijk niveau getraind op 100K uren spraakgegevens.

Ontwikkelaar: Canopy Labs · Licentie: Llama 3.2 Community

Probeer het.

Qwen3 TTSQwen3 TTS Standard

Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.

Ontwikkelaar: Alibaba (Qwen) · Licentie: Apache 2.0

Probeer het.

Chatterbox TurboChatterbox Turbo Standard

Snellere Chatterbox met sub-200ms latency en paralinguïstische tags voor lachen, hoesten, en nog veel meer.

Ontwikkelaar: Resemble AI · Licentie: MIT

Probeer het.

Dia 2Dia 2 Standard

Streaming-eerste conversatie TTS met multi-speaker dialoog en paralinguïstische keus.

Ontwikkelaar: Nari Labs · Licentie: Apache 2.0

Probeer het.

VoxCPMVoxCPM Standard

Tokenizer-vrije TTS produceren 44.1kHz audio met context-aware alinea consistentie.

Ontwikkelaar: OpenBMB · Licentie: Apache 2.0

Probeer het.

TADATADA Standard

Zero-hallucinatie TTS met tekst-akoestische dubbele uitlijning, 5x sneller dan vergelijkbare LLM TTS.

Ontwikkelaar: Hume AI · Licentie: MIT

Probeer het.

VibeVoiceVibeVoice Standard

Microsoft model voor lange-vorm multi-luidspreker inhoud zoals podcasts en audioboeken.

Ontwikkelaar: Microsoft · Licentie: MIT

Probeer het.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Ontwikkelaar: Alibaba (FunAudioLLM) · Licentie: Apache 2.0

Probeer het.

ChatterboxChatterbox Premium

Zero-shot stemklonen met emotiecontrole van Resemble AI.

Kwaliteit:

Probeer het.

Tortoise TTSTortoise TTS Premium

Multi-voice text-to-speech gericht op kwaliteit met autoregressieve architectuur.

Kwaliteit:

Probeer het.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech door stijl verspreiding en tegenstrijdige training.

Kwaliteit:

Probeer het.

OpenVoiceOpenVoice Premium

Instant voice klonen met korrelige controle over stijl, emotie en accent.

Kwaliteit:

Probeer het.

Sesame CSMSesame CSM Premium

Conversational speech model genereren natuurlijke dialoog met de juiste timing en emotie.

Kwaliteit:

Probeer het.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kwaliteit:

Probeer het.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kwaliteit:

Probeer het.

CosyVoice 2CosyVoice 2

Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.

Talen: en, zh, ja, ko, fr, de, it, es

Kloonstem

GLM-TTSGLM-TTS

Bereikt het laagste foutenpercentage bij open-source TTS-modellen.

Talen: en, zh

Kloonstem

IndexTTS-2IndexTTS-2

Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.

Talen: en, zh

Kloonstem

Spark TTSSpark TTS

Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.

Talen: en, zh

Kloonstem

GPT-SoVITSGPT-SoVITS

Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.

Talen: en, zh, ja, ko

Kloonstem

ChatterboxChatterbox

Zero-shot stemklonen met emotiecontrole van Resemble AI.

Talen: en

Kloonstem

Tortoise TTSTortoise TTS

Multi-voice text-to-speech gericht op kwaliteit met autoregressieve architectuur.

Talen: en

Kloonstem

OpenVoiceOpenVoice

Instant voice klonen met korrelige controle over stijl, emotie en accent.

Talen: en, zh, ja, ko, fr, de, es, it

Kloonstem

Qwen3 TTSQwen3 TTS

Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.

Talen: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloonstem

Chatterbox TurboChatterbox Turbo

Snellere Chatterbox met sub-200ms latency en paralinguïstische tags voor lachen, hoesten, en nog veel meer.

Talen: en

Kloonstem

VoxCPMVoxCPM

Tokenizer-vrije TTS produceren 44.1kHz audio met context-aware alinea consistentie.

Talen: en, zh

Kloonstem

OuteTTSOuteTTS

LLM-gebaseerde TTS die draait op CPU, GPU, of browser via lama.cpp en Transformers.js.

Talen: en

Kloonstem

Pocket TTSPocket TTS

Lichtgewicht 100M parameter model door Kyutai met stem klonen van een enkel monster.

Talen: en, fr

Kloonstem

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Talen: en, zh, ja, ko, de, es, fr, it, ru

Kloonstem

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Talen: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Kloonstem

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Talen: en, zh

Kloonstem

Ontwikkelaar-eerste API

OpenAI-compatibele REST API. Eén eindpunt, 22+ modellen. Streaming ondersteuning voor real-time toepassingen.

  • OpenAI-compatibel formaat
  • Streaming TTS voor real-time apps
  • Batchverwerking voor grote jobs
  • Webhook notificaties
API-docs tonen
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Eenvoudige, transparante prijzen

Begin vrij, schuin naarmate je groeit.

Vrij

$0

15 kredieten

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tekenlimiet
  • 3 gen/uur (geen rekening)
Gratis aanmelden

Starter

$9/munit description in lists

500 kredieten/maand

  • Alle 22+ modellen
  • 100.000 tekens per generatie
  • Stemklonen
Aan de slag
Meest populair

Pro

$29/munit description in lists

2000 kredieten/maand

  • Alles in Starter
  • API-toegang
  • Prioritaire verwerking
Get Pro

Zaken

$99/munit description in lists

10.000.000 tekens/maand

  • Alles in Pro
  • Bulk API
  • Prioriteitswachtrij
Bedrijf ophalen

Bekijk alle plannen inclusief karakterpakketten →

Veelgestelde vragen

TTS.ai is het meest uitgebreide AI spraakplatform, met 22+ tekst-naar-spraak modellen, voice klonen, spraak-naar-tekst, en audio tools. Alle modellen zijn open source zonder leverancier lock-in.

Ja! TTS.ai biedt gratis tekst-tot-spraak met Kokoro, Piper, VITS, en MeloTTS modellen. Geen account nodig. Schrijf je in om 15.000 gratis tekens te krijgen en toegang te krijgen tot alle modellen. Betaalde plannen beginnen bij $9/maand.

Voor snelheid, gebruik Kokoro of Piper. Voor kwaliteit, probeer CosyVoice 2 of StyleTTS 2. Voor het klonen van stemmen, gebruik Chatterbox of GPT-SoVITS. Voor dialoog, gebruik Dia TTS. Probeer meerdere modellen op dezelfde tekst te vergelijken.

Ja. OpenAI-compatibele REST API voor TTS, STT, voice klonen en audio tools. Beschikbaar op Pro ($29/mo) en Enterprise ($99/mo) plannen. Bekijk documentatie op tts.ai/api/.

De stemkwaliteit varieert per model. Premium modellen zoals CosyVoice 2, StyleTTS 2, en Chatterbox produceren bijna menselijke kwaliteit spraak met natuurlijke intonatie en emotie. Gratis modellen zoals Kokoro bieden uitstekende kwaliteit voor de meeste gebruikscases.

TTS.ai ondersteunt 30+ talen in haar modelbibliotheek. Engels heeft de breedste modelondersteuning, maar modellen zoals CosyVoice 2 cover Chinees, Japans en Koreaans; GPT-SoVITS behandelt Chinees, Japans, Koreaans en Engels; en MeloTTS ondersteunt Engels, Spaans, Frans, Chinees, Japans en Koreaans.

Ja. Alle verwerking gebeurt op onze dedicated GPU servers. We slaan uw tekstinvoer of gegenereerde audio niet op na levering. Geüploade stemmonsters voor klonen worden alleen gebruikt voor de huidige sessie en worden niet bewaard. We delen uw gegevens nooit met derden of gebruiken deze om modellen te trainen.

Ja. Alle audio gegenereerd op TTS.ai is van jou om commercieel te gebruiken, inclusief voor YouTube video's, podcasts, audiobooks, apps, advertenties en producten. Onze modellen zijn open source onder permissieve licenties (MIT, Apache 2.0). Geen royalty's of toeschrijving vereist.

TTS.ai genereert audio in WAV-formaat standaard voor maximale kwaliteit. U kunt converteren naar MP3, FLAC, OGG, of M4A met behulp van onze gratis Audio Converter tool. De API ondersteunt het specificeren van uw gewenste output formaat direct in het verzoek.

Upload een korte audio sample (zo weinig als 5 seconden) van de stem die u wilt klonen, typ dan elke tekst om spraak te genereren in die stem. Modellen zoals Chatterbox, GPT-SoVITS en CosyVoice 2 ondersteunen stemklonen. De gekloonde stem legt toon, accent en sprekende stijl vast.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) vereisen geen account en kosten nul karakters. Standaard modellen (2.000 karakters/1K input) omvatten Bark, CosyVoice 2, F5-TTS, en Dia. Premium modellen (4.000 karakters/1K input) omvatten OpenVoice, Chatterbox, StyleTTS 2, en Tortoise. Betaalde modellen bieden over het algemeen hogere kwaliteit, meer stemmen, en extra functies zoals voice klonen.

Ja. De API ondersteunt batchverwerking voor het omzetten van grote volumes tekst naar spraak. Voeg meerdere verzoeken toe en haal resultaten asynchroon op met behulp van taak UUID's. Enterprise plannen ($99/mo) omvatten prioritaire wachtrij toegang voor snellere batchverwerking. Ideaal voor audioboekproductie, cursusinhoud en grootschalige voice-over projecten.
4.1/5 (21)

Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.

Start met het gebruik van AI Voice vandaag

Sluit je aan bij makers, ontwikkelaars en bedrijven die TTS.ai gebruiken