Gratis AI Tekst naar spraak

20+ opensourcemodellen; 107+ stemmen, 32+ talen. Geen account vereist.

1K+
makers
2K+
generaties
20+
AI-modellen
107+
stemmen
0/500 tekens Vrij
Zoals TTS.ai? Vertel het je vrienden!

20+ AI Stem Modellen

De meest uitgebreide collectie van open-source TTS-modellen in één platform

KokoroKokoro Free

Kokoro is een 82 miljoen parameter text-to-speech model dat stoten ver boven zijn gewichtsklasse. Ondanks zijn kleine grootte, het produceert opmerkelijk natuurlijke en expressieve spraak. Kokoro ondersteunt meerdere talen, waaronder Engels, Japans, Chinees, en Koreaans met een verscheidenheid van expressieve stemmen. Het loopt ongelooflijk snel en het genereren van audio bijna 100x sneller dan real-time op een GPU.

Beste voor: Hoogwaardige TTS met minimale latentie, streaming toepassingen

Probeer vrij

PiperPiper Free

Piper is een lichtgewicht tekst-naar-spraak motor ontwikkeld door Rhasspy die gebruik maakt van VITS en larynx architecturen. Het draait volledig op CPU, waardoor het ideaal voor randapparatuur, domotica en toepassingen die offline TTS. Met meer dan 100 stemmen in meer dan 30 talen, Piper levert natuurlijk klinkende spraak bij real-time snelheden, zelfs op een Raspberry Pi 4.

Beste voor: Snelle previews, toegankelijkheid en ingebedde toepassingen

Probeer vrij

VITSVITS Free

VITS (Variationele Inferentie met adversariaal leren voor end-to-end Text-to-Speech) is een parallelle end-to-end TTS-methode die meer natuurlijk klinkende audio genereert dan de huidige twee-traps modellen. Het neemt variatiele gevolgtrekking verhoogd met normaliserende stromen en een tegenstrijdig trainingsproces, waardoor een significante verbetering in natuurlijkheid.

Beste voor: Tekst-tot-spraak voor algemene doeleinden met natuurlijke prosody

Probeer vrij

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is een meertalige TTS-bibliotheek die Engels (Amerikaans, Brits, Indisch, Australisch), Spaans, Frans, Chinees, Japans en Koreaans ondersteunt. Het is extreem snel, het verwerken van tekst op bijna real-time snelheid op CPU alleen. MeloTTS is ontworpen voor productie gebruik en ondersteunt zowel CPU en GPU-inferentie.

Beste voor: Productietoepassingen die snel, meertalig TTS nodig hebben

Probeer vrij

BarkBark Standard

Transformer-based text-to-audio model dat realistische spraak, muziek en geluidseffecten genereert.

Ontwikkelaar: Suno · Licentie: MIT

Probeer het.

Bark SmallBark Small Standard

Lichtere versie van Bark met snellere gevolgtrekking en lager geheugengebruik.

Ontwikkelaar: Suno · Licentie: MIT

Probeer het.

CosyVoice 2CosyVoice 2 Standard

Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.

Ontwikkelaar: Alibaba (Tongyi Lab) · Licentie: Apache 2.0

Probeer het.

Dia TTSDia TTS Standard

Multi-luidspreker dialoogvenster generatie model dat natuurlijke gesprekken tussen luidsprekers creëert.

Ontwikkelaar: Nari Labs · Licentie: Apache 2.0

Probeer het.

Parler TTSParler TTS Standard

Beschrijf de stem die u wilt in natuurlijke taal en Parler genereert bijpassende spraak.

Ontwikkelaar: Hugging Face · Licentie: Apache 2.0

Probeer het.

GLM-TTSGLM-TTS Standard

Bereikt het laagste foutenpercentage bij open-source TTS-modellen.

Ontwikkelaar: Zhipu AI · Licentie: GLM-4 License

Probeer het.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.

Ontwikkelaar: Index Team · Licentie: Bilibili Model License

Probeer het.

Spark TTSSpark TTS Standard

Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.

Ontwikkelaar: SparkAudio · Licentie: CC BY-NC-SA 4.0

Probeer het.

GPT-SoVITSGPT-SoVITS Standard

Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.

Ontwikkelaar: RVC-Boss · Licentie: MIT

Probeer het.

OrpheusOrpheus Standard

Emotioneel TTS-model op menselijk niveau getraind op 100K uren spraakgegevens.

Ontwikkelaar: Canopy Labs · Licentie: Llama 3.2 Community

Probeer het.

Qwen3 TTSQwen3 TTS Standard

Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.

Ontwikkelaar: Alibaba (Qwen) · Licentie: Apache 2.0

Probeer het.

ChatterboxChatterbox Premium

Zero-shot stemklonen met emotiecontrole van Resemble AI.

Kwaliteit:

Probeer het.

Tortoise TTSTortoise TTS Premium

Multi-voice text-to-speech gericht op kwaliteit met autoregressieve architectuur.

Kwaliteit:

Probeer het.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech door stijl verspreiding en tegenstrijdige training.

Kwaliteit:

Probeer het.

OpenVoiceOpenVoice Premium

Instant voice klonen met korrelige controle over stijl, emotie en accent.

Kwaliteit:

Probeer het.

Sesame CSMSesame CSM Premium

Conversational speech model genereren natuurlijke dialoog met de juiste timing en emotie.

Kwaliteit:

Probeer het.

CosyVoice 2CosyVoice 2

Alibaba's schaalbare streaming TTS met menselijk-parity natuurlijkheid en bijna-nul latentie.

Talen: en, zh, ja, ko, fr, de, it, es

Kloonstem

GLM-TTSGLM-TTS

Bereikt het laagste foutenpercentage bij open-source TTS-modellen.

Talen: en, zh

Kloonstem

IndexTTS-2IndexTTS-2

Zero-shot TTS met fijnkorrelige emotie controle en hoge expressiefheid.

Talen: en, zh

Kloonstem

Spark TTSSpark TTS

Voice klonen TTS met controleerbare emotie en sprekende stijl via prompts.

Talen: en, zh

Kloonstem

GPT-SoVITSGPT-SoVITS

Weinig stemgeluid klonen TTS die elke stem repliceert van slechts 5 seconden audio.

Talen: en, zh, ja, ko

Kloonstem

ChatterboxChatterbox

Zero-shot stemklonen met emotiecontrole van Resemble AI.

Talen: en

Kloonstem

Tortoise TTSTortoise TTS

Multi-voice text-to-speech gericht op kwaliteit met autoregressieve architectuur.

Talen: en

Kloonstem

OpenVoiceOpenVoice

Instant voice klonen met korrelige controle over stijl, emotie en accent.

Talen: en, zh, ja, ko, fr, de, es, it

Kloonstem

Qwen3 TTSQwen3 TTS

Alibaba's meertalige TTS met stemklonen, vooraf ingestelde stemmen en stemontwerp van tekst.

Talen: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloonstem

Ontwikkelaar-eerste API

OpenAI-compatibele REST API. Eén eindpunt, 22+ modellen. Streaming ondersteuning voor real-time toepassingen.

  • OpenAI-compatibel formaat
  • Streaming TTS voor real-time apps
  • Batchverwerking voor grote jobs
  • Webhook notificaties
API-docs tonen
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Eenvoudige, transparante prijzen

Begin vrij, schuin naarmate je groeit.

Vrij

$0

15 kredieten

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tekenlimiet
  • 3 gen/uur (geen rekening)
Gratis aanmelden

Starter

$9/munit description in lists

500 kredieten/maand

  • Alle 22+ modellen
  • 100,000 chars per generation
  • Stemklonen
Aan de slag
Meest populair

Pro

$29/munit description in lists

2000 kredieten/maand

  • Alles in Starter
  • API-toegang
  • Prioritaire verwerking
Get Pro

Zaken

$99/munit description in lists

10,000,000 characters/month

  • Alles in Pro
  • Bulk API
  • Prioriteitswachtrij
Bedrijf ophalen

Bekijk alle plannen inclusief karakterpakketten →

Veelgestelde vragen

TTS.ai is het meest uitgebreide AI spraakplatform, met 22+ tekst-naar-spraak modellen, voice klonen, spraak-naar-tekst, en audio tools. Alle modellen zijn open source zonder leverancier lock-in.

Ja! TTS.ai biedt gratis tekst-tot-spraak met Kokoro, Piper, VITS, en MeloTTS modellen. Geen account nodig. Schrijf je in om 15.000 gratis tekens te krijgen en toegang te krijgen tot alle modellen. Betaalde plannen beginnen bij $9/maand.

Voor snelheid, gebruik Kokoro of Piper. Voor kwaliteit, probeer CosyVoice 2 of StyleTTS 2. Voor het klonen van stemmen, gebruik Chatterbox of GPT-SoVITS. Voor dialoog, gebruik Dia TTS. Probeer meerdere modellen op dezelfde tekst te vergelijken.

Ja. OpenAI-compatibele REST API voor TTS, STT, voice klonen en audio tools. Beschikbaar op Pro ($29/mo) en Enterprise ($99/mo) plannen. Bekijk documentatie op tts.ai/api/.

De stemkwaliteit varieert per model. Premium modellen zoals CosyVoice 2, StyleTTS 2, en Chatterbox produceren bijna menselijke kwaliteit spraak met natuurlijke intonatie en emotie. Gratis modellen zoals Kokoro bieden uitstekende kwaliteit voor de meeste gebruikscases.

TTS.ai ondersteunt 30+ talen in haar modelbibliotheek. Engels heeft de breedste modelondersteuning, maar modellen zoals CosyVoice 2 cover Chinees, Japans en Koreaans; GPT-SoVITS behandelt Chinees, Japans, Koreaans en Engels; en MeloTTS ondersteunt Engels, Spaans, Frans, Chinees, Japans en Koreaans.

Ja. Alle verwerking gebeurt op onze dedicated GPU servers. We slaan uw tekstinvoer of gegenereerde audio niet op na levering. Geüploade stemmonsters voor klonen worden alleen gebruikt voor de huidige sessie en worden niet bewaard. We delen uw gegevens nooit met derden of gebruiken deze om modellen te trainen.

Ja. Alle audio gegenereerd op TTS.ai is van jou om commercieel te gebruiken, inclusief voor YouTube video's, podcasts, audiobooks, apps, advertenties en producten. Onze modellen zijn open source onder permissieve licenties (MIT, Apache 2.0). Geen royalty's of toeschrijving vereist.

TTS.ai genereert audio in WAV-formaat standaard voor maximale kwaliteit. U kunt converteren naar MP3, FLAC, OGG of M4A met behulp van onze gratis Audio Converter tool. De API ondersteunt het specificeren van uw gewenste output formaat direct in het verzoek.

Upload een korte audio sample (zo weinig als 5 seconden) van de stem die u wilt klonen, typ dan elke tekst om spraak te genereren in die stem. Modellen zoals Chatterbox, GPT-SoVITS en CosyVoice 2 ondersteunen stemklonen. De gekloonde stem legt toon, accent en sprekende stijl vast.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) vereisen geen account en kosten nul karakters. Standaard modellen (2.000 karakters/1K input) omvatten Bark, CosyVoice 2, F5-TTS, en Dia. Premium modellen (4.000 karakters/1K input) omvatten OpenVoice, Chatterbox, StyleTTS 2, en Tortoise. Betaalde modellen bieden over het algemeen hogere kwaliteit, meer stemmen, en extra functies zoals voice klonen.

Ja. De API ondersteunt batchverwerking voor het omzetten van grote volumes tekst naar spraak. Voeg meerdere verzoeken toe en haal resultaten asynchroon op met behulp van taak UUID's. Enterprise plannen ($99/mo) omvatten prioritaire wachtrij toegang voor snellere batchverwerking. Ideaal voor audioboekproductie, cursusinhoud en grootschalige voice-over projecten.
4.0/5 (8)

Start met het gebruik van AI Voice vandaag

Sluit je aan bij makers, ontwikkelaars en bedrijven die TTS.ai gebruiken