Vry Kunsmatige inteligensie Teks vir spraak

22+ oop- seurce modelle, 100+-stemme, 32+ tale. Geen rekening benodig.

0/500 karakters Beskikbaar
Geen kredietkaart nie 50 vrye krediete 32+ tale Kommersiële gebruik OK
0:00 / 0:00
Download Audio Skakel verstrek in 24h
Soos TTS.ai, vertel jou vriende!

22+ KI-stemmodel's

Die omvattendste versameling van ope-onsorce TTS modelle in een platform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Beste vir: High-quality TTS with minimal latency, streaming applications

Probeer vry

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Beste vir: Quick previews, accessibility, and embedded applications

Probeer vry

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Beste vir: General-purpose text-to-speech with natural prosody

Probeer vry

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het

Probeer vry

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0

Probeer dit

Dia TTSDia TTS Standard

Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.

Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0

Probeer dit

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0

Probeer dit

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Ontwikkelaar: Index Team · Lisensie: Apache 2.0

Probeer dit

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Ontwikkelaar: SparkAudio · Lisensie: Apache 2.0

Probeer dit

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Ontwikkelaar: RVC-Boss · Lisensie: MIT

Probeer dit

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community

Probeer dit

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0

Probeer dit

ChatterboxChatterbox Premium

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Kwaliteit:

Probeer dit

Tortoise TTSTortoise TTS Premium

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Kwaliteit:

Probeer dit

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kwaliteit:

Probeer dit

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Kwaliteit:

Probeer dit

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Tale: en, zh, ja, ko, fr, de, it, es

Geveinsde stem

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Tale: en, zh

Geveinsde stem

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Tale: en, zh

Geveinsde stem

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Tale: en, zh, ja, ko

Geveinsde stem

ChatterboxChatterbox

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Tale: en

Geveinsde stem

Tortoise TTSTortoise TTS

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Tale: en

Geveinsde stem

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Tale: en, zh, ja, ko, fr, de, es, it

Geveinsde stem

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Tale: en, zh, ja, ko, de, fr, ru, pt, es, it

Geveinsde stem

ontwikkelaar- First API

OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.

  • OpenAI- versoenbaarte formaat
  • Stroom TTS vir regte tyd apps
  • Moenie vir groot werk verwerk word nie
  • WebwerweName
Besigtig API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Eenvoudig, deurskynend

Begin vry. Skaal namate jy groei.

Beskikbaar

$0

50 krediete

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakterbeperking
  • 3 gen/hour (geen rekening)
Meld aan om vry te wees

Beginer

$9/mo

500 krediete/onth

  • Al 22+ modelle
  • 5 000 karakter beperk
  • Stemverkleuring
Begin
Die gewildste

Pro

$29/mo

2 000 krediete/month

  • Alles in Beginler
  • API-toegang
  • Prioriteitverwerking
Kry Pro

Onderneming

$99/mo

10 000 krediete/onth

  • Alles in Procrect
  • Grootmaat API
  • Prioriteit wagtou
Kontakverkope

View all plans including credit packs →

Vrae wat dikwels gevra word

TTS.ai is die omvattendste KI-klankplatform, bied 22+ teks-na-sech modelle, stemkloning, spraak-tot-teks en oudiogereedskap aan. Alle modelle is oop bron met geen verkoper slot-in nie.

Ja! TTS.ai bied gratis teks-na-sech met Kokoro, Pyper, VITS, en MeloTTS-modelle. Geen rekening benodig. Teken op om 50 vrye krediete te kry en toegang tot alle modelle te kry. Paid planne begin by $9/month.

Vir spoed, gebruik Kokoro of Piper. Vir kwaliteit, probeer CosyVoice 2 of StyltTS 2. Vir stem kloning, gebruik Chatterbox of GPT-SoVITS. Vir dialoog, gebruik Dia TTS. Probeer veelvuldige modelle op dieselfde teks om te vergelyk.

Ja. OpenAI- compatible REST API vir TTS, STT, stemkloning en oudiogereedskap. Beskikbaar op Pro ($29/mo) en buiteneming ($99/mo) planne. Bekyk dokumentasie by tts.ai/api/.

Stem kwaliteit wissel deur model. Premium modelle soos CosyVoice 2, StylTTS 2, en Chaterbox produseer naby-menslike kwaliteitsrede met natuurlike intonasie en emosie. Vry modelle soos Kokoro bied uitstekende kwaliteit vir die meeste gebruik van gevalle.

TTS.ai ondersteun 30+ tale oor sy modelbiblioteek. Engels het die breedste model ondersteun, maar modelle soos CosyVice 2 dek Chinese, Japannese en Koreaans; GPT-SoVITS hanteer Chinese, Japannese, Koreaanse en Engelse; en MeloTTS ondersteun Engels, Spaans, Frans, Chinees, Japannees en Koreaans.

Ja. Alle verwerking gebeur op ons toegewyde GPU bedieners. Ons stoor nie jou teks invoer of genereer klank na aflewering nie. Oplaai stemmonsters vir kloning word slegs gebruik vir die huidige sessie en word nie behou nie. Ons deel nooit jou data met derde partye of gebruik dit om modelle op te lei nie.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genereer klank in WAV formaat deur verstek vir maksimum kwaliteit. Jy kan skakel na MP3, FLAC, OG, of M4A te gebruik ons vry Audio Omskakelaar program. Die API ondersteun spesifiseer jou verkies uitset formaat direk in die versoek.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) vereis geen rekening nie en kos nul krediete. Standaard modelle (2 krediete/1K karakters) sluit in Bark, CosyVoice 2, F5-TTS, en Dia. Premium modelle (4 krediet /1K karakters) sluit OpenVoice, Chatterbox, style 2, en Tortoise. Paid modelle bied gewoonlik hoër kwaliteit, meer stemme en ander kenmerke soos clon.

Ja. Die API ondersteun klomp verwerking vir omskakeling van groot bundels van teks na spraak. Instuur veelvuldige versoeke en onttrek resultate asynchronous te gebruik werk UUIDs. Ondernemingsplanne ($99/mo) sluit prioriteit wagtou toegang in vir vinniger versameling. Ideale vir klankboekproduksie, natuurlik inhoud en groot-skaal stemoor projekte.
5.0/5 (1)

Begin vandag met die gebruik van KI-stem

Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik