Fri AI Tekst til tale

22+ open source-modeller, 100+ stemmer 32+ sprog. Ingen konto påkrævet.

0/500 tegn Fri
Intet kreditkort 50 gratis kreditter 32+ sprog Kommercielt brug OK
0:00 / 0:00
Download lyd Link udløber i 24 timer
Fortæl dine venner det!

22+ AI-stemmemodeller

Den mest omfattende samling af open source TTS-modeller i én platform

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Bedst til: High-quality TTS with minimal latency, streaming applications

Prøv gratis

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Bedst til: Quick previews, accessibility, and embedded applications

Prøv gratis

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Bedst til: General-purpose text-to-speech with natural prosody

Prøv gratis

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Bedst til: Produktionsapplikationer, der kræver hurtige, flersprogede TTS

Prøv gratis

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Udvikler: Suno · Licens: MIT

Prøv det.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Udvikler: Suno · Licens: MIT

Prøv det.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Udvikler: Alibaba (Tongyi Lab) · Licens: Apache 2.0

Prøv det.

Dia TTS Standard

Multi-højttaler dialog generation model, der skaber naturlige samtaler mellem højttalere.

Udvikler: Nari Labs · Licens: Apache 2.0

Prøv det.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Udvikler: Hugging Face · Licens: Apache 2.0

Prøv det.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Udvikler: Index Team · Licens: Apache 2.0

Prøv det.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Udvikler: SparkAudio · Licens: Apache 2.0

Prøv det.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Udvikler: RVC-Boss · Licens: MIT

Prøv det.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Udvikler: Canopy Labs · Licens: Llama 3.2 Community

Prøv det.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Udvikler: Alibaba (Qwen) · Licens: Apache 2.0

Prøv det.

Chatterbox Premium

Den nyeste nul-shot stemmekloning med følelsesmæssig kontrol fra Resemble AI.

Kvalitet:

Prøv det.

Tortoise TTS Premium

Multi-stemme tekst-til-tale fokuseret på kvalitet med autoregressiv arkitektur.

Kvalitet:

Prøv det.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvalitet:

Prøv det.

OpenVoice Premium

Øjeblikkelig stemmekloning med granuleret kontrol over stil, følelser og accent.

Kvalitet:

Prøv det.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Sprog: en, zh, ja, ko, fr, de, it, es

Klonstemme

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Sprog: en, zh

Klonstemme

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Sprog: en, zh

Klonstemme

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Sprog: en, zh, ja, ko

Klonstemme

Chatterbox

Den nyeste nul-shot stemmekloning med følelsesmæssig kontrol fra Resemble AI.

Sprog: en

Klonstemme

Tortoise TTS

Multi-stemme tekst-til-tale fokuseret på kvalitet med autoregressiv arkitektur.

Sprog: en

Klonstemme

OpenVoice

Øjeblikkelig stemmekloning med granuleret kontrol over stil, følelser og accent.

Sprog: en, zh, ja, ko, fr, de, es, it

Klonstemme

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Sprog: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonstemme

Udvikler- første API

OpenAI-kompatibel REST API. Et endpoint, 22 + modeller. Streaming støtte til real-time applikationer.

  • OpenAI- kompatibelt format
  • Streaming af TTS til real-time apps
  • Batchforarbejdning til store job
  • Webhook- meddelelserName
Vis API Docs
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Enkel, gennemsigtig prissætning

Start gratis. Skalér som du vokser.

Fri

$0

50 kreditter

  • Kokoro, Piper, VITS, MeloTTS
  • 500 tegngrænse
  • 3 gen/time (ingen konto)
Tilmeld dig gratis

Starter

$9/m

500 kreditter/måned

  • Alle 22+ modeller
  • 5.000 tegngrænse
  • Stemmekløvning
Kom i gang
Mest populære

Pro

$29/m

2.000 kreditter/måned

  • Alt i starten
  • API- adgang
  • Prioriteret behandling
Hent Pro

Virksomhed

$99/m

10.000 credits/måned

  • Alt i Pro
  • Bulk API
  • Prioriteret kø
Kontaktsalg

View all plans including credit packs →

Ofte stillede spørgsmål

TTS.ai er den mest omfattende AI stemme platform, der tilbyder 22 + tekst-til-tale modeller, stemme kloning, tale-til-tekst, og audio-værktøjer. Alle modeller er open source uden leverandør lock-in.

Ja! TTS.ai tilbyder gratis tekst-til-tale med Kokoro, Piper, VITS, og MelottoTTS modeller. Ingen konto kræves. Tilmeld dig for at få 50 gratis kreditter og få adgang til alle modeller. Betalte planer starter på $9/måned.

For hastighed, brug Kokoro eller Piper. For kvalitet, prøv CosyVoice 2 eller StyletTS 2. For stemmekloning, brug Chatterbox eller GPT-SoVITS. For dialog, bruge Dia TTS. Prøv flere modeller på den samme tekst til at sammenligne.

Ja. OpenAI-kompatibel REST API til TTS, STT, stemme kloning og audio værktøjer. Tilgængelig på Pro ($29/mo) og Enterprise ($ 99/mo) planer. Se dokumentation på tts.ai/api /.

Stemmekvalitet varierer efter model. Premium modeller som CosyVoice 2, StylettTS 2, og Chatterbox producerer næsten menneskelig kvalitet tale med naturlig intonation og følelser. Gratis modeller som Kokoro tilbyder fremragende kvalitet til de fleste use cases.

TTS.ai understøtter 30+ sprog på tværs af sit modelbibliotek. Engelsk har den bredeste modelstøtte, men modeller som CosyVoice 2 dækker kinesisk, japansk og koreansk; GPT-SoVITS håndterer kinesisk, japansk, koreansk og engelsk; og MeloTTS understøtter engelsk, spansk, fransk, kinesisk, japansk og koreansk.

Ja. Al behandling sker på vores dedikerede GPU-servere. Vi gemmer ikke dit tekstinput eller genererede lyd efter levering. Uploadede stemmeprøver til kloning bruges kun til den aktuelle session og opbevares ikke. Vi deler aldrig dine data med tredjeparter eller bruger dem til at træne modeller.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genererer lyd i WAV- format som standard for maksimal kvalitet. Du kan konvertere til MP3, FLAC, OGG eller M4A ved hjælp af vores gratis Audio Converter værktøj. API understøtter angive din foretrukne output-format direkte i anmodningen.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Gratis modeller (Kokoro, Piper, VITS, MeloTTS) kræver ingen konto og koster nul credits. Standardmodeller (2 credits/1K tegn) omfatter Bark, CosyVoice 2, F5-TTS, og Dia. Premium modeller (4 credits/1K tegn) omfatter OpenVoice, Chatterbox, StyletTS 2, og Tortoise. Betalt modeller generelt tilbyder højere kvalitet, flere stemmer, og yderligere funktioner som stemmekloning.

Ja. API understøtter batchbehandling til konvertering af store mængder tekst til tale. Indsend flere anmodninger og hente resultater asynkront ved hjælp af job UUIDS. Enterprise planer ($ 99/mo) omfatter prioriteret kø adgang til hurtigere batch-behandling. Ideel til audiobook produktion, kursusindhold, og storstilede voiceover projekter.
5.0/5 (1)

Begynd at bruge AI stemme i dag

Deltag skabere, udviklere og virksomheder, der bruger TTS.ai