Fritt AI Text till tal

22 + öppen källkod modeller, 100 + röster, 32+ Språk. Inget konto krävs.

0/500 tecken Avgiftsfri
Inget kreditkort 50 gratispoäng 32+ språk Kommersiell användning OK
0:00 / 0:00
Ladda ner ljud Länken går ut i 24 timmar
Berätta för dina vänner!

22+ AI röstmodeller

Den mest omfattande samlingen av TTS-modeller med öppen källkod i en och samma plattform

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Bäst för: High-quality TTS with minimal latency, streaming applications

Försök gratis

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Bäst för: Quick previews, accessibility, and embedded applications

Försök gratis

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Bäst för: General-purpose text-to-speech with natural prosody

Försök gratis

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Bäst för: Produktionstillämpningar som behöver snabba, flerspråkiga TTS

Försök gratis

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Utvecklare: Suno · Licens: MIT

Försök.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Utvecklare: Suno · Licens: MIT

Försök.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Utvecklare: Alibaba (Tongyi Lab) · Licens: Apache 2.0

Försök.

Dia TTSDia TTS Standard

Flertaltalsdialogruta generation modell som skapar naturliga samtal mellan talare.

Utvecklare: Nari Labs · Licens: Apache 2.0

Försök.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Utvecklare: Hugging Face · Licens: Apache 2.0

Försök.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Utvecklare: Index Team · Licens: Apache 2.0

Försök.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Utvecklare: SparkAudio · Licens: Apache 2.0

Försök.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Utvecklare: RVC-Boss · Licens: MIT

Försök.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Utvecklare: Canopy Labs · Licens: Llama 3.2 Community

Försök.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Utvecklare: Alibaba (Qwen) · Licens: Apache 2.0

Försök.

ChatterboxChatterbox Premium

Toppmodern nollshotad röstkloning med känslokontroll från Resemble AI.

Kvalitet:

Försök.

Tortoise TTSTortoise TTS Premium

Flera rösttext-till-tal fokuserade på kvalitet med autoregressiv arkitektur.

Kvalitet:

Försök.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Kvalitet:

Försök.

OpenVoiceOpenVoice Premium

Omedelbar röst kloning med granulär kontroll över stil, känslor och accent.

Kvalitet:

Försök.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Språk: en, zh, ja, ko, fr, de, it, es

Klonröst

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Språk: en, zh

Klonröst

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Språk: en, zh

Klonröst

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Språk: en, zh, ja, ko

Klonröst

ChatterboxChatterbox

Toppmodern nollshotad röstkloning med känslokontroll från Resemble AI.

Språk: en

Klonröst

Tortoise TTSTortoise TTS

Flera rösttext-till-tal fokuserade på kvalitet med autoregressiv arkitektur.

Språk: en

Klonröst

OpenVoiceOpenVoice

Omedelbar röst kloning med granulär kontroll över stil, känslor och accent.

Språk: en, zh, ja, ko, fr, de, es, it

Klonröst

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Språk: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonröst

Utvecklar-första API

OpenAI-kompatibelt REST API. En endpoint, 22+ modeller. Streaming stöd för realtidsapplikationer.

  • OpenAI-kompatibelt format
  • Strömma TTS för realtidsappar
  • Partibearbetning för stora arbetstillfällen
  • Webhook-anmälningar
Visa API- dokument
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Enkel, transparent prissättning

Börja gratis, skala när du växer.

Avgiftsfri

$0

50 hp

  • Kokoro, Piper, VITS, MeloTTS
  • Gräns för 500 tecken
  • 3 gen/timme (utan konto)
Registrera dig gratis

Uppstart

$9/m m m

500 hp/månad

  • Alla 22+ modeller
  • 5 000 teckengräns
  • Röstförslutning
Kom igång
Mest populära

För

$29/m m m

2000 krediter/månad

  • Allt i början
  • API-åtkomst
  • Prioriterad behandling
Hämta Pro

Företag

$99/m m m

10 000 krediter/månad

  • Allt i Pro
  • Bulk API
  • Prioriterad kö
Kontaktförsäljning

View all plans including credit packs →

Vanliga frågor

TTS.ai är den mest omfattande AI-röstplattform som erbjuder 22+ text-till-tal-modeller, röstkloning, tal-till-text och ljudverktyg. Alla modeller är öppna källkod utan leverantörslås.

Ja! TTS.ai erbjuder gratis text-till-tal med Kokoro, Piper, VITS och Melotts modeller. Inget konto krävs. Registrera dig för att få 50 gratis krediter och få tillgång till alla modeller. Betalda planer börjar på $9/månad.

För hastighet, använd Kokoro eller Piper. För kvalitet, prova CosyVoice 2 eller StyleTTS 2. För röstkloning, använd Chatterbox eller GPT-Sovits. För dialog, använd Dia TTS. Prova flera modeller på samma text för att jämföra.

Ja. OpenAI-kompatibelt REST API för TTS, STT, röstkloning och ljudverktyg. Tillgänglig på Pro ($29/mo) och Enterprise ($99/mo) planer. Visa dokumentation på tts.ai/api/.

Röstkvalitet varierar beroende på modell. Premium modeller som CosyVoice 2, StyleTTS 2, och Chatterbox producerar nästan mänskligt kvalitet tal med naturlig intonation och känslor. Gratis modeller som Kokoro erbjuder utmärkt kvalitet för de flesta användningsfall.

TTS.ai stöder 30+ språk över sitt modellbibliotek. Engelska har den bredaste modellen stöd, men modeller som CosyVoice 2 täcker kinesiska, japanska och koreanska; GPT-SoVITS hanterar kinesiska, japanska, koreanska och engelska; och Melotts stöder engelska, spanska, franska, kinesiska, japanska och koreanska.

Ja. All behandling sker på våra dedikerade GPU-servrar. Vi lagrar inte din textinmatning eller genererat ljud efter leverans. Uppladdade röstprover för kloning används endast för den aktuella sessionen och behålls inte. Vi delar aldrig dina data med tredje part eller använder dem för att träna modeller.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genererar ljud i WAV-format som standard för maximal kvalitet. Du kan konvertera till MP3, FLAC, OGG, eller M4A med hjälp av vår gratis Audio Converter verktyg. APIet stöder ange önskad utdataformat direkt i begäran.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Gratis modeller (Kokoro, Piper, VITS, MeloTTS) kräver inget konto och kostar noll krediter. Standard modeller (2 hp/1K tecken) inkluderar Bark, CosyVoice 2, F5-TTS, och Dia. Premium modeller (4 hp/1K tecken) inkluderar OpenVoice, Chatterbox, StyleTTS 2, och Tortoise. Betalda modeller erbjuder i allmänhet högre kvalitet, fler röster, och ytterligare funktioner som röst kloning.

Ja. API stöder batch bearbetning för att konvertera stora volymer text till tal. Skicka flera förfrågningar och hämta resultat asynkront med jobb UUIDs. Enterprise planer ($99/mo) inkluderar prioriterad kö tillgång för snabbare batch bearbetning. Idealisk för ljudbok produktion, kursinnehåll och storskaliga röstövergångsprojekt.
5.0/5 (1)

Börja använda AI röst idag

Gå med skapare, utvecklare och företag som använder TTS.ai