Fritt AI Text till tal
22 + öppen källkod modeller, 100 + röster, 32+ Språk. Inget konto krävs.
Allt du behöver för röst AI
26 verktyg som drivs av 24+ AI-modeller med öppen källkod
22+ AI röstmodeller
Den mest omfattande samlingen av TTS-modeller med öppen källkod i en och samma plattform
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Bäst för: High-quality TTS with minimal latency, streaming applications
Försök gratis
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Bäst för: Quick previews, accessibility, and embedded applications
Försök gratis
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Bäst för: General-purpose text-to-speech with natural prosody
Försök gratis
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Bäst för: Produktionstillämpningar som behöver snabba, flerspråkiga TTS
Försök gratis
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Utvecklare: Suno · Licens: MIT
Försök.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Utvecklare: Suno · Licens: MIT
Försök.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Utvecklare: Alibaba (Tongyi Lab) · Licens: Apache 2.0
Försök.
Dia TTS Standard
Flertaltalsdialogruta generation modell som skapar naturliga samtal mellan talare.
Utvecklare: Nari Labs · Licens: Apache 2.0
Försök.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Utvecklare: Hugging Face · Licens: Apache 2.0
Försök.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Utvecklare: Index Team · Licens: Apache 2.0
Försök.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Utvecklare: SparkAudio · Licens: Apache 2.0
Försök.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Utvecklare: RVC-Boss · Licens: MIT
Försök.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Utvecklare: Canopy Labs · Licens: Llama 3.2 Community
Försök.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Utvecklare: Alibaba (Qwen) · Licens: Apache 2.0
Försök.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klonröst
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Språk: en, zh
Klonröst
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Språk: en, zh
Klonröst
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Språk: en, zh, ja, ko
Klonröst
Chatterbox
Toppmodern nollshotad röstkloning med känslokontroll från Resemble AI.
Språk: en
Klonröst
Tortoise TTS
Flera rösttext-till-tal fokuserade på kvalitet med autoregressiv arkitektur.
Språk: en
Klonröst
OpenVoice
Omedelbar röst kloning med granulär kontroll över stil, känslor och accent.
Språk: en, zh, ja, ko, fr, de, es, it
Klonröst
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
KlonröstUtvecklar-första API
OpenAI-kompatibelt REST API. En endpoint, 22+ modeller. Streaming stöd för realtidsapplikationer.
- OpenAI-kompatibelt format
- Strömma TTS för realtidsappar
- Partibearbetning för stora arbetstillfällen
- Webhook-anmälningar
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Enkel, transparent prissättning
Börja gratis, skala när du växer.
Avgiftsfri
50 hp
- Kokoro, Piper, VITS, MeloTTS
- Gräns för 500 tecken
- 3 gen/timme (utan konto)
För
2000 krediter/månad
- Allt i början
- API-åtkomst
- Prioriterad behandling
Vanliga frågor
Börja använda AI röst idag
Gå med skapare, utvecklare och företag som använder TTS.ai