Ledig AI Tekst til tale
22+ modeller med åpen kildekode, 100+ stemmer, 32+ språk. Ingen konto påkrevd.
Alt du trenger for tale- AI
26 verktøy som drives av 24+ AI-modeller med åpen kildekode
22+ AI- stemmemodeller
Den mest omfattende samlingen av TTS-modeller med åpen kildekode på én plattform
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Best for: High-quality TTS with minimal latency, streaming applications
Prøv ledig
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Best for: Quick previews, accessibility, and embedded applications
Prøv ledig
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Best for: General-purpose text-to-speech with natural prosody
Prøv ledig
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Best for: Produksjonsprogrammer som trenger raske, flerspråklige TTS
Prøv ledig
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Utvikler: Suno · Lisens: MIT
Prøv det
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Utvikler: Suno · Lisens: MIT
Prøv det
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Utvikler: Alibaba (Tongyi Lab) · Lisens: Apache 2.0
Prøv det
Dia TTS Standard
Generasjonsmodell med flere høyttalere som skaper naturlige samtaler mellom høyttalere.
Utvikler: Nari Labs · Lisens: Apache 2.0
Prøv det
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Utvikler: Hugging Face · Lisens: Apache 2.0
Prøv det
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Utvikler: Index Team · Lisens: Apache 2.0
Prøv det
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Utvikler: SparkAudio · Lisens: Apache 2.0
Prøv det
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Utvikler: RVC-Boss · Lisens: MIT
Prøv det
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Utvikler: Canopy Labs · Lisens: Llama 3.2 Community
Prøv det
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Utvikler: Alibaba (Qwen) · Lisens: Apache 2.0
Prøv det
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klone stemme
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Språk: en, zh
Klone stemme
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Språk: en, zh
Klone stemme
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Språk: en, zh, ja, ko
Klone stemme
Chatterbox
Det nåværende utviklingstrinn i teknikken «null-skudds-tale kloning» med følelseskontroll fra AI-enheten som kan gjenopprettes.
Språk: en
Klone stemme
Tortoise TTS
Tekst til tale med flere tale, med fokus på kvalitet med autoregressiv arkitektur.
Språk: en
Klone stemme
OpenVoice
Øyeblikkelig stemmekloning med granulert styring av stil, følelser og aksent.
Språk: en, zh, ja, ko, fr, de, es, it
Klone stemme
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
Klone stemmeUtvikler- første API
OpenAI- kompatibel REST API. Ett endepunkt, 22+ modeller. Støtte for streaming av sanntidsapplikasjoner.
- OpenAI-kompatibelt format
- Strømmer TTS for sanntidsapper
- Mengdevis behandling for store jobber
- Netthook- varslingerName
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Enkel og gjennomsiktig prissetting
Begynn fri, skaler etter hvert som du vokser.
Ledig
50 kreditter
- Kokoro, Piper, VITS, MeloTTS
- 500 tegngrense
- 3 gen/time (ingen konto)
Starter
500 kreditter per måned
- Alle 22+ modeller
- 5000 tegngrense
- Stemmekloning
Pro
2 000 kreditter per måned
- Alt i starten
- API- tilgang
- Prioritetsbehandling
Ofte stilte spørsmål
Start å bruke AI- stemme i dag
Bli med i utviklere, utviklere og virksomheter ved hjelp av TTS.ai