Fritt AI Text till tal
31+ modeller med öppen källkod, 231+ röster, 34+ Språk. Inget konto krävs.
Allt du behöver för röst AI
30+ verktyg som drivs av AI-modeller med öppen källkod
31+ AI röstmodeller
Den mest omfattande samlingen av TTS-modeller med öppen källkod i en och samma plattform
Kokoro Free
Kokoro är en 82 miljoner parameter text-till-tal modell som slår väl över sin viktklass. Trots sin lilla storlek, det producerar anmärkningsvärt naturligt och uttrycksfullt tal. Kokoro stöder flera språk, inklusive engelska, japanska, kinesiska och koreanska med en mängd olika uttrycksfulla röster. Den kör otroligt snabbt - generera ljud nästan 100x snabbare än realtid på en GPU.
Bäst för: Högkvalitativ TTS med minimal latens, strömmande applikationer
Försök gratis
Piper Free
Piper är en lättviktig text-till-tal motor utvecklad av Rhasspy som använder VITS och struphuvud arkitekturer. Den körs helt på CPU, vilket gör den idealisk för kantenheter, hemautomation och applikationer som kräver offline TTS. Med över 100 röster över 30+ språk, Piper levererar naturligt ljudande tal i realtid hastigheter även på en Raspberry Pi 4.
Bäst för: Snabb förhandsvisning, tillgänglighet och inbyggda program
Försök gratis
VITS Free
VITS (Variarational Inference with adversarial learning for end-to-end Text-to-Speech) är en parallell end-to-end TTS-metod som genererar mer naturligt ljud än nuvarande tvåstegsmodeller. Den antar variationell inference förstärkt med normaliserade flöden och en kontraarial träningsprocess, vilket ger en betydande förbättring i naturlighet.
Bäst för: Allmän text-till-tal med naturlig prosody
Försök gratis
MeloTTS Free
Melotts by MyShell.ai är ett flerspråkigt TTS-bibliotek som stöder engelska (amerikanska, brittiska, indiska, australiska), spanska, franska, kinesiska, japanska och koreanska. Det är extremt snabbt, bearbeta text i nära realtid på CPU ensam. Melotts är utformad för produktion och stöder både CPU och GPU inference.
Bäst för: Produktionstillämpningar som behöver snabba, flerspråkiga TTS
Försök gratis
OuteTTS Free
Outetts utökar stora språkmodeller med text-till-tal-funktioner samtidigt som den ursprungliga arkitekturen bevaras. Den stöder flera bakgrundsprogram, inklusive lama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, och även webbläsarinferens via Transformers.js. Funktioner noll-shot röst kloning genom högtalarprofiler sparade som JSON.
Bäst för: Kantutbyggnad, webbläsarbaserade TTS-miljöer med låg resursförbrukning
Försök gratis
Pocket TTS Free
Pocket TTS by Kyutai (skapare av Moshi) är en kompakt 100M parameter text-till-tal modell som slår väl över sin vikt. Den körs effektivt på CPU, stöder noll-shot röst kloning från ett enda ljudprov, och producerar naturligt ljudande tal. Den lilla modellstorleken gör den idealisk för kant distribution och låg-resurs miljöer.
Bäst för: Lättviktsutbyggnad, CPU-bara miljöer, snabb röstkloning
Försök gratis
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
Bäst för: Fast lightweight TTS, edge deployment, low-latency applications
Försök gratis
Bark Standard
Transformatorbaserad text-till-audio modell som genererar realistiska tal, musik och ljudeffekter.
Utvecklare: Suno · Licens: MIT
Försök.
Bark Small Standard
Lättare version av Bark med snabbare slutledning och lägre minnesanvändning.
Utvecklare: Suno · Licens: MIT
Försök.
CosyVoice 2 Standard
Alibaba skalbara strömmande TTS med mänsklig-paritet naturlighet och nära-noll latency.
Utvecklare: Alibaba (Tongyi Lab) · Licens: Apache 2.0
Försök.
Dia TTS Standard
Flertaltalsdialogruta generation modell som skapar naturliga samtal mellan talare.
Utvecklare: Nari Labs · Licens: Apache 2.0
Försök.
Parler TTS Standard
Beskriv den röst du vill ha i naturligt språk och Parler genererar matchande tal.
Utvecklare: Hugging Face · Licens: Apache 2.0
Försök.
GLM-TTS Standard
Uppnåter den lägsta felfrekvensen för tecken bland TTS-modeller med öppen källkod.
Utvecklare: Zhipu AI · Licens: GLM-4 License
Försök.
IndexTTS-2 Standard
Noll-shot TTS med finkornig känslokontroll och hög uttrycksfullhet.
Utvecklare: Index Team · Licens: Bilibili Model License
Försök.
Spark TTS Standard
Röstkloning TTS med kontrollerbara känslor och talstil via samtal.
Utvecklare: SparkAudio · Licens: CC BY-NC-SA 4.0
Försök.
GPT-SoVITS Standard
Få skott röst kloning TTS som replikerar någon röst från bara 5 sekunder av ljud.
Utvecklare: RVC-Boss · Licens: MIT
Försök.
Orpheus Standard
Känslomässig TTS-modell tränad på 100K timmars taldata.
Utvecklare: Canopy Labs · Licens: Llama 3.2 Community
Försök.
Qwen3 TTS Standard
Alibabas flerspråkiga TTS med röstkloning, förinställda röster och röstdesign från text.
Utvecklare: Alibaba (Qwen) · Licens: Apache 2.0
Försök.
Chatterbox Turbo Standard
Snabbare Chatterbox med sub-200ms latens och paralinguistiska taggar för skratt, hosta och mycket mer.
Utvecklare: Resemble AI · Licens: MIT
Försök.
Dia 2 Standard
Strömmande-första konversations-TTS med flertalsdialog och paralinguistiska signaler.
Utvecklare: Nari Labs · Licens: Apache 2.0
Försök.
VoxCPM Standard
Tokenizer-fri TTS som producerar 44,1kHz ljud med sammanhangsmedveten styckekonsistens.
Utvecklare: OpenBMB · Licens: Apache 2.0
Försök.
TADA Standard
Noll-hallucination TTS med textakustisk dubbeljustering, 5x snabbare än jämförbara LLM TTS.
Utvecklare: Hume AI · Licens: MIT
Försök.
VibeVoice Standard
Microsoft modell för lång form multi-högtalare innehåll som podcasts och ljudböcker.
Utvecklare: Microsoft · Licens: MIT
Försök.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Utvecklare: Alibaba (FunAudioLLM) · Licens: Apache 2.0
Försök.
CosyVoice 2
Alibaba skalbara strömmande TTS med mänsklig-paritet naturlighet och nära-noll latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klonröst
GLM-TTS
Uppnåter den lägsta felfrekvensen för tecken bland TTS-modeller med öppen källkod.
Språk: en, zh
Klonröst
IndexTTS-2
Noll-shot TTS med finkornig känslokontroll och hög uttrycksfullhet.
Språk: en, zh
Klonröst
GPT-SoVITS
Få skott röst kloning TTS som replikerar någon röst från bara 5 sekunder av ljud.
Språk: en, zh, ja, ko
Klonröst
Chatterbox
Toppmodern nollshotad röstkloning med känslokontroll från Resemble AI.
Språk: en
Klonröst
Tortoise TTS
Flera rösttext-till-tal fokuserade på kvalitet med autoregressiv arkitektur.
Språk: en
Klonröst
OpenVoice
Omedelbar röst kloning med granulär kontroll över stil, känslor och accent.
Språk: en, zh, ja, ko, fr, de, es, it
Klonröst
Qwen3 TTS
Alibabas flerspråkiga TTS med röstkloning, förinställda röster och röstdesign från text.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonröst
Chatterbox Turbo
Snabbare Chatterbox med sub-200ms latens och paralinguistiska taggar för skratt, hosta och mycket mer.
Språk: en
Klonröst
VoxCPM
Tokenizer-fri TTS som producerar 44,1kHz ljud med sammanhangsmedveten styckekonsistens.
Språk: en, zh
Klonröst
OuteTTS
LLM-baserade TTS som körs på CPU, GPU, eller webbläsare via lama.cpp och Transformers.js.
Språk: en
Klonröst
Pocket TTS
Lätt 100M parameter modell av Kyutai med röst kloning från ett enda prov.
Språk: en, fr
Klonröst
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Språk: en, zh, ja, ko, de, es, fr, it, ru
Klonröst
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Språk: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klonröst
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Språk: en, zh
KlonröstUtvecklar-första API
OpenAI-kompatibelt REST API. En endpoint, 22+ modeller. Streaming stöd för realtidsapplikationer.
- OpenAI-kompatibelt format
- Strömma TTS för realtidsappar
- Partibearbetning för stora arbetstillfällen
- Webhook-anmälningar
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel, transparent prissättning
Börja gratis, skala när du växer.
Avgiftsfri
15 hp
- Kokoro, Piper, VITS, MeloTTS
- Gräns för 500 tecken
- 3 gen/timme (utan konto)
Uppstart
500 hp/månad
- Alla 22+ modeller
- 100 000 rödingar per generation
- Röstförslutning
För
2000 krediter/månad
- Allt i början
- API-åtkomst
- Prioriterad behandling
Vanliga frågor
Vad kan vi förbättra? Din feedback hjälper oss att lösa problem.
Börja använda AI röst idag
Gå med skapare, utvecklare och företag som använder TTS.ai