Fritt AI Text till tal
20+ modeller med öppen källkod, 107+ röster, 32+ Språk. Inget konto krävs.
Allt du behöver för röst AI
30+ verktyg som drivs av AI-modeller med öppen källkod
20+ AI röstmodeller
Den mest omfattande samlingen av TTS-modeller med öppen källkod i en och samma plattform
Kokoro Free
Kokoro är en 82 miljoner parameter text-till-tal modell som slår väl över sin viktklass. Trots sin lilla storlek, det producerar anmärkningsvärt naturligt och uttrycksfullt tal. Kokoro stöder flera språk, inklusive engelska, japanska, kinesiska och koreanska med en mängd olika uttrycksfulla röster. Den kör otroligt snabbt - generera ljud nästan 100x snabbare än realtid på en GPU.
Bäst för: Högkvalitativ TTS med minimal latens, strömmande applikationer
Försök gratis
Piper Free
Piper är en lättviktig text-till-tal motor utvecklad av Rhasspy som använder VITS och struphuvud arkitekturer. Den körs helt på CPU, vilket gör den idealisk för kantenheter, hemautomation och applikationer som kräver offline TTS. Med över 100 röster över 30+ språk, Piper levererar naturligt ljudande tal i realtid hastigheter även på en Raspberry Pi 4.
Bäst för: Snabb förhandsvisning, tillgänglighet och inbyggda program
Försök gratis
VITS Free
VITS (Variarational Inference with adversarial learning for end-to-end Text-to-Speech) är en parallell end-to-end TTS-metod som genererar mer naturligt ljud än nuvarande tvåstegsmodeller. Den antar variationell inference förstärkt med normaliserade flöden och en kontraarial träningsprocess, vilket ger en betydande förbättring i naturlighet.
Bäst för: Allmän text-till-tal med naturlig prosody
Försök gratis
MeloTTS Free
Melotts by MyShell.ai är ett flerspråkigt TTS-bibliotek som stöder engelska (amerikanska, brittiska, indiska, australiska), spanska, franska, kinesiska, japanska och koreanska. Det är extremt snabbt, bearbeta text i nära realtid på CPU ensam. Melotts är utformad för produktion och stöder både CPU och GPU inference.
Bäst för: Produktionstillämpningar som behöver snabba, flerspråkiga TTS
Försök gratis
Bark Standard
Transformatorbaserad text-till-audio modell som genererar realistiska tal, musik och ljudeffekter.
Utvecklare: Suno · Licens: MIT
Försök.
Bark Small Standard
Lättare version av Bark med snabbare slutledning och lägre minnesanvändning.
Utvecklare: Suno · Licens: MIT
Försök.
CosyVoice 2 Standard
Alibaba skalbara strömmande TTS med mänsklig-paritet naturlighet och nära-noll latency.
Utvecklare: Alibaba (Tongyi Lab) · Licens: Apache 2.0
Försök.
Dia TTS Standard
Flertaltalsdialogruta generation modell som skapar naturliga samtal mellan talare.
Utvecklare: Nari Labs · Licens: Apache 2.0
Försök.
Parler TTS Standard
Beskriv den röst du vill ha i naturligt språk och Parler genererar matchande tal.
Utvecklare: Hugging Face · Licens: Apache 2.0
Försök.
GLM-TTS Standard
Uppnåter den lägsta felfrekvensen för tecken bland TTS-modeller med öppen källkod.
Utvecklare: Zhipu AI · Licens: GLM-4 License
Försök.
IndexTTS-2 Standard
Noll-shot TTS med finkornig känslokontroll och hög uttrycksfullhet.
Utvecklare: Index Team · Licens: Bilibili Model License
Försök.
Spark TTS Standard
Röstkloning TTS med kontrollerbara känslor och talstil via samtal.
Utvecklare: SparkAudio · Licens: CC BY-NC-SA 4.0
Försök.
GPT-SoVITS Standard
Få skott röst kloning TTS som replikerar någon röst från bara 5 sekunder av ljud.
Utvecklare: RVC-Boss · Licens: MIT
Försök.
Orpheus Standard
Känslomässig TTS-modell tränad på 100K timmars taldata.
Utvecklare: Canopy Labs · Licens: Llama 3.2 Community
Försök.
Qwen3 TTS Standard
Alibabas flerspråkiga TTS med röstkloning, förinställda röster och röstdesign från text.
Utvecklare: Alibaba (Qwen) · Licens: Apache 2.0
Försök.
CosyVoice 2
Alibaba skalbara strömmande TTS med mänsklig-paritet naturlighet och nära-noll latency.
Språk: en, zh, ja, ko, fr, de, it, es
Klonröst
GLM-TTS
Uppnåter den lägsta felfrekvensen för tecken bland TTS-modeller med öppen källkod.
Språk: en, zh
Klonröst
IndexTTS-2
Noll-shot TTS med finkornig känslokontroll och hög uttrycksfullhet.
Språk: en, zh
Klonröst
GPT-SoVITS
Få skott röst kloning TTS som replikerar någon röst från bara 5 sekunder av ljud.
Språk: en, zh, ja, ko
Klonröst
Chatterbox
Toppmodern nollshotad röstkloning med känslokontroll från Resemble AI.
Språk: en
Klonröst
Tortoise TTS
Flera rösttext-till-tal fokuserade på kvalitet med autoregressiv arkitektur.
Språk: en
Klonröst
OpenVoice
Omedelbar röst kloning med granulär kontroll över stil, känslor och accent.
Språk: en, zh, ja, ko, fr, de, es, it
Klonröst
Qwen3 TTS
Alibabas flerspråkiga TTS med röstkloning, förinställda röster och röstdesign från text.
Språk: en, zh, ja, ko, de, fr, ru, pt, es, it
KlonröstUtvecklar-första API
OpenAI-kompatibelt REST API. En endpoint, 22+ modeller. Streaming stöd för realtidsapplikationer.
- OpenAI-kompatibelt format
- Strömma TTS för realtidsappar
- Partibearbetning för stora arbetstillfällen
- Webhook-anmälningar
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Enkel, transparent prissättning
Börja gratis, skala när du växer.
Avgiftsfri
15 hp
- Kokoro, Piper, VITS, MeloTTS
- Gräns för 500 tecken
- 3 gen/timme (utan konto)
Uppstart
500 hp/månad
- Alla 22+ modeller
- 100,000 chars per generation
- Röstförslutning
För
2000 krediter/månad
- Allt i början
- API-åtkomst
- Prioriterad behandling
Vanliga frågor
Börja använda AI röst idag
Gå med skapare, utvecklare och företag som använder TTS.ai