Öppna källkodstext till talmodeller
Varje TTS-modell på vår plattform är öppen källkod med kommersiellt-vänliga licenser. MIT, Apache 2.0 – ingen egenutvecklad inlåsning, inga användningsbegränsningar, inga överrasknings licensavgifter. Använd dem genom vårt värd API, eller själv-värd dem på din egen infrastruktur med full kontroll.
Försök nu
Fördelar med öppen källkod för TTS
Varför öppna källkodsmodeller är viktiga för dina projekt
Alla licenserade från öppen källkod
Varje modell på TTS.ai använder en tillåtande öppen källkod licens. Inga egenutvecklade svarta lådor, ingen leverantör lås, inga oväntade licensavgifter.
MIT / Apache 2,0
Modeller är licensierade under MIT eller Apache 2.0, de mest efterlåtna open-source licenser. Använd kommersiellt, ändra, omfördela – inga begränsningar.
Självupptagen
Ladda ner vilken modell som helst och kör den på din egen hårdvara. Full kontroll över dina data, latens och infrastruktur. Inget molnberoende krävs.
GPU optimerad
Modeller är optimerade för NVIDIA GPUs med CUDA-stöd. Piper körs endast på CPU. De flesta modeller behöver 2-8GB VRAM för effektiv inferens.
Upprätthållen gemenskap
Aktiva öppen källkodsgemenskaper underhåller och förbättrar dessa modeller. Bidrag välkomnar – skicka in buggar, förbättringar och nya röster på GitHub.
Kommersiell användning OK
Alla modeller tillåter kommersiell användning under sina licenser. Bygga produkter, sälja tjänster och skapa kommersiellt innehåll utan royaltyer eller användaravgifter.
Vår katalog med öppen källkod
Varje modell, dess licens, och vad den gör bäst
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Bäst för: Apache 2.0 — bästa kvalitet fri modell, 82M params, lätt att själv värd
Försök Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Bäst för: MIT – Endast processor, perfekt för kantenheter och inbyggda självvärdande
Försök Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Bäst för: MIT – grundläggande arkitektur som används av många nedströmsmodeller
Försök VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Bäst för: MIT – unika funktioner för ljudgenerering utöver standard TTS
Försök Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Bäst för: Apache 2.0 – maximal kvalitet, allmänt studerade referensimplementering
Försök Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Bäst för: MIT – röstkloning med öppen källkod med granulär stilkontroll
Försök OpenVoiceHur man använder öppen källkod TTS
Använd vår värd API eller kör modeller själv
Utforska öppna källkodsmodeller
Bläddra i vår katalog över 20 TTS-modeller med öppen källkod. Varje modellsida visar licens-, arkitektur-, kapacitets- och självvärdighetskrav.
Försök i din webbläsare
Testa vilken modell som helst direkt på [TTS.ai] utan att installera något. Våra GPU-servrar hanterar bearbetning så att du kan utvärdera kvalitet innan du åtar dig att självvärd.
Självupptagen eller använd vårt API
Clone modell repo från GitHub och köra lokalt, eller använda vår värd API för produktion. Själv-hosting ger full kontroll; vårt API ger hanterad infrastruktur.
Bygg upp din applikation
Integrera TTS i din produkt med hjälp av egna modeller eller vårt REST API. Alla modeller är kommersiellt användbara utan licensavgifter eller royalties.
Licensjämförelse
Alla modeller på TTS.ai använder kommersiellt användarvänliga licenser med öppen källkod
| Förlaga | Licens | Kommersiell användning | Ändring | Självupptagen | Attribut |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Krävs | |||
| Piper | MIT | Valfri | |||
| VITS | MIT | Valfri | |||
| MeloTTS | MIT | Valfri | |||
| Chatterbox | MIT | Valfri | |||
| Tortoise TTS | Apache 2.0 | Krävs | |||
| StyleTTS 2 | MIT | Valfri | |||
| OpenVoice | MIT | Valfri | |||
| Sesame CSM | Apache 2.0 | Krävs | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Självhosting vs Hosted API
Kör modeller själv eller låt oss hantera infrastrukturen
Självupptagen på din hårdvara
Varje modell på TTS.ai är tillgänglig som ett open-source-projekt på GitHub eller Hugging Face. Ladda ner vikterna, installera beroendena och dra slutsatser på dina egna GPU:er. Du har full kontroll över latens, integritet och skalning.
- Fullständig dataintegritet — ljud lämnar aldrig din server
- Inga kostnader per begäran efter inledande installation
- Anpassad finjustering av dina egna data
- Kräver GPU-hårdvara (NVIDIA rekommenderas)
- Du hanterar uppdateringar, skalning och beroenden
Använd TTS.ai Hosted API
Få omedelbar tillgång till alla 20+ modeller genom ett enda REST API. Vi hanterar GPU-försörjning, modelluppdateringar, köhantering och skalning. En API-nyckel ger dig tillgång till varje modell – du behöver inte hantera separata distributioner.
- Ingen GPU-hårdvara behövs
- Alla 20+ modeller genom ett API
- Automatiska modelluppdateringar och förbättringar
- 99,9 % drifttid med redundant infrastruktur
- Betala bara för det du använder
Snabbstart: API eller självupptagen
Använd vårt värd API, eller installera Kokoro lokalt på några minuter
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Öppna källkod, prisvärd prissättning
Vårt värd API gör öppen källkod TTS tillgänglig utan att hantera GPU:er.
Fri nivå
$0
15 hp vid anmälan
- 4 open-source-modeller gratis
- Ingen registrering för grundläggande användning
- Tillåtet kommersiellt bruk
Uppstart
$9
500.000 tecken/månad
- Alla 20+ open-source-modeller
- Röstkloning
- API-åtkomst
För
$29
2 000 000 tecken/månad
- Prioriterad bearbetning av GPU
- Alla premiummodeller
- Stöd till företag
Vanliga frågor
Vanliga frågor om öppen källkodstext till tal
Vad kan vi förbättra? Din feedback hjälper oss att lösa problem.
Försök med öppen källkod TTS idag
20+ open-source-modeller, alla kommersiellt licensierade. Använd vårt API eller självvärd – valet är ditt.