Open brontekst naar spraakmodellen

Elk TTS-model op ons platform is open source met commercieel-vriendelijke licenties. MIT, Apache 2.0 is geen eigen lock-in, geen gebruiksbeperkingen, geen verrassing licentiekosten. Gebruik ze via onze gehoste API, of zelf-host ze op uw eigen infrastructuur met volledige controle.

Bron openen MIT-licentie Apache 2.0 Zelfvoorzienend GitHub

Probeer het nu.

Gratis met Kokoro, Piper, VITS, MeloTTS
Uw gegenereerde audio zal hier verschijnen
Gegenereerd
Downloaden
Hou van TTS.ai? Vertel het je vrienden!

Open Source TTS Voordelen

Waarom open-source modellen belangrijk zijn voor uw projecten

Alle Open-Bron Licensed

Elk model op TTS.ai maakt gebruik van een permissieve open-source licentie. Geen eigen zwarte dozen, geen leverancier lock-in, geen onverwachte licentiekosten.

MIT / Apache 2.0

Modellen zijn gelicentieerd onder MIT of Apache 2.0, de meest permissieve open-source licenties. Gebruik commercieel, wijzigen, herdistribueren en geen beperkingen.

Zelfvoorzienend

Download elk model en voer het uit op uw eigen hardware. Volledige controle over uw gegevens, latency, en infrastructuur. Geen cloud afhankelijkheid vereist.

GPU geoptimaliseerd

Modellen zijn geoptimaliseerd voor NVIDIA GPU's met CUDA ondersteuning. Piper draait alleen op CPU. De meeste modellen hebben 2-8GB VRAM nodig voor een efficiënte interpretatie.

Gehandhaafd

Actieve open-source communities onderhouden en verbeteren van deze modellen. Bijdragen verwelkomen Bugs, verbeteringen en nieuwe stemmen op GitHub indienen.

Commercieel gebruik OK

Alle modellen maken commercieel gebruik onder hun licenties. Bouw producten, verkoop diensten, en maak commerciële inhoud zonder royalty's of gebruikskosten.

Onze Open Source Model Catalogus

Elk model, zijn licentie, en wat het het beste doet

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Beste voor: Apache 2.0 beste kwaliteit gratis model, 82M params, gemakkelijk te zelf-hosten

Proberen Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Beste voor: MIT alleen CPU, perfect voor randapparatuur en embedded self-hosting

Proberen Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Beste voor: MIT basisarchitectuur gebruikt door vele downstream modellen

Proberen VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Beste voor: MIT unieke audio generatie mogelijkheden voorbij standaard TTS

Proberen Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Stemklonen

Beste voor: Apache 2.0 maximumkwaliteit, breed bestudeerde referentie-implementatie

Proberen Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Stemklonen

Beste voor: Open-source voice klonen met multiple style control

Proberen OpenVoice

Hoe Open Source TTS te gebruiken

Gebruik onze gehoste API of voer zelf modellen uit

1

Explore Open-Source modellen

Blader door onze catalogus van 20+ open-source TTS modellen. Elke model pagina toont de licentie, architectuur, mogelijkheden, en self-hosting eisen.

2

Probeer in uw browser

Test elk model direct op TTS.ai zonder iets te installeren. Onze GPU-servers verwerken de verwerking zodat u de kwaliteit kunt evalueren voordat u zich verbindt tot zelfhosting.

3

Zelfgast of gebruik onze API

Kloon model repo's van GitHub en lokaal draaien, of gebruik onze gehoste API voor de productie. Zelfhosting geeft volledige controle; onze API biedt beheerde infrastructuur.

4

Bouw uw toepassing

Integreer TTS in uw product met behulp van zelf-gehoste modellen of onze REST API. Alle modellen zijn commercieel bruikbaar zonder licentiekosten of royalty's.

Licentievergelijking

Alle modellen op TTS.ai maken gebruik van commercieel-vriendelijke open-source licenties

Model Licentie Commercieel gebruik Wijziging Zelfgast Attribution
Kokoro Apache 2.0 Vereist
Piper MIT Facultatief
VITS MIT Facultatief
MeloTTS MIT Facultatief
Chatterbox MIT Facultatief
Tortoise TTS Apache 2.0 Vereist
StyleTTS 2 MIT Facultatief
OpenVoice MIT Facultatief
Sesame CSM Apache 2.0 Vereist
Orpheus Llama 3.2 "Built with Llama"

Self-Hosting vs Hosted API

Start zelf modellen of laat ons de infrastructuur beheren

Self-Host op uw hardware

Elk model op TTS.ai is beschikbaar als een open-source project op GitHub of Hugging Face. Download de gewichten, installeer de afhankelijkheden, en run gevolgtrekkingen op uw eigen GPU's. U hebt volledige controle over latency, privacy en schaalvergroting.

  • Volledige privacy van gegevens De audio verlaat nooit uw server
  • Geen kosten per aanvraag na de eerste opzet
  • Aangepaste fine-tuning op uw eigen gegevens
  • Vereist GPU hardware (NVIDIA aanbevolen)
  • U beheert updates, schaalvergroting en afhankelijkheden

Gebruik TTS.ai gehoste API

Krijg direct toegang tot alle 20+ modellen door middel van een enkele REST API. Wij behandelen GPU provisioning, model updates, wachtrijbeheer en schaalvergroting. Eén API sleutel geeft u toegang tot elk model en hoeft geen aparte implementaties te beheren.

  • Geen GPU hardware nodig
  • Alle 20+ modellen via één API
  • Automatische modelupdates en verbeteringen
  • 99,9% uptime met overbodige infrastructuur
  • Alleen betalen voor wat u gebruikt

Snelstart: API of Zelf-Host

Gebruik onze gehoste API, of installeer Kokoro lokaal in minuten

Optie 1: TTS.ai Hosted API Gemakkelijkst
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Optie 2: Zelfgast met pip Volledige controle
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Open Bron, Betaalbare Prijzen

Onze gehoste API maakt open-source TTS toegankelijk zonder het beheer van GPU's.

Vrij niveau

$0

15.000 tekens bij aanmelding

  • 4 open-source modellen gratis
  • Geen aanmelding voor basisgebruik
  • Commercieel gebruik toegestaan

Starter

$9

500.000 tekens/maand

  • Alle 20+ open-source modellen
  • Klonen van stemmen
  • API-toegang

Pro

$29

2.000.000 tekens/maand

  • Prioritaire GPU-verwerking
  • Alle premiemodellen
  • Steun aan ondernemingen
Volledige prijzen weergeven

Veelgestelde vragen

Gemeenschappelijke vragen over open source-tekst voor spraak

Ja. Elk model op TTS.ai maakt gebruik van een permissieve open-source licentie, MIT of Apache 2.0. Wij sluiten specifiek modellen uit met beperkende licenties (zoals Coqui's CPML of niet-commerciële CC-BY-NC). U kunt de licentie van elk model controleren op de GitHub repository.

Beide zijn permissieve open-source licenties die commercieel gebruik, wijziging en herverdeling mogelijk maken. Apache 2.0 voegt expliciete patentsubsidies toe en vereist wijzigingen als u de code wijzigt. MIT is eenvoudiger met minder eisen. Beide zijn zakelijk-vriendelijk.

Ja. Elk model kan worden zelf-hosted. Kloon de model repository van GitHub, install afhankelijkheden, download modelgewichten, en run gevolgtrekkingen. Wij bieden documentatie voor elk model zelf-hosting eisen, waaronder GPU, RAM en Python versie.

Vereisten variëren per model. Piper heeft geen GPU (alleen CPU) nodig. Kokoro en MeloTTS hebben 1-2GB VRAM nodig. De meeste standaardmodellen hebben 4GB VRAM nodig. Tortoise en Sesam CSM hebben 8GB nodig. Een NVIDIA RTX 3060 (12GB) kan de meeste modellen comfortabel draaien.

Ja. Open-source licenties kunnen worden aangepast, inclusief fine-tuning. Modellen zoals GPT-SoVITS en Bark bieden fine-tuning scripts. U kunt modellen trainen op uw eigen spraakgegevens om aangepaste stemmen te creëren of de prestaties voor specifieke talen te verbeteren.

Top open-source modellen (Kokoro, StyleTTS 2, Chatterbox) nu overeenkomen of overtreffen commerciële diensten zoals ElfLabs en Google TTS in kwaliteit benchmarks. Het belangrijkste voordeel van commerciële diensten is beheerd infrastructuur en ondersteuning, niet audiokwaliteit.

We hebben ze al uitgesloten. XTTS/XTTS-v2 (Coqui's CPML, niet-commercieel), F5-TTS (CC-BY-NC, niet-commercieel), en Higgs-v2 (Boson Licentie beperkend) werden allemaal verwijderd. Elk model op TTS.ai is gecontroleerd commercieel-gebruik veilig.

Ja. De meeste modellen accepteren bijdragen van de gemeenschap via GitHub. U kunt bug rapporten, spraakopnames voor nieuwe talen, code verbeteringen en documentatie indienen. Controleer de GitHub repository van elk model voor bijdragen richtlijnen en actieve problemen.

Laad modellen on-demand en ontlaad wanneer inactief om GPU-geheugen te delen. Onze GPU-server draait 20+ modellen op 4x Tesla P40 (96GB totale VRAM) met dynamische loading. Voor zelfhosting kan een enkele 24GB GPU tegelijkertijd 3-5 modellen bedienen.

Veel modellen bieden officiële Docker images of Dockerfiles. Voor het uitvoeren van meerdere modellen, kunt u een aangepaste Docker setup bouwen met NVIDIA Container Toolkit voor GPU toegang. Onze API server architectuur kan dienen als een referentie implementatie.

De meeste modellen vereisen Python 3.10-3.12. Coqui TTS (VITS) heeft specifiek Python 3.11. Wij raden Python 3.12 voor de meeste modellen. Controleer de eisen van elk model.txt voor exacte versiecompatibiliteit.

Ja. MIT- en Apache 2.0-licenties staan expliciet commercieel gebruik toe. U kunt SaaS-producten, mobiele apps, games en diensten bouwen met behulp van deze modellen zonder licentiekosten, royalty's of toeschrijvingsvereisten (hoewel atribution wordt gewaardeerd).
5.0/5 (1)

Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.

Probeer Open bron TTS vandaag

20+ open-source modellen, allemaal commercieel gelicentieerd. Gebruik onze API of self-host.. de keuze is aan u.