Obre el text font als models de veu
Cada model TTS de la nostra plataforma és una font oberta amb llicències comercials. MIT, Apache 2. 0 no propietari de blocar, sense restriccions d' ús, ni taxa de llicència sorpresa. Useu- les a través de la nostra API allotjada, o auto- màquina per a ells en la vostra pròpia infraestructura amb tot el control.
Intenta-ho ara
Open TTS Benewits
Per què els models de codi obert importen els vostres projectes
Totes les llicències de l' Open-Font
Cada model de TTS.ai usa una llicència permissiva de codi obert. No hi ha caixes negres propietari, ni distribuïdores, ni taxa de llicència inesperada.
MIT / Apache 2. 0
Els models són amb llicència de l' MIT o Apache 2. 0, les llicències de codi obert més persistents. Useu comercialment, modifiqueu, redistribuir no restriccions.
Auto- Hostible
Descarrega qualsevol model i executa' l en el vostre propi maquinari. Control complet sobre les vostres dades, retardencs i infraestructures. No es requereix dependència de núvol.
Optimitzat de la GPU
Els models són optimitzats per a les GPUs NVIDIA amb implementació de CUDA. El conducte només s' executa a la CPU. La majoria dels models només necessiten 2- 8GB VRAM per a una inferència eficient.
Comunitat mantéda
Les comunitats de codi obert actives mantenen i milloren aquests models. Les cotribucions donen errors, millores i noves veus a GitHub.
Compressiu- lo bé
Tots els models permeten l'ús comercial sota les seves llicències. Construïu productes, venen serveis, i creen continguts comercials sense reials o honoraris d'ús.
El nostre catàleg de model font obert
Cada model, la seva llicència, i el que fa millor
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Millor per a: Apache 2. 0 millor model lliure de qualitat, 82M params, fàcil d'auto-ordinador
Intenta- ho Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Millor per a: Només CPU de MIT, perfecte per a dispositius de vora i auto-ordinadors incrustats
Intenta- ho Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Millor per a: arquitectura fundació de MIT usada per molts models membres del MIT
Intenta- ho VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Millor per a: Aplicació única de generació d'àudio del MIT, més enllà del TTS estàndard
Intenta- ho Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Millor per a: Apache 2. 0 qualitat màxima, s' ha estudiat àmpliament la implementació de referència
Intenta- ho Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Millor per a: Una clonació de veu de l'Ectx- source amb control d'estil granular
Intenta- ho OpenVoiceCom usar TTS de codi font obert
Useu el nostre API i executeu models vós mateixos
Exploreu models d' Open-Fonts
Navegueu pel nostre catàleg de models TTS de 20+ oberts. Cada pàgina de model mostra la llicència, arquitectura, capacitats i requisits d' auto- màquina.
Prova en el vostre navegador
Prova directament en TTS.ai sense instal· lar res. Els nostres servidors de la GPU es poden avaluar la qualitat abans de cometre auto- màquina.
L' autoHost o l' ús de la nostra API
El model clon reposit des de GitHub i s' executa localment, o utilitza la nostra API allotjada per a la producció. L' auto- màquina dóna tot el control; la nostra API proveeix infraestructures gestionades.
Construeix la vostra aplicació
Integrat TTS en el vostre producte usant models autohosteds o la nostra API REST. Tots els models són usables comercialment sense taxa de llicència o reials.
Comparació de la llicència
Tots els models de TTS.ai usen llicències comercials amb facilitat de codi obert
| Model | Llicència | Ús comercial | Modificació | Auto- HostCity name (optional, probably does not need a translation) | Attribució |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Requerit | |||
| Piper | MIT | Opcional | |||
| VITS | MIT | Opcional | |||
| MeloTTS | MIT | Opcional | |||
| Chatterbox | MIT | Opcional | |||
| Tortoise TTS | Apache 2.0 | Requerit | |||
| StyleTTS 2 | MIT | Opcional | |||
| OpenVoice | MIT | Opcional | |||
| Sesame CSM | Apache 2.0 | Requerit | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Self- Hosting contra l' API en contra de la màquina
Executeu models vosaltres mateixos o deixeu-nos gestionar la infraestructura
Host al vostre maquinari
Cada model de TTS.ai està disponible com a un projecte de codi obert a GitHub o Abraçador Face. Baixeu els pesos, instal· leu les dependències i executeu la inferència a les vostres estimada GPU. Teniu un control complet sobre la tardència, la privacitat i l' escalat.
- La privacitat completa de les dades ascii mai deixa el vostre servidor
- No hi ha costos per contrasenya després de l' arranjament inicial
- A mida, bé, en les vostres pròpies dades
- Requereix maquinari de la GPU (NVIDIA recomanat)
- Gestioneu actualitzacions, escalat i dependències
Usa l' API TTS.ai Host
Obtenir accés instantani a tots els 24+ models a través d' una única API REST. Mantenim actualitzacions de la GPU, model, gestió de cues i escalat. Una clau API us dona accés a tots els models no cal gestionar desplegaments separats.
- No cal maquinari de la GPU
- Tots els 24+ models a través d' una API
- Actualitzacions automàtiques del model i millores
- 99. 99. 99% d' hora amb infraestructura redundant
- Paga només pel que utilitzeu
Inici ràpid: API o auto-Host
Usa la nostra API allotjada, o instal·lació de Kokoro localment en minuts
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Font obert, Pericable Afford
La nostra API allotjada fa accessible al TTS de codi obert sense gestionar les GPUs.
Free TierCity name (optional, probably does not need a translation)
$0
50 crèdits en signar
- 4 models de codi obert lliures
- No hi ha signes per a l' ús bàsic
- Ús comercial permès
Iniciador
$9
500 crèdits/ mesos
- Tots els models de codi obert de 24+
- clonació de veu
- Accés de l' API
Pro
$29
2000 crèdits/ mesos
- Processament de la GPU de prioritat
- Tots els models de gràcia
- Implementació de l'Enterprise
Preguntes més freqüents
Preguntes comunes quant al text de codi font obert a la parla
Prova d' obrir el TTS d' avui
Models de 24+ de codi obert, tots els anuncis de llicència. Useu la nostra API o l' autohost- Bus, l' elecció és vostra.