Modelos de texto a voz de código aberto
Cada modelo TTS da nosa plataforma é de código aberto con licenzas comerciais amigables. MIT, Apache 2. 0 — sen restricións de propiedade, sen restricións de uso, sen taxas de licenza inesperadas. Úsaos a través da nosa API aloxada, ou aloxaos na túa propia infraestrutura con control total.
Probalo agora
Vantaxes do TTS de código aberto
Por que os modelos de código aberto son importantes para os seus proxectos
Todos con licenza de código aberto
Cada modelo en TTS.ai usa unha licenza permisiva de código aberto. Sen caixas negras propietarias, sen bloqueo de vendedor, sen taxas de licenza inesperadas.
MIT / Apache
Os modelos están licenciados baixo MIT ou Apache 2. 0, as licenzas de código aberto máis permisivas. Pódese usar comercialmente, modificar, redistribuír, sen restricións.
Autoservible
Obteña calquera modelo e executeo no seu propio hardware. Control total sobre os seus datos, latencia e infraestrutura. Non require dependencia da nube.
Optimizado para GPU
Os modelos están optimizados para GPU NVIDIA con soporte CUDA. Piper só se executa na CPU. A maioría dos modelos precisan de 2 a 8 GB de VRAM para unha inferencia eficiente.
Mantida pola comunidade
Comunidades activas de código aberto manteñen e melloran estes modelos. As contribucións son benvidas: envíe erros, melloras e novas voces en GitHub.
Uso comercial aceptado
Todos os modelos permiten o uso comercial baixo as súas licenzas. Construa produtos, venda servizos e cree contido comercial sen royalties nin taxas de uso.
O noso catálogo de modelos de código aberto
Cada modelo, a súa licenza e o que mellor fai
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Mellor para: Apache 2. 0 - modelo libre de mellor calidade, 82M parámetros, fácil de auto- aloxar
Probar Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Mellor para: MIT — só CPU, perfecto para dispositivos periféricos e autoaloxamento incorporado
Probar Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Mellor para: MIT — arquitectura fundamental usada por moitos modelos subseguintes
Probar VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Mellor para: MIT — capacidades únicas de xeración de son máis alá do TTS estándar
Probar Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Mellor para: Apache 2. 0 - máxima calidade, implementación de referencia amplamente estudada
Probar Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Mellor para: MIT — clonación de voz de código aberto con control de estilo granular
Probar OpenVoiceComo usar TTS de código aberto
Empregue a nosa API aloxada ou execute modelos vostede mesmo
Explore modelos de código aberto
Examine o noso catálogo de máis de 20 modelos de TTS de código aberto. Cada páxina de modelo mostra a licenza, a arquitectura, as capacidades e os requisitos de autoaloxamento.
Probar no navegador
Probe calquera modelo directamente en TTS.ai sen instalar nada. Os nosos servidores de GPU xestionan o procesamento para que poida avaliar a calidade antes de comprometerse co autoaloxamento.
Autoaloxamento ou usar a nosa API
Clone repositorios de modelos desde GitHub e execute localmente, ou empregue a nosa API aloxada para produción. O autoaloxamento dá control total; a nosa API proporciona infraestrutura xestionada.
Cree o seu propio programa
Integre TTS no seu produto empregando modelos autoaloxados ou a nosa API REST. Todos os modelos son utilizables comercialmente sen taxas de licenza nin royalties.
Comparación de licenzas
Todos os modelos de TTS.ai usan licenzas de código aberto comerciais
| Modelo | Licenza | Uso comercial | Modificación | Servidor automático | Atribución |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Requirido | |||
| Piper | MIT | Opcional | |||
| VITS | MIT | Opcional | |||
| MeloTTS | MIT | Opcional | |||
| Chatterbox | MIT | Opcional | |||
| Tortoise TTS | Apache 2.0 | Requirido | |||
| StyleTTS 2 | MIT | Opcional | |||
| OpenVoice | MIT | Opcional | |||
| Sesame CSM | Apache 2.0 | Requirido | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Autoaloxamento vs API aloxada
Execute os modelos vostede mesmo ou deixe que nos encarguemos da infraestrutura
Autoservizo no hardware
Cada modelo de TTS.ai está dispoñíbel como proxecto de código aberto en GitHub ou Hugging Face. Descargue os pesos, instale as dependencias e execute a inferencia nas súas propias GPU. Ten control total sobre a latencia, a privacidade e o escalado.
- Privacidade completa dos datos: o son nunca sae do servidor
- Sen custos por petición despois da configuración inicial
- Afinación personalizada dos seus propios datos
- Require hardware de GPU (recoméndase NVIDIA)
- Xestione actualizacións, escalado e dependencias
Empregar a API aloxada de TTS. ai
Obteña acceso instantáneo a máis de 24 modelos a través dunha única API REST. Xestionamos o aprovisionamento de GPU, as actualizacións de modelos, a xestión de filas e o escalado. Unha chave de API dá acceso a todos os modelos, sen necesidade de xestionar implementacións separadas.
- Non se precisa hardware de GPU
- Todos os 24+ modelos a través dunha API
- Actualizacións e melloras automáticas do modelo
- Tempo de actividade do 99,9% con infraestrutura redundante
- Pague só polo que use
Inicio rápido: API ou autoservizo
Empregue a nosa API aloxada ou instale Kokoro localmente en minutos
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Código aberto, prezos asequibles
A nosa API aloxada fai accesible o TTS de código aberto sen xestionar GPUs.
Nivel libre
$0
50 créditos ao rexistrarse
- 4 modelos de código aberto gratuítos
- Non hai rexistro para o uso básico
- Uso comercial permitido
Iniciador
$9
500 créditos/mes
- Todos os 24+ modelos de código aberto
- Clonaxe de voz
- Acceso á API
Pro
$29
2000 créditos/mes
- Prioridade no procesamento da GPU
- Todos os modelos premium
- Soporte empresarial
Preguntas frecuentes
Preguntas frecuentes sobre a síntese de voz de código aberto
Probe hoxe o TTS de código aberto
Máis de 24 modelos de código aberto, todos con licenza comercial. Utilice a nosa API ou auto-host, a elección é súa.