IA libre Texto a hablar
20+ modelos de código abierto, 107+ voces, 32+ idiomas. No se requiere ninguna cuenta.
Todo lo que necesitas para la voz IA
30+ herramientas alimentadas por modelos de IA de código abierto
20+ Modelos de voz AI
La colección más completa de modelos TTS de código abierto en una sola plataforma
Kokoro Free
Kokoro es un modelo de texto a voz de 82 millones de parámetros que golpea muy por encima de su clase de peso. A pesar de su pequeño tamaño, produce un discurso notablemente natural y expresivo. Kokoro soporta múltiples idiomas, incluyendo inglés, japonés, chino y coreano con una variedad de voces expresivas. Funciona increíblemente rápido, generando audio casi 100 veces más rápido que en tiempo real en una GPU.
Lo mejor para: TTS de alta calidad con una latencia mínima, aplicaciones de streaming
Probar gratis
Piper Free
Piper es un ligero motor de texto a voz desarrollado por Rhasspy que utiliza arquitecturas VITS y larynx. Funciona completamente en CPU, por lo que es ideal para dispositivos de borde, domótica y aplicaciones que requieren TTS sin conexión. Con más de 100 voces en más de 30 idiomas, Piper ofrece un sonido natural a velocidades en tiempo real incluso en un Raspberry Pi 4.
Lo mejor para: Previsualizaciones rápidas, accesibilidad y aplicaciones integradas
Probar gratis
VITS Free
VITS (Inferencia Variacional con aprendizaje contradictorio para texto a voz de extremo a extremo) es un método TTS paralelo de extremo a extremo que genera audio sonoro más natural que los modelos actuales de dos etapas. Adopta inferencia variacional aumentada con flujos normalizadores y un proceso de entrenamiento contradictorio, logrando una mejora significativa en la naturalidad.
Lo mejor para: Texto a voz de uso general con prosodia natural
Probar gratis
MeloTTS Free
MeloTTS by MyShell.ai es una biblioteca multilingüe de TTS que soporta inglés (estadounidense, británico, indio, australiano), español, francés, chino, japonés y coreano. Es extremadamente rápido, procesando texto a una velocidad casi en tiempo real solo en la CPU. MeloTTS está diseñado para su uso en la producción y soporta la inferencia de CPU y GPU.
Lo mejor para: Aplicaciones de producción que necesitan TTS rápido y multilingüe
Probar gratis
Bark Standard
Modelo de texto a audio basado en transformadores que genera efectos de voz, música y sonido realistas.
Desarrollador: Suno · Licencia: MIT
Pruébalo.
Bark Small Standard
Versión más ligera de Bark con una inferencia más rápida y un menor uso de memoria.
Desarrollador: Suno · Licencia: MIT
Pruébalo.
CosyVoice 2 Standard
La escalable transmisión TTS de Alibaba con naturalidad de paridad humana y latencia casi cero.
Desarrollador: Alibaba (Tongyi Lab) · Licencia: Apache 2.0
Pruébalo.
Dia TTS Standard
Modelo de generación de diálogos multi-parlantes que crea conversaciones naturales entre altavoces.
Desarrollador: Nari Labs · Licencia: Apache 2.0
Pruébalo.
Parler TTS Standard
Describa la voz que desea en lenguaje natural y Parler genera el discurso correspondiente.
Desarrollador: Hugging Face · Licencia: Apache 2.0
Pruébalo.
GLM-TTS Standard
Alcanza la tasa de error de carácter más baja entre los modelos TTS de código abierto.
Desarrollador: Zhipu AI · Licencia: GLM-4 License
Pruébalo.
IndexTTS-2 Standard
TTS de tiro cero con control emocional de grano fino y alta expresividad.
Desarrollador: Index Team · Licencia: Bilibili Model License
Pruébalo.
Spark TTS Standard
Clonación de voz TTS con emoción controlable y estilo de habla a través de avisos.
Desarrollador: SparkAudio · Licencia: CC BY-NC-SA 4.0
Pruébalo.
GPT-SoVITS Standard
Pocas imágenes de clonación de voz TTS que replica cualquier voz de sólo 5 segundos de audio.
Desarrollador: RVC-Boss · Licencia: MIT
Pruébalo.
Orpheus Standard
Modelo de TTS emocional a nivel humano entrenado en datos de 100K horas de habla.
Desarrollador: Canopy Labs · Licencia: Llama 3.2 Community
Pruébalo.
Qwen3 TTS Standard
TTS multilingüe de Alibaba con clonación de voz, voces preestablecidas y diseño de voz a partir de texto.
Desarrollador: Alibaba (Qwen) · Licencia: Apache 2.0
Pruébalo.
CosyVoice 2
La escalable transmisión TTS de Alibaba con naturalidad de paridad humana y latencia casi cero.
Idiomas: en, zh, ja, ko, fr, de, it, es
Voz clonada
GLM-TTS
Alcanza la tasa de error de carácter más baja entre los modelos TTS de código abierto.
Idiomas: en, zh
Voz clonada
IndexTTS-2
TTS de tiro cero con control emocional de grano fino y alta expresividad.
Idiomas: en, zh
Voz clonada
Spark TTS
Clonación de voz TTS con emoción controlable y estilo de habla a través de avisos.
Idiomas: en, zh
Voz clonada
GPT-SoVITS
Pocas imágenes de clonación de voz TTS que replica cualquier voz de sólo 5 segundos de audio.
Idiomas: en, zh, ja, ko
Voz clonada
Chatterbox
La clonación de voz de última generación con cero disparos con control de emociones de Resemble AI.
Idiomas: en
Voz clonada
Tortoise TTS
Texto a voz multi-voz centrado en la calidad con arquitectura autorregresiva.
Idiomas: en
Voz clonada
OpenVoice
Clonación instantánea de voz con control granular sobre el estilo, la emoción y el acento.
Idiomas: en, zh, ja, ko, fr, de, es, it
Voz clonada
Qwen3 TTS
TTS multilingüe de Alibaba con clonación de voz, voces preestablecidas y diseño de voz a partir de texto.
Idiomas: en, zh, ja, ko, de, fr, ru, pt, es, it
Voz clonadaAPI de desarrollador-primero
API REST compatible con OpenAI. Un punto final, más de 22 modelos. Soporte de transmisión para aplicaciones en tiempo real.
- Formato compatible con OpenAI
- Streaming TTS para aplicaciones en tiempo real
- Procesamiento por lotes para grandes puestos de trabajo
- Notificaciones de Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Precios simples y transparentes
Empieza gratis. Escala a medida que creces.
Libre
15.000 caracteres
- Kokoro, Piper, VITS, MeloTTS
- Límite de 500 caracteres
- 3 gen/hora (sin cuenta)
Iniciador
500 créditos/mes
- Todos los 22+ modelos
- 100.000 caracteres por generación
- Clonación de voz
Pro
2.000 créditos/mes
- Todo en Starter
- Acceso a la API
- Tratamiento prioritario
Preguntas frecuentes
Comience a usar la voz de IA hoy
Únase a creadores, desarrolladores y empresas que utilizan TTS.ai