IA libre Texto a hablar

22+ modelos de código abierto, más de 100 voces, 32+ idiomas. No se requiere ninguna cuenta.

0/500 caracteres Libre
Sin tarjeta de crédito 50 créditos gratuitos 32+ idiomas Uso comercial OK
0:00 / 0:00
Descargar audio Enlace expira en 24h
¡Díselo a tus amigos!

Todo lo que necesitas para la voz IA

26 herramientas alimentadas por más de 24 modelos de IA de código abierto

22+ Modelos de voz AI

La colección más completa de modelos TTS de código abierto en una sola plataforma

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Lo mejor para: High-quality TTS with minimal latency, streaming applications

Probar gratis

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Lo mejor para: Quick previews, accessibility, and embedded applications

Probar gratis

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Lo mejor para: General-purpose text-to-speech with natural prosody

Probar gratis

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Lo mejor para: Aplicaciones de producción que necesitan TTS rápido y multilingüe

Probar gratis

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Desarrollador: Suno · Licencia: MIT

Pruébalo.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Desarrollador: Suno · Licencia: MIT

Pruébalo.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Desarrollador: Alibaba (Tongyi Lab) · Licencia: Apache 2.0

Pruébalo.

Dia TTS Standard

Modelo de generación de diálogos multi-parlantes que crea conversaciones naturales entre altavoces.

Desarrollador: Nari Labs · Licencia: Apache 2.0

Pruébalo.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Desarrollador: Hugging Face · Licencia: Apache 2.0

Pruébalo.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Desarrollador: Index Team · Licencia: Apache 2.0

Pruébalo.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Desarrollador: SparkAudio · Licencia: Apache 2.0

Pruébalo.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Desarrollador: RVC-Boss · Licencia: MIT

Pruébalo.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Desarrollador: Canopy Labs · Licencia: Llama 3.2 Community

Pruébalo.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Desarrollador: Alibaba (Qwen) · Licencia: Apache 2.0

Pruébalo.

Chatterbox Premium

La clonación de voz de última generación con cero disparos con control de emociones de Resemble AI.

Calidad:

Pruébalo.

Tortoise TTS Premium

Texto a voz multi-voz centrado en la calidad con arquitectura autorregresiva.

Calidad:

Pruébalo.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Calidad:

Pruébalo.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Calidad:

Pruébalo.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Idiomas: en, zh, ja, ko, fr, de, it, es

Voz clonada

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Idiomas: en, zh

Voz clonada

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Idiomas: en, zh

Voz clonada

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Idiomas: en, zh, ja, ko

Voz clonada

Chatterbox

La clonación de voz de última generación con cero disparos con control de emociones de Resemble AI.

Idiomas: en

Voz clonada

Tortoise TTS

Texto a voz multi-voz centrado en la calidad con arquitectura autorregresiva.

Idiomas: en

Voz clonada

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Idiomas: en, zh, ja, ko, fr, de, es, it

Voz clonada

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Idiomas: en, zh, ja, ko, de, fr, ru, pt, es, it

Voz clonada

API de desarrollador-primero

API REST compatible con OpenAI. Un punto final, más de 22 modelos. Soporte de transmisión para aplicaciones en tiempo real.

  • Formato compatible con OpenAI
  • Streaming TTS para aplicaciones en tiempo real
  • Procesamiento por lotes para grandes puestos de trabajo
  • Notificaciones de Webhook
Ver los documentos de API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Precios simples y transparentes

Empieza gratis. Escala a medida que creces.

Libre

$0

50 créditos

  • Kokoro, Piper, VITS, MeloTTS
  • Límite de 500 caracteres
  • 3 gen/hora (sin cuenta)
Regístrate gratis

Iniciador

$9/mo

500 créditos/mes

  • Todos los 22+ modelos
  • Límite de 5.000 caracteres
  • Clonación de voz
Empezar
Más populares

Pro

$29/mo

2.000 créditos/mes

  • Todo en Starter
  • Acceso a la API
  • Tratamiento prioritario
Obtener Pro

Empresa

$99/mo

10.000 créditos/mes

  • Todo en Pro
  • API a granel
  • Cola de prioridades
Ventas de contacto

View all plans including credit packs →

Preguntas frecuentes

TTS.ai es la plataforma de voz de IA más completa, que ofrece más de 22 modelos de texto a voz, clonación de voz, voz a texto y herramientas de audio. Todos los modelos son de código abierto sin bloqueo del proveedor.

¡Sí! TTS.ai ofrece texto a voz gratis con los modelos Kokoro, Piper, VITS y MeloTTS. No se requiere cuenta. Regístrese para obtener 50 créditos gratuitos y acceder a todos los modelos. Los planes de pago comienzan desde $9/mes.

Para la velocidad, use Kokoro o Piper. Para la calidad, pruebe CosyVoice 2 o StyleTTS 2. Para la clonación de voz, utilice Chatterbox o GPT-SoVITS. Para el diálogo, utilice Dia TTS. Pruebe varios modelos en el mismo texto para comparar.

Sí. API REST compatible con OpenAI para herramientas de TTS, STT, clonación de voz y audio. Disponible en los planes Pro ($29/mo) y Enterprise ($99/mo). Vea la documentación en tts.ai/api/.

La calidad de voz varía según el modelo. Modelos premium como CosyVoice 2, StyleTTS 2, y Chatterbox producen habla de calidad casi humana con entonación natural y emoción. Modelos libres como Kokoro ofrecen una excelente calidad para la mayoría de los casos de uso.

TTS.ai admite más de 30 idiomas en su biblioteca modelo. El inglés tiene el soporte más amplio del modelo, pero modelos como CosyVoice 2 cubren chino, japonés y coreano; GPT-SoVITS maneja chino, japonés, coreano e inglés; y MeloTTS admite inglés, español, francés, chino, japonés y coreano.

Sí. Todo el procesamiento ocurre en nuestros servidores GPU dedicados. No almacenamos su entrada de texto o audio generado después de la entrega. Las muestras de voz cargadas para clonación se utilizan sólo para la sesión actual y no se conservan. Nunca compartimos sus datos con terceros ni los usamos para entrenar modelos.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai genera audio en formato WAV de forma predeterminada para obtener la máxima calidad. Puede convertir a MP3, FLAC, OGG o M4A utilizando nuestra herramienta gratuita Audio Converter. La API admite especificar su formato de salida preferido directamente en la solicitud.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Los modelos gratuitos (Kokoro, Piper, VITS, MeloTTS) no requieren ninguna cuenta ni ningún crédito. Los modelos estándar (2 caracteres credits/1K) incluyen Bark, CosyVoice 2, F5-TTS y Dia. Los modelos premium (4 caracteres credits/1K) incluyen OpenVoice, Chatterbox, StyleTTS 2 y Tortoise. Los modelos pagados generalmente ofrecen mayor calidad, más voces y funciones adicionales como clonación de voz.

Sí. La API es compatible con el procesamiento por lotes para convertir grandes volúmenes de texto a voz. Envíe múltiples solicitudes y recupere resultados asíncronamente utilizando los UUIDs de trabajo. Los planes empresariales ($99/mo) incluyen acceso prioritario a la cola para un procesamiento por lotes más rápido. Ideal para la producción de audiolibros, contenido de curso y proyectos de voz en off a gran escala.
5.0/5 (1)

Comience a usar la voz de IA hoy

Únete a creadores, desarrolladores y empresas que utilizan TTS.ai