IA libre Texto a vozComment
20+ modelos de código aberto, 107+ voces, 32+ idiomas. Non se require conta.
Todo o que precisa para a IA de voz
Máis de 30 ferramentas baseadas en modelos de IA de código aberto
20+ Modelos de voz de IA
A colección máis completa de modelos TTS de código aberto nunha única plataforma
Kokoro Free
Kokoro é un modelo de síntese de voz de 82 millóns de parámetros que supera con creces a súa clase de peso. A pesar do seu tamaño minúsculo, produce unha fala extraordinariamente natural e expresiva. Kokoro soporta múltiples linguas, incluíndo inglés, xaponés, chinés e coreano cunha variedade de voces expresivas. Executase incribelmente rápido, xerando son case 100 veces máis rápido que en tempo real nunha GPU.
Mellor para: TTS de alta calidade con latencia mínima, aplicacións de transmisión
Probar de balde
Piper Free
Piper é un motor lixeiro de síntese de voz desenvolvido por Rhasspy que emprega as arquitecturas VITS e larynx. Execútase completamente na CPU, o que o fai ideal para dispositivos periféricos, automatización doméstica e aplicacións que requiran TTS sen conexión. Con máis de 100 voces en máis de 30 idiomas, Piper ofrece voz natural a velocidades en tempo real mesmo nun Raspberry Pi 4.
Mellor para: Vistas previas rápidas, accesibilidade e programas incorporados
Probar de balde
VITS Free
VITS (Variational Inference with adversarial learning for end- to- end Text- to- Speech) é un método de TTS paralelo de extremo a extremo que xera un son máis natural que os modelos actuais de dúas etapas. Adopta a inferencia variacional aumentada con fluxos normalizadores e un proceso de adestramento adversario, logrando unha mellora significativa na naturalidade.
Mellor para: Texto a voz de propósito xeral con prosodia natural
Probar de balde
MeloTTS Free
MeloTTS de MyShell. ai é unha biblioteca de TTS multilingüe que admite inglés (americano, británico, indio, australiano), español, francés, chinés, xaponés e coreano. É extremadamente rápida, procesando o texto a unha velocidade case en tempo real só na CPU. MeloTTS está deseñado para uso en produción e admite a inferencia tanto na CPU como na GPU.
Mellor para: Aplicativos de produción que precisan de TTS rápido e multilingüe
Probar de balde
Bark Standard
Modelo de transformación de texto en son baseado en transformadores que xera fala, música e efectos sonoros realistas.
Desenvolvente: Suno · Licenza: MIT
Inténtao
Bark Small Standard
Versión máis lixeira de Bark con inferencias máis rápidas e menor uso de memoria.
Desenvolvente: Suno · Licenza: MIT
Inténtao
CosyVoice 2 Standard
TTS de transmisión escalable de Alibaba con naturalidade de paridade humana e latencia case cero.
Desenvolvente: Alibaba (Tongyi Lab) · Licenza: Apache 2.0
Inténtao
Dia TTS Standard
Modelo de xeración de diálogos multifalante que crea conversas naturais entre falantes.
Desenvolvente: Nari Labs · Licenza: Apache 2.0
Inténtao
Parler TTS Standard
Describa a voz que queira en linguaxe natural e Parler xerará a voz correspondente.
Desenvolvente: Hugging Face · Licenza: Apache 2.0
Inténtao
GLM-TTS Standard
Consegue a taxa de erro de caracteres máis baixa entre os modelos TTS de código aberto.
Desenvolvente: Zhipu AI · Licenza: GLM-4 License
Inténtao
IndexTTS-2 Standard
TTS de tiro cero con control de emocións de gran fino e alta expresividade.
Desenvolvente: Index Team · Licenza: Bilibili Model License
Inténtao
Spark TTS Standard
Clonaxe de voz TTS con emocións controlábeis e estilo de fala mediante mensaxes.
Desenvolvente: SparkAudio · Licenza: CC BY-NC-SA 4.0
Inténtao
GPT-SoVITS Standard
Clonaxe de voz TTS de poucas tomas que replica calquera voz a partir de só 5 segundos de son.
Desenvolvente: RVC-Boss · Licenza: MIT
Inténtao
Orpheus Standard
Modelo TTS emocional a nivel humano adestrado con 100K horas de datos de fala.
Desenvolvente: Canopy Labs · Licenza: Llama 3.2 Community
Inténtao
Qwen3 TTS Standard
O TTS multilingüe de Alibaba con clonación de voz, voces predefinidas e deseño de voz a partir de texto.
Desenvolvente: Alibaba (Qwen) · Licenza: Apache 2.0
Inténtao
CosyVoice 2
TTS de transmisión escalable de Alibaba con naturalidade de paridade humana e latencia case cero.
Linguas: en, zh, ja, ko, fr, de, it, es
Clonar a voz
GLM-TTS
Consegue a taxa de erro de caracteres máis baixa entre os modelos TTS de código aberto.
Linguas: en, zh
Clonar a voz
IndexTTS-2
TTS de tiro cero con control de emocións de gran fino e alta expresividade.
Linguas: en, zh
Clonar a voz
Spark TTS
Clonaxe de voz TTS con emocións controlábeis e estilo de fala mediante mensaxes.
Linguas: en, zh
Clonar a voz
GPT-SoVITS
Clonaxe de voz TTS de poucas tomas que replica calquera voz a partir de só 5 segundos de son.
Linguas: en, zh, ja, ko
Clonar a voz
Chatterbox
Clonaxe de voz de última xeración con control de emocións de Resemble AI.
Linguas: en
Clonar a voz
Tortoise TTS
Texto-a-fala multi-voz centrado na calidade cunha arquitectura autoregressiva.
Linguas: en
Clonar a voz
OpenVoice
Clonaxe instantánea de voz con control granular sobre estilo, emoción e acento.
Linguas: en, zh, ja, ko, fr, de, es, it
Clonar a voz
Qwen3 TTS
O TTS multilingüe de Alibaba con clonación de voz, voces predefinidas e deseño de voz a partir de texto.
Linguas: en, zh, ja, ko, de, fr, ru, pt, es, it
Clonar a vozAPI para desenvolvedores
API REST compatíbel con OpenAI. Un punto final, máis de 22 modelos. Soporte de transmisión para aplicacións en tempo real.
- Formato compatíbel con OpenAI
- Transmisión de TTS para aplicacións en tempo real
- Procesamento por lotes para traballos grandes
- Notificacións de webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Prezos simples e transparentes
Comeza libre. Escala a medida que medres.
Libre
15. 000 caracteres
- Kokoro, Piper, VITS, MeloTTS
- Límite de 500 caracteres
- 3 xenes/ hora (sen conta)
Iniciador
500 créditos/mes
- Todos os 22+ modelos
- 100. 000 caracteres por xeración
- Clonaxe de voz
Pro
2.000 créditos/mes
- Todo no iniciador
- Acceso á API
- Procesamento de prioridade
Preguntas frecuentes
Comece a usar a voz da IA hoxe
Únase a creadores, desenvolvedores e empresas que usan TTS.ai