Acerca de
A plataforma de IA de voz de código aberto máis completa. Máis de 20 modelos, máis de 100 voces, todo nun só lugar.
Creado por
TTS.ai foi creado por John Nader (nadermx), un desenvolvente independente que constrúe ferramentas de IA de código aberto. TTS.ai forma parte dunha misión para facer a mellor tecnoloxía de voz de IA accesible para todos — sen restricións de vendedor, sen recolección de datos, só potente tecnoloxía de voz a prezos xustos.
A nosa misión
TTS.ai foi construído sobre unha simple crenza: a mellor tecnoloxía de voz de IA debería ser accesible para todos. Mentres que os servizos propietarios cobran prezos premium para o texto-a-fala básico, a comunidade de código aberto creou modelos que igualan ou superan a calidade comercial.
Reunimos os mellores modelos de IA de voz de código aberto nunha única plataforma fácil de usar. Sen restricións por parte do fabricante. Sen recolección de datos. Só potente tecnoloxía de voz a prezos xustos.
O que ofrecemos
Texto a vozComment
Máis de 20 modelos que inclúen Kokoro, Chatterbox, Bark e outros. Desde sínteses lixeiras e rápidas ata saída con calidade de estudio.
Fala a textoComment
Funciona con Whisper, Faster-Whisper e SenseVoice. Transcriba son en máis de 100 idiomas con marcas de data e hora e detección de falantes.
Clonaxe de voz
Clone calquera voz a partir dunha mostra de 5 segundos. Chatterbox, GPT-SoVITS, CosyVoice 2 e máis. Cree voces personalizadas para os seus proxectos.
Procesamento de son
Mellore o son, elimine voces, divida partes, elimine eco/reverberación, detecte teclas/BPM e converta formatos. Todo con IA.
Chat de voz
Conversas de voz en tempo real con IA. Escolla o seu modelo e voz para unha experiencia de conversa interactiva.
API do desenvolvente
API REST compatíbel con OpenAI. SDK de Python, exemplos de código e documentación completa. Construa funcionalidades de voz nos seus programas.
Primeiro o código aberto
Cada modelo en TTS.ai é de código aberto, licenciado baixo MIT ou Apache 2.0. Cremos na transparencia e na innovación impulsada pola comunidade.
Nós si.
Todos os pesos dos modelos son obtidos dos seus repositorios oficiais. Non engadimos modificacións propietarias.
Infraestrutura
TTS.ai executase en servidores de GPU dedicados con GPU NVIDIA Tesla P40 (96 GB de VRAM en total). A nosa infraestrutura está deseñada para baixa latencia e alto rendemento:
- Clústeres de GPU dedicados para inferencia - sen recursos compartidos
- Asignación dinámica da GPU baseada nos requisitos do modelo de VRAM
- Sistema de prioridade de 5 filas para un rendemento óptimo
- Modelos precargados na VRAM para inferencia instantánea
- Entrega de son apoiada por CDN para descargas rápidas
Privacidade e seguridade
- Sen adestramento de datos: Nunca usamos o seu audio ou texto para adestrar modelos
- Borrar automaticamente: O son xerado é borrado automaticamente despois de 24 horas
- Cifrado: Todos os datos son cifrados en tránsito (TLS 1. 2+) e en repouso
- Sen seguimento: Nós si.
- Compatíbel co GDPR: Solicite ou elimine os seus datos en calquera momento