Quant a
La plataforma de veu de codi obert més completa. 20+ models, 100+ veus, tots en un sol lloc.
Creat per
TTS.ai va ser creat per John Nader (nadermx), Un desenvolupador independent que construeix eines de codi intel·ligència A. TTS.ai forma part d' una missió per fer que la millor tecnologia de veu de l'AI sigui accessible a tots els proveïdors de bloqueig de venedor, sense dades recol· leccionant, només tecnologia de veu potent als preus justs.
La nostra missió
TTS.ai va ser construït en una simple creença: La millor tecnologia de veu de la IA hauria de ser accessible a tothom. Mentre que els serveis propietaris manen els preus més alts de text a veu bàsica, la comunitat de codi obert ha creat models que coincideixen o excedeixen la qualitat comercial.
Hem reunit la millor veu de codi obert IA models en una plataforma d'ús simple i fàcil d'utilitzar.
Què apartem
Text a veu
20+ models incloent-hi Kokoro, Chatterbox, Bark i molt més. Des d' un lleuger càlcul per a la sortida de la qualitat de l' estudi.
Paraula a text
Powered by Rumors, més ràpid-Whisper, i SenseVoice.
Clon de veu
Clona qualsevol veu d' una mostra de 5 segons. Caixa de xat, GPT-SoVITS, CosyVoice 2, i més. Creeu veus personalitzades pels vostres projectes.
Processament d' àudio
Augmenta l' àudio, elimina les vocals, divideix l' eco/reverbi, detecta la clau/BPM, i converteix els formats. Tot alimentat per IA.
Xat de veu
converses en temps real amb IA. Escolliu el model i veu per a una experiència interactiva de xat.
Desenvolupador API
OpenAI- compatible amb l' API REST. SDK, exemples de codi i documentació completa. Construeix característiques de veu a les vostres aplicacions.
Primer origen obert
Tots els models de TTS.ai són de codi obert, sota el MIT o l' Apache 2.0 creiem en transparència i innovació per part de la comunitat.
Nosaltres no
Tots els pesos de model són descarregats dels seus repositoris oficials. Nosaltres no sumem modificacions propietaris.
Infraestructura
TTS.ai s' executa en servidors de GPU dedicats amb NVIDIA Tesla P40 GPUs (96GBVRAM total). La nostra infraestructura està dissenyada per a poc de retard i alt rendiment:
- Clústers de la GPU Dediced per a la inferència - no hi ha recursos compartits
- Assignació de la GPU dinàmica basada en requeriments del model VRAM
- Sistema de prioritat 5-cuar per al rendiment òptim
- Models pre- carregats a VRARA per instant inferència
- Enviament d'àudio CDN de seguretat per a baixades ràpides
Privadesa i seguretat
- Sense entrenament de dades: No utilitzem mai el vostre àudio o text per a entrenar models
- Auto- edició: L' àudio generat s' esborra automàticament després de 24 hores
- Encriptació: Totes les dades estan encriptades en trànsit (TLS 1. 2+) i a la resta
- Sense seguiment: Nosaltres no
- Concorda el PIB: Sol· licita les dades o supressió en qualsevol moment