Për
Platforma më e gjerë e zërit të hapur, AI. 20+ modele, 100+ zëra, të gjithë në një vend.
Krijuar nga
TTS.ai është krijuar nga John Nader (nadermx), TTS.ai është pjesë e një misioni për të bërë teknologjinë më të mirë të zërit të inteligjencës artificiale të arritshme për të gjithë — pa bllokimin e shitësit, pa mbledhjen e të dhënave, vetëm teknologjinë e fuqishme të zërit me çmime të rregullta.
Misioni ynë
TTS.ai u ndërtua mbi një besim të thjeshtë: Teknologjia më e mirë e zërit AI duhet të jetë e arritshme për të gjithë. Ndërsa shërbimet e pronësisë ngarkojnë çmime premium për tekst-në-folje bazë, komuniteti i burimit të hapur ka krijuar modele që përputhen ose tejkalojnë cilësinë komerciale.
Ne bashkojmë modelet më të mira të zërit të hapur në një platformë të vetme, të lehtë për t'u përdorur, pa mbyllje të shitësit, pa mbledhje të dhënash, vetëm teknologji të fuqishme zëri me çmime të rregullta.
Çfarë ofrojmë
Teksti në Fjalë
20+ modele duke përfshirë Kokoro, Chatterbox, Bark, dhe më shumë. Nga sinteza e shpejtë e lehtë në prodhimin e kualitetit të studios.
Fjalë në tekst
Me ndihmën e Whisper, Faster-Whisper, dhe SenseVoice. Transkribo audion në më shumë se 100 gjuhë me shenjat e kohës dhe zbulimin e folësit.
Klonimi i zërit
Klono çdo zë nga një shembull 5 sekondash. Chatterbox, GPT-SoVITS, CosyVoice 2, dhe më shumë. Krijo zëra të personalizuar për projektet tuaja.
Përpunimi i zërit
Përmirëso audion, hiq vokalet, nda rrënjët, hiq eco/reverb, zbulo kyçet/BPM, dhe konverto formatet. Gjithçka mbështetet nga AI.
Biseda me zë
Biseda me zë në kohë reale me AI. Zgjidh modelin dhe zërin tënd për një përvojë bisede interaktive.
API e zhvilluesit
API REST e përshtatshme me OpenAI. Python SDK, shembuj kodi dhe dokumentacion i plotë. Ndërto funksionet e zërit në aplikativët e tu.
Burimi i hapur
Çdo model në TTS.ai është me burim të hapur, licencuar nën MIT ose Apache 2.0 Ne besojmë në transparencë dhe inovacion të drejtuar nga komuniteti.
Ne kemi.
Të gjitha peshat e modelit janë shkarkuar nga depozitat e tyre zyrtare. Ne nuk shtojmë modifikime të pronësisë.
Infrastruktura
TTS.ai punon në serverë të dedikuar GPU me GPU NVIDIA Tesla P40 (96GB VRAM total). Infrastruktura jonë është projektuar për vonesë të ulët dhe performancë të lartë:
- Grupe të dedikuara GPU për deduktim - pa burime të përbashkëta
- Shpërndarja dinamike e GPU bazuar në kërkesat e modelit VRAM
- Sistemi me 5 rreshta për përparësi për një performancë optimale
- Modele të para-ngarkuara në VRAM për përfundim të menjëhershëm
- Shpërndarje audio e mbështetur nga CDN për shkarkime të shpejta
Intimitet dhe Siguri
- Asnjë trainim i të dhënave: Ne kurrë nuk përdorim audion apo tekstin tuaj për të trajnuar modelet.
- Eleminimi automatik: Audio e gjeneruar eleminohet automatikisht pas 24 orëve
- Kriptimi: Të gjitha të dhënat janë të kriptuara gjatë tranzitit (TLS 1.2+) dhe në prehje
- Asnjë gjurmë: Ne kemi.
- Në përputhje me GDPR: Kërko të dhënat ose elemino ato në çdo kohë