About TTS.ai
Visapusiškiausia atviro šaltinio balso AI platforma. 24+ modeliai, 100+ balsai, viskas vienoje vietoje.
Mūsų misija
TTS.ai buvo pastatytas paprastas įsitikinimas: < stipri> geriausia AI balso technologija turėtų būti prieinama visiems . Nors patentuotos paslaugos už pagrindinių tekstų-į-speech mokestį, atviro šaltinio bendruomenė sukūrė modelius, kurie atitinka arba viršija komercinę kokybę.
Mes surenkame geriausius atviro kodo balso AI modelius į vieną, lengvai naudojamą platformą. Nėra pardavėjo užrakto. Nėra duomenų rinkimo. Galinga balso technologija sąžiningomis kainomis.
What We Offer
Text to Speech
24+ modeliai, įskaitant Kokoro, Chatterbox, bark ir kt. Nuo greitos lengvos sintezės iki studijos kokybės.
Speech to Text
Powered by Whisper, Faster-Whisper, ir SenseVoice. Perrašyti garso 100+ kalbomis su timestamp reikšmėmis ir garsiakalbio aptikimo.
Balso klonavimas
Klonuoti bet kokį balsą iš 5 sekundžių pavyzdžio. Chatterbox, GPT-SoVITS, CosyVoice 2 ir daugiau. Sukurti pasirinktinius balsus savo projektams.
Garso apdorojimas
Padidinti garsą, pašalinti vokalus, split stiebai, pašalinti aidą / atgal, aptikti raktą / BPM, ir konvertuoti formatus. Viskas sukurta AI.
Balso pokalbis
Realaus laiko balso pokalbiai su AI. Pasirinkite modelį ir balsą interaktyviai pokalbių patirčiai.
Programuotojas API
OpenAI suderinama REST API. Python SDK, kodo pavyzdžiai ir išsami dokumentacija.
Pirmas atverti šaltinį
Kiekvienas modelis TTS.ai yra atviro šaltinio, licencijuotas pagal MIT arba Apache 2.0. Mes tikime skaidrumo ir bendruomenės inovacijų.
Mes taip ir darome
Visi modelio svoriai atsisiunčiami iš jų oficialių saugyklų. Mes pridedame jokių patentuotų modifikacijų.
Infrastruktūra
TTS.ai veikia specialiuose GPU serveriuose su NVIDIA Tesla P40 GPU (96GB VRAM iš viso). Mūsų infrastruktūra skirta žemai latentinei ir aukštai pralaidai:
- Specialieji GPU klasteriai inkrementams – nebendradarbiaujančių išteklių
- Dinaminis GPU paskirstymas remiantis modelio VRAM reikalavimais
- 5 que pirmenybės sistema optimaliai pralaidumui
- Modeliai, iš anksto įdėti į VRAM, skirti greitam įdėjimui
- CDN palaikomas garso pristatymas greitam atsisiuntimui
Privatumas ir saugumas
Nėra duomenų mokymo: Mes niekada nenaudojame jūsų garso ar teksto treniruoti modelius Auto delecija: Generuotas garsas automatiškai ištrinamas po 24 valandųŠifravimas: Visi duomenys užšifruojami tranzitu (TLS 1.2+) ir ramiai- < stiprus> Nėra sekimo: < / stiprus> Mes neturime
GDPR atitinka: Bet kuriuo metu prašykite savo duomenų arba juos ištrinti