Apie
Visapusiškiausia atviro šaltinio balso AI platforma. 20+ modeliai, 100+ balsai, viskas vienoje vietoje.
Sukūrė
TTS.ai sukūrė John Nader (nadermx), nepriklausomas vystytojas, statantis atvirojo kodo AIS įrankius. TTS.ai yra dalis misijos, kuria siekiama padaryti geriausią AIS balso technologiją prieinamą visiems – be pardavėjo užrakto, be duomenų rinkimo, tiesiog galingą balso technologiją sąžiningomis kainomis.
Mūsų misija
TTS.ai buvo sukurtas paprastas įsitikinimas: geriausia AI balso technologija turėtų būti prieinama visiems. Nuosavybės paslaugos apmokestina priemokas už pagrindinį tekstą į slapyvardį, o atviro šaltinio bendruomenė sukūrė modelius, kurie atitinka arba viršija komercinę kokybę.
Mes surenkame geriausius atviro kodo balso AI modelius į vieną, lengvai naudojamą platformą. Nėra pardavėjo užrakto. Nėra duomenų rinkimo. Galinga balso technologija sąžiningomis kainomis.
Ką mes siūlome
Tekstas į kalbą
20+ modelių, įskaitant Kokoro, Chatterbox, Bark ir kt. Nuo greitos lengvos sintezės iki studijos kokybės.
Kalba tekstui
Powered by Whisper, Faster-Whisper, ir SenseVoice. Perrašyti garso 100+ kalbomis su timestamp reikšmėmis ir garsiakalbio aptikimo.
Balso klonavimas
Klonuoti bet kokį balsą iš 5 sekundžių pavyzdžio. Chatterbox, GPT-SoVITS, CosyVoice 2 ir daugiau. Sukurti pasirinktinius balsus savo projektams.
Garso apdorojimas
Padidinti garsą, pašalinti vokalus, split stiebai, pašalinti aidą / atgal, aptikti raktą / BPM, ir konvertuoti formatus. Viskas sukurta AI.
Balso pokalbis
Realaus laiko balso pokalbiai su AI. Pasirinkite modelį ir balsą interaktyviai pokalbių patirčiai.
Programuotojas API
OpenAI suderinama REST API. Python SDK, kodo pavyzdžiai ir išsami dokumentacija.
Pirmas atverti šaltinį
Kiekvienas modelis TTS.ai yra atviro šaltinio, licencijuotas pagal MIT arba Apache 2.0. Mes tikime skaidrumo ir bendruomenės inovacijų.
Mes taip ir darome
Visi modelio svoriai atsisiunčiami iš jų oficialių saugyklų. Mes pridedame jokių patentuotų modifikacijų.
Infrastruktūra
TTS.ai veikia specialiuose GPU serveriuose su NVIDIA Tesla P40 GPU (96GB VRAM iš viso). Mūsų infrastruktūra skirta žemai latentinei ir aukštai pralaidai:
- Specialieji GPU klasteriai inkrementams – nebendradarbiaujančių išteklių
- Dinaminis GPU paskirstymas remiantis modelio VRAM reikalavimais
- 5 que pirmenybės sistema optimaliai pralaidumui
- Modeliai, iš anksto įdėti į VRAM, skirti greitam įdėjimui
- CDN palaikomas garso pristatymas greitam atsisiuntimui
Privatumas ir saugumas
- Nėra duomenų mokymo: Niekada nenaudojame jūsų garso ar teksto modeliams treniruoti
- Auto delecija: Generuotas garsas automatiškai ištrinamas po 24 valandų
- Šifravimas: Visi duomenys užšifruojami tranzitu (TLS 1.2+) ir poilsio metu
- Nėra sekimo: Mes taip ir darome
- BDAR atitinka: Bet kuriuo metu prašykite savo duomenų arba juos ištrinti