Apie

Visapusiškiausia atviro šaltinio balso AI platforma. 20+ modeliai, 100+ balsai, viskas vienoje vietoje.

Sukūrė

TTS.ai sukūrė John Nader (nadermx), nepriklausomas vystytojas, statantis atvirojo kodo AIS įrankius. TTS.ai yra dalis misijos, kuria siekiama padaryti geriausią AIS balso technologiją prieinamą visiems – be pardavėjo užrakto, be duomenų rinkimo, tiesiog galingą balso technologiją sąžiningomis kainomis.

Mūsų misija

TTS.ai buvo sukurtas paprastas įsitikinimas: geriausia AI balso technologija turėtų būti prieinama visiems. Nuosavybės paslaugos apmokestina priemokas už pagrindinį tekstą į slapyvardį, o atviro šaltinio bendruomenė sukūrė modelius, kurie atitinka arba viršija komercinę kokybę.

Mes surenkame geriausius atviro kodo balso AI modelius į vieną, lengvai naudojamą platformą. Nėra pardavėjo užrakto. Nėra duomenų rinkimo. Galinga balso technologija sąžiningomis kainomis.

Ką mes siūlome

Tekstas į kalbą

20+ modelių, įskaitant Kokoro, Chatterbox, Bark ir kt. Nuo greitos lengvos sintezės iki studijos kokybės.

Kalba tekstui

Powered by Whisper, Faster-Whisper, ir SenseVoice. Perrašyti garso 100+ kalbomis su timestamp reikšmėmis ir garsiakalbio aptikimo.

Balso klonavimas

Klonuoti bet kokį balsą iš 5 sekundžių pavyzdžio. Chatterbox, GPT-SoVITS, CosyVoice 2 ir daugiau. Sukurti pasirinktinius balsus savo projektams.

Garso apdorojimas

Padidinti garsą, pašalinti vokalus, split stiebai, pašalinti aidą / atgal, aptikti raktą / BPM, ir konvertuoti formatus. Viskas sukurta AI.

Balso pokalbis

Realaus laiko balso pokalbiai su AI. Pasirinkite modelį ir balsą interaktyviai pokalbių patirčiai.

Programuotojas API

OpenAI suderinama REST API. Python SDK, kodo pavyzdžiai ir išsami dokumentacija.

Pirmas atverti šaltinį

Kiekvienas modelis TTS.ai yra atviro šaltinio, licencijuotas pagal MIT arba Apache 2.0. Mes tikime skaidrumo ir bendruomenės inovacijų.

Mes taip ir darome

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
Ir dar...

Visi modelio svoriai atsisiunčiami iš jų oficialių saugyklų. Mes pridedame jokių patentuotų modifikacijų.

Infrastruktūra

TTS.ai veikia specialiuose GPU serveriuose su NVIDIA Tesla P40 GPU (96GB VRAM iš viso). Mūsų infrastruktūra skirta žemai latentinei ir aukštai pralaidai:

  • Specialieji GPU klasteriai inkrementams – nebendradarbiaujančių išteklių
  • Dinaminis GPU paskirstymas remiantis modelio VRAM reikalavimais
  • 5 que pirmenybės sistema optimaliai pralaidumui
  • Modeliai, iš anksto įdėti į VRAM, skirti greitam įdėjimui
  • CDN palaikomas garso pristatymas greitam atsisiuntimui

Privatumas ir saugumas

  • Nėra duomenų mokymo: Niekada nenaudojame jūsų garso ar teksto modeliams treniruoti
  • Auto delecija: Generuotas garsas automatiškai ištrinamas po 24 valandų
  • Šifravimas: Visi duomenys užšifruojami tranzitu (TLS 1.2+) ir poilsio metu
  • Nėra sekimo: Mes taip ir darome
  • BDAR atitinka: Bet kuriuo metu prašykite savo duomenų arba juos ištrinti

Apie TTS.ai DUK

TTS.ai sukūrė John Nader (nadermx), nepriklausomas vystytojas, aistringas, kad AI balso technologija būtų prieinama visiems. Mes kuruojame ir tarnaujame geriausiems atviro šaltinio modeliams iš bendruomenės, o ne mokome nuosavybinius modelius.

Mūsų infrastruktūra veikia specialiuose NVIDIA Tesla P40 GPU serveriuose, teikiančiuose 96GB VRAM. Interneto fronteend ir GPU inferencijos serveriuose įrengta saugiuose duomenų centruose su nedideliu latentiniu ryšiu.

Mes sumažiname duomenų saugojimą. Teksto įvesties apdorojamos realiu laiku ir nėra nuolat saugomos. Visi įkeliami ir sugeneruoti garso failai automatiškai ištrinami per 24 valandas. Mes niekada nenaudojame jūsų duomenų AI modeliams treniruoti.

TTS.ai aptarnauja vis didesnę bendruomenę kūrėjų, turinio kūrėjų, ir verslo visame pasaulyje. Mūsų platforma tvarko tūkstančius balso generavimo prašymus kasdien per 20+ AI modelius.

Mes siekiame didelio prieinamumo su mūsų skirta GPU infrastruktūra ir 5 que prioritetine sistema. Nors mes nesiūlome formalios SLA nemokamiems vartotojams, apmokami planai turi naudos iš prioritetinio apdorojimo ir didesnio patikimumo.

Taip. Kiekvienas modelis TTS.ai yra atviro šaltinio, licencijuotas pagal MIT arba Apache 2.0. Aktyviai remiame atvirojo šaltinio balso AI bendruomenę ir prisidedame optimizacijos ir integracijos atgal į ekosistemą.

Mūsų planas apima naujų state-of-the-modern modelių pridėjimą juos išleidžiant, kalbos palaikymo plėtimą, balso pokalbių realiuoju laiku galimybių gerinimą ir daugiau garso apdorojimo priemonių kūrimą. Nuolat integruojame naujausius atvirojo šaltinio balso AI pasiekimus.

TTS.ai yra pastatytas ir prižiūrimas solo kūrėjas, todėl nėra atvirų pozicijų. Tačiau atviro šaltinio indėlis visada laukiamas – pasiekti per kontaktinį puslapį arba GitHub.

Taip, mes sveikiname partnerystes su kūrėjais, verslo, ir organizacijų, norinčių integruoti balso AI į savo produktus. Susisiekite su mumis aptarti API integracijos, apimties kainų, ar užsakymą modelio diegimo.

Mes reguliariai atliekame savo infrastruktūros saugumo peržiūras. Visi duomenys yra užšifruoti tranzitu su TLS 1.2+, slaptažodžiai yra sušifruoti su pramoniniais standartiniais algoritmais, ir API raktai naudoja vienpusį hashing. Serverio prieiga yra ribojama įgaliotiems darbuotojams per SSH klavišus.

TTS.ai atitinka GDPR ir laikosi duomenų mažinimo principų. Mes nelaikome asmens garso duomenų ilgiau nei 24 valandas, nenaudojame klientų duomenų mokymui ir suteikiame visas teises susipažinti su duomenimis, juos pataisyti ir ištrinti pagal pageidavimą.

Mes nuolat stebime atvirojo kodo balso AI gamtovaizdį ir pridedame naujus modelius, kai jie tampa prieinami, ir įrodome jų kokybę. Pagrindiniai modeliai paprastai vyksta kas mėnesį, be to, nuolat diegiama nedidelė optimizacija.

Klausimai? Atsakymai į klausimus?

Susisiekite su mumis API dok.