Par
Visaptverošākā atvērtā avota balss AI platforma. 20+ modeļi, 100+ balsis, viss vienā vietā.
Izveidojis
TTS.ai izveidojis John Nader (nadermx), TTS.ai ir daļa no misijas, lai padarītu labāko AI balss tehnoloģiju pieejamu ikvienam — bez pārdevēja bloķēšanas, bez datu vākšanas, vienkārši spēcīgas balss tehnoloģijas par taisnīgām cenām.
Mūsu misija
TTS.ai tika veidots uz vienkāršas pārliecības: labāko AI balss tehnoloģiju vajadzētu būt pieejamai ikvienam;. Lai gan patentētie pakalpojumi maksā prēmijas par pamata tekstu-to-speech, atvērtā avota kopiena ir izveidojusi modeļus, kas atbilst vai pārsniedz komerciālo kvalitāti.
Mēs apvienojam labākos atvērtā korespondenta AI modeļus vienotā, viegli lietojamā platformā. Bez pārdevēja bloķēšanas. Nav datu vākšanas. Tikai spēcīga balss tehnoloģija par taisnīgām cenām.
Ko mēs piedāvājam
Teksts uz runu
20+ modeļus, tostarp Kokoro, Chatterbox, bark un vairāk. No ātras vieglas sintēzes līdz studijas kvalitātes izlaidei.
Uzruna tekstam
Powered by Whisper, Ātrāks-Whisper, un SenseVoice. Atšifrēt audio 100+ valodās ar zīmogiem un skaļrunis detektēšanu.
Balss klonēšana
Clone jebkuru balsi no 5 sekundes parauga. Chatterbox, GPT-SoVITS, CosyVoice 2 un vairāk. Izveidot pielāgotu balsis saviem projektiem.
Audio apstrāde
Uzlabot audio, noņemt vokālus, sadalīt kāti, noņemt atbalsi/reverbu, noteikt taustiņu/BPM, un pārvērst formātus. Visi tiek darbināti ar AI.
Balss tērzēšana
Reālā laika balss sarunas ar AI. Izvēlieties savu modeli un balsi interaktīvai tērzēšanas pieredzei.
Izstrādātājs API
OpenAI saderīgu REST API. Python SDK, kodu piemēri, un visaptverošu dokumentāciju. Built balss funkcijas jūsu lietotnēs.
Atvērt pirmkoda
Katrs modelis TTS.ai ir atvērts avots, licencēts MIT vai Apache 2.0. Mēs ticam pārredzamībai un kopienas virzīta inovācijai.
Mēs do
Visi modeļa svari tiek lejupielādēti no to oficiālajiem repozitorijiem. Mēs nepievienojam patentētas modifikācijas.
Infrastruktūra
TTS.ai darbojas uz īpašiem GPU serveriem ar NVIDIA Tesla P40 GPU (96GB VRAM kopā). Mūsu infrastruktūra ir paredzēta zema latentuma un augstas caurlaidības caurlaidībai:
- Specializētās GPU kopas ievadei - nav kopīgu resursu
- Dinamiskais GPU piešķīrums, pamatojoties uz VRAM modeļa prasībām
- 5 centimetru prioritārā sistēma optimālai caurlaidībai
- Modeļi, kas iepriekš ielādēti VRAM momentānai ievadīšanai
- CDN audio piegāde ātrai lejupielādei
Privātums un drošība
- Nav datu apmācības: Mēs nekad neizmantojam jūsu audio vai tekstu, lai apmācītu modeļus
- Automātiska dzēšana: Ģenerēts audio tiek automātiski dzēsts pēc 24 stundām
- Šifrēšana: Visi dati tiek šifrēti tranzītā (TLS 1.2+) un miera stāvoklī
- Nav izsekošanas: Mēs do
- GDPR atbilst: Pieprasīt datus vai dzēšanu jebkurā laikā