O tem
Najobsežnejši odprti glas AI platforma. 20+ modeli, 100+ glasovi, vse na enem mestu.
Ustvaril
TTS.ai je bil ustvarjen s strani John Nader (nadermx), neodvisni razvijalec zgradba odprtega izvora AI orodja. TTS.ai je del misije, da se najboljša AI glasovna tehnologija dostopna za vse – noben prodajalec zakleniti, brez zbiranja podatkov, samo močna glasovna tehnologija po poštenih cenah.
Naša misija
TTS.ai je bil zgrajen na preprostem prepričanju: najboljša AI glasovna tehnologija bi morala biti dostopna vsem. Skupnost odprtih virov je ustvarila modele, ki se ujemajo ali presegajo komercialno kakovost.
Združujemo najboljše odprte glasovne modele AI v enojno, enostavno za uporabo platformo. Nobenega prodajalca, brez zbiranja podatkov, samo močno glasovno tehnologijo po poštenih cenah.
Kaj ponujamo
Besedilo v govor
20+ modelov, vključno z Kokoro, Chatterbox, Bark in več. Od hitro lahke sinteze do kvalitete studio.
Govor na besedilo
Napajajo Whisper, Hitrejši Whisper in Sense Voice. Transcribe audio v 100+ jezikih s časovnimi oznakami in odkrivanjem zvočnika.
Kloniranje glasu
Klonujte vsak glas iz 5-sekundnega vzorca. Chatterbox, GPT-SoviTS, CosyVoice 2, in več. Ustvarite posebnih glasov za svoje projekte.
Obdelava zvoka
Povečajte zvok, odstranite vokal, razdelite stebla, odstranite echo/reverb, zaznajte tipko/BPM in pretvorite formate. Vse napaja AI.
Glasovni pogovor
Glasovni pogovori v realnem času z AI. Izberite svoj model in glas za interaktivno izkušnjo klepeta.
Razvijalec API
OpenAI kompatibilen REST API. Python SDK, koda primerov, in izčrpna dokumentacija. Zgradite glasovne funkcije v svojih aplikacijah.
Najprej odprt vir
Vsak model na TTS.ai je odprt vir, licenciran pod MIT ali Apače 2.0. Verjamemo v preglednost in inovacije, ki jih vodi skupnost.
Saj vemo.
Vse uteži modela se prenesejo iz uradnih repozitorijev. Ne dodamo lastniških sprememb.
Infrastruktura
TTS.ai teče na namenskih GPU strežnikih z NVIDIA Tesla P40 GPUs (skupaj 96GB VRAM). Naša infrastruktura je zasnovana za nizko zamudo in visoko izpust:
- Posvetovani skupini GPU za ugotovitve - brez skupnih virov
- Dynamična dodelitev GPU na podlagi zahtev modela VRAM
- Prednostni sistem 5-vodov za optimalni pretok
- Modeli vnaprej napolnjeni v VRAM za takojšnjo ugotovitev
- Dostava zvoka, podprtega s CDN za hitre prenose
Zasebnost in varnost
- Brez usposabljanja podatkov: Nikoli ne uporabljamo vašega zvoka ali sporočila za usposabljanje modelov
- Samodejno razdeljevanje: Ustvaritveni zvok se samodejno izbriše po 24 urah
- Šifriranje: Vsi podatki so šifrirani v tranzitu (TLS 1.2+) in v počitku
- Brez sledenja: Saj vemo.
- Skladna z GDPR: Zahtevajte podatke ali izbris kadarkoli