O meni
Najopsežnija open-source AI glasovna platforma. 20+ modela, 100+ glasova, sve na jednom mjestu.
Napravljeno od
TTS.ai je napravljen od John Nader (nadermx), TTS.ai je dio misije da se napravi najbolja AI glasovna tehnologija dostupna svima - bez vezanosti za dobavljača, bez prikupljanja podataka, samo moćna glasovna tehnologija po poštenim cijenama.
Naša misija
TTS.ai je izgrađen na jednostavnom uvjerenju: Najbolja AI tehnologija glasa bi trebala biti dostupna svima.. Dok vlasničke usluge naplaćuju premium cijene za osnovni tekst-u-govor, zajednica otvorenog koda je stvorila modele koji odgovaraju ili premašuju komercijalni kvalitet.
Mi smo okupili najbolje modele umjetne inteligencije u jednu, jednostavnu platformu, bez vezanja za proizvođača, bez prikupljanja podataka, samo moćnu tehnologiju govora po poštenim cijenama.
Šta mi nudimo
Tekst u govor
20+ modela uključujući Kokoro, Chatterbox, Bark, i više. od brze lagane sinteze do studijske kvalitete.
Pretvorba govora u tekst
Powered by Whisper, Faster-Whisper, and SenseVoice. Transcribe audio in 100+ languages with timestamps and speaker detection.
Kloniranje glasa
Kloniraj bilo koji glas iz uzorka od 5 sekundi. Chatterbox, GPT-SoVITS, CosyVoice 2, i više. Napravi prilagođene glasove za svoje projekte.
Audio obrada
Poboljšajte zvuk, uklonite vokale, podijelite stabljike, uklonite echo/reverb, otkrijte ključeve/BPM, i pretvorite formate. Sve pokreće AI.
Glasovni razgovor
Glasovni razgovori u stvarnom vremenu sa AI. Izaberite svoj model i glas za interaktivno iskustvo razgovora.
API za programere
OpenAI-kompatibilno REST API. Python SDK, primjeri koda, i sveobuhvatna dokumentacija. Ugradite glasovne mogućnosti u svoje aplikacije.
Open Source First
Svaki model na TTS.ai je otvoreni kod, licenciran pod MIT-om ili Apache 2.0.
Nismo.
Sve težine modela su preuzete iz njihovih službenih repozitorija. Ne dodajemo nikakve vlasničke modifikacije.
Infrastruktura
TTS.ai radi na namjenskim GPU serverima sa NVIDIA Tesla P40 GPU-ima (ukupno 96GB VRAM-a).Naša infrastruktura je dizajnirana za nisku latenciju i veliki protok:
- Dedicated GPU clusters for inference - no shared resources
- Dinamična GPU alokacija zasnovana na zahtjevima modela VRAM-a
- Sistem prioriteta sa 5 redova za optimalan protok
- Modeli unaprijed učitani u VRAM za trenutni zaključak
- CDN-podržana audio isporuka za brza preuzimanja
Privatnost i sigurnost
- Nema treninga podataka: Nikad ne koristimo vaš zvuk ili tekst za treniranje modela.
- Automatsko brisanje: Generirani audio se automatski briše nakon 24 sata
- Šifrovanje: Svi podaci su šifrirani u tranzitu (TLS 1.2+) i u mirovanju
- Bez praćenja: Nismo.
- GDPR kompatibilan: Zatražite svoje podatke ili ih izbrišite u bilo koje vrijeme