O programu
Najopsežniji otvoreni glas AI platforma. 20+ modela, 100+ glasova, sve na jednom mjestu.
Stvori
TTS.ai je stvoren od strane John Nader (nadermx), TTS.ai je dio misije da se učini najbolja AI glasovna tehnologija dostupna svima – nema prodavaca zaključavanja, nema prikupljanja podataka, samo moćna glasovna tehnologija po poštenim cijenama.
Naša misija
TTS.ai je izgrađen na jednostavnom vjerovanju: najbolja AI glasovna tehnologija bi trebala biti dostupna svima. Iako vlasničke usluge naplaćuju premijske cijene za osnovne tekstove-na-speech, zajednica otvorenog izvora stvorila je modele koji odgovaraju ili prekoračuju komercijalne kvalitete.
Skupljamo najbolje otvorene glasovne AI modele u jednu, jednostavnu upotrebu platformu. Nema prodavaca zaključavanja, nema prikupljanja podataka, samo moćnu govornu tehnologiju po poštenim cijenama.
Što nudimo
Tekst za govor
20+ modela, uključujući Kokoro, Chatterbox, Bark i više. Od brzo lagane sinteze do studio kvalitetnog proizvoda.
Govor prema tekstu
Powered by Whisper, Faster-Whisper, i Sense Voice. Transcribe audio na 100+ jezika s vremenskim oznakama i detekcijom zvučnika.
Kloniranje glasa
Kloniraj bilo koji glas iz 5-sekundnog uzorka. Chatterbox, GPT-SoviTS, CosyVoice 2, i više. Kreiraj prilagođene glasove za svoje projekte.
Obrada zvuka
Pojačajte zvuk, uklonite vokale, podijelite stabljike, uklonite eho/reverb, otkrijte tipku/BPM i pretvorite formate. Sve pokreće AI.
Glasovni razgovor
Realnovremenski glasovni razgovori s AI. Odaberite svoj model i glas za interaktivno iskustvo razgovora.
Programer API
OpenAI kompatibilan REST API. Python SDK, kodni primjeri, i sveobuhvatna dokumentacija. Izgradite glasovne osobine u svojim aplikacijama.
Prvo otvori izvor
Svaki model na TTS.ai je otvoreni izvor, licenciran pod MIT ili Apache 2.0. Vjerujemo u transparentnost i inovacije temeljene na zajednici.
Mi to radimo.
Sve utege modela su preuzete iz njihovih službenih repozitorija. Ne dodajemo vlasničke modifikacije.
Infrastruktura
TTS.ai radi na posebnim GPU poslužiteljima s NVIDIA Tesla P40 GPUs (ukupno 96GB VRAM). Naša infrastruktura je dizajnirana za nisku latenciju i visoku lokaciju:
- Posvećeni skupovi GPU-a za zaključke - bez zajedničkih resursa
- Dinamična raspodjela GPU-a na temelju zahtjeva modela VRAM-a
- 5-queue prioritetni sustav za optimalni prolaz
- Modeli unaprijed utovareni u VRAM za instant zaključak
- CDN-ova dostava zvuka za brza preuzimanja
Privatnost i sigurnost
- Nema osposobljavanja za podatke: Nikada ne koristimo vaš audio ili tekst za trening modela
- Automatsko oslobađanje: Generirani zvuk se automatski briše nakon 24 sata
- Šifriranje: Svi podaci su šifrirani u tranzitu (TLS 1.2+) i u miru
- Nema praćenja: Mi to radimo.
- U skladu s GDPR-om: Zahtjeva podatke ili brisanje u bilo koje vrijeme