About TTS.ai
Alhliða opinn-uppspretta rödd AI vettvangur. 24 + módel, 100 + raddir, allt á einum stað.
Markmið okkar
TTS.ai var byggt á einföldum trú: besta AI radd tækni ætti að vera aðgengileg öllum.Þó að einkaleyfi þjónusta rukka hágæða verð fyrir grunn texta-til-tal, opið-uppspretta samfélag hefur búið til módel sem passa eða fara yfir viðskiptaleg gæði.
Við komum saman bestu opna rödd AI módel í einn, auðvelt að nota vettvang. Engin söluaðili læsa í. Engin gagnauppskera. Bara öflugt rödd tækni á sanngjörnu verði.
What We Offer
Text to Speech
24+ módel þar á meðal Kokoro, Chatterbox, Bark, og fleira. Frá fljótur léttur myndun til stúdíó-gæði framleiðsla.
Speech to Text
Powered by Whisper, Faster-Whisper, og SenseVoice. Umrita hljóð á 100 + tungumálum með tímastimpil og hátalara uppgötvun.
Raddklónun
Klóna hvaða rödd sem er úr 5 sekúndna sýnishorn. Chatterbox, GPT-SoVITS, CosyVoice 2 og fleira. Búðu til sérsniðnar raddir fyrir verkefnin þín.
Hljóðvinnsla
Auka hljóð, fjarlægja söng, skipta stilkar, fjarlægja echo / reverb, greina lykill / BPM, og umbreyta snið.
Raddspjall
Rauntíma rödd samtöl með AI. Veldu líkan og rödd fyrir gagnvirka spjall reynslu.
Forritari API
OpenAI-samhæft REST API. Python SDK, kóða dæmi og alhliða skjöl. Byggja rödd eiginleika í forritunum þínum.
Opinn kóði fyrst
Sérhver líkan á TTS.ai er opinn uppspretta, leyfi undir MIT eða Apache 2.0.Við trúum á gagnsæi og samfélagslega nýsköpun.
Við gerum það ekki.
Allar líkanþyngdir eru sóttar úr opinberum geymslum þeirra. Við bætum við engum einkaleyfisbreytingum.
Innviði
TTS.ai keyrir á hollur GPU netþjóna með NVIDIA Tesla P40 GPUs (96GB VRAM samtals).Innviði okkar er hannað fyrir lágt leynd og hár afköst:
- Hollur GPU þyrping fyrir ályktun - engar sameiginlegar auðlindir
- Dynamic GPU úthlutun byggt á líkani VRAM kröfur
- Forgangskerfi með 5 biðröðum fyrir hámarks afköst
- Líkön fyrirfram hlaðið í VRAM fyrir augnablik ályktun
- CDN-backed hljóð afhendingu fyrir fljótur niðurhal
Persónuvernd og öryggi
- Engin gagnaþjálfun: Við notum aldrei hljóð eða texta til að þjálfa módel
- Auto-eyðing: Búið hljóð er sjálfkrafa eytt eftir 24 klukkustundir
- Dulkóðun: Öll gögn eru dulkóðuð í flutningi (TLS 1.2+) og í hvíld
- Engin mælingar: Við gerum ekki mælingar.
- GDPR samhæft: Biðja um gögnin þín eða eyðingu hvenær sem er