@ title: window
La plej ampleksa malfermkoda voĉa AI-platformo. Pli ol 24 modeloj, pli ol 100 voĉoj, ĉiuj en unu loko.
Created By
TTS.ai was created by John Nader (nadermx), an independent developer building open-source AI tools. TTS.ai is part of a mission to make the best AI voice technology accessible to everyone — no vendor lock-in, no data harvesting, just powerful voice technology at fair prices.
Nia misio
TTS.ai estis konstruita sur simpla kredo: la plej bona AI-voĉa teknologio estu alirebla por ĉiu. Dum proprietaj servoj postulas premiajn prezojn por baza teksto-al-parolo, la malfermkoda komunumo kreis modelojn kiuj egalas aŭ superas komercan kvaliton.
Ni kunigas la plej bonajn malfermkodajn voĉajn AI-modelojn en ununuran, facile uzeblan platformon. Neniu vendisto-ŝlosilo. Neniu datuma rikoltado. Nur potenca voĉteknologio je justaj prezoj.
Kion ni ofertas
Teksto- al- ParoloComment
24+ modeloj inkluzive de Kokoro, Chatterbox, Bark, kaj pli. De rapida malpeza sintezo al studio-kvalita eligo.
Parolo al tekstoComment
Propulsita de Whisper, Faster-Whisper, kaj SenseVoice. Transskribu sonojn en pli ol 100 lingvoj kun tempostampiloj kaj parolanto-detekto. Name
Voĉa klonado
Kloni ajnan voĉon el 5-sekunda specimeno. Chatterbox, GPT-SoVITS, CosyVoice 2, kaj pli. Krei proprajn voĉojn por viaj projektoj.
SonprilaboradoName
Plibonigu sonon, forigu voĉojn, dividu kordojn, forigu eĥon/reverbon, detektu klavojn/BPM, kaj konvertu formatojn. Ĉio funkcias per AI.
Voĉa babilejoName
Realtempaj voĉaj konversacioj kun AI. Elektu vian modelon kaj voĉon por interaga babilado.
Programisto- API
OpenAI-kongrua REST API. Pitona SDK, kodekzemploj, kaj ampleksa dokumentaro. Konstruu voĉajn funkciojn en viaj aplikaĵoj.
Malferma kodo unue
Ĉiu modelo en TTS.ai estas malfermkoda, licencita sub MIT aŭ Apache 2.0. Ni kredas je travidebleco kaj komunuma novigo.
- Jes.
Ĉiuj modelpezoj estas elŝutitaj el siaj oficialaj deponejoj. Ni aldonas neniujn proprietajn modifojn.
Infrastrukturo
TTS.ai ruliĝas sur dediĉitaj GPU-serviloj kun NVIDIA Tesla P40 GPUoj (96GB VRAM sume). Nia infrastrukturo estas desegnita por malalta latenteco kaj alta trairo:
- Dediĉitaj GPU- aroj por deduktado - neniuj komunaj rimedoj
- Dinamika GPU-asignado bazita sur modelaj VRAM-bezonoj
- 5-vosta prioritata sistemo por optimuma trairo
- Modeloj antaŭŝarĝitaj en VRAM por tuja dedukto
- CDN-subtenita aŭda liverado por rapida elŝuto
Privateco kaj sekureco
- Neniu datuma trejnado: Ni neniam uzas vian sonon aŭ tekston por trejni modelojn
- Aŭtomata forigo: Kreita sono estas aŭtomate forigita post 24 horoj
- Ĉifrado: Ĉiuj datumoj estas ĉifritaj dum transporto (TLS 1. 2+) kaj dum ripozo
- Nenia spurado: Ni ne
- GDPR konforma: Petu viajn datumojn aŭ forigu ilin iam ajn