About TTS.ai

A legátfogóbb nyílt forráskódú hang MI platform. 24+ modellek, 100+ hangok, mind egy helyen.

Létrehozta

A TTS.ai-t

Küldetésünk

A TTS.ai egy egyszerű hiedelemre épült: a legjobb MI hangtechnológiának mindenki számára elérhetőnek kell lennie . Míg a védett szolgáltatások prémium árakat számítanak fel az alap szövegtől-beszédig alapszintű szolgáltatásokért, a nyílt forráskódú közösség olyan modelleket hozott létre, amelyek megfelelnek vagy meghaladják a kereskedelmi minőséget.

Összegyűjtjük a legjobb nyílt forráskódú hang AI modelleket egyetlen, könnyen használható platformba. Nincs eladói zárolás. Nincs adatgyűjtés. Csak erős hangtechnológia tisztességes áron.

Amit felajánlunk

Szöveg a beszédhez

24+ modellek, köztük Kokoro, Chatterbox, Bark, és így tovább. A gyors könnyű szintézistől a stúdióminőségig.

Beszéd szövegre

Powered by Whisper, Faster-Whisper, and SenseVoice. Átírása audio 100+ nyelven időbélyegek és hangszóró detektálás.

Hang klónozása

Klón bármilyen hangot egy 5 másodperces minta. Chatterbox, GPT-Sovits, CosyVoice 2 és több. Hozzon létre egyedi hangokat a projektek.

Hangfeldolgozás

Fokozza az audiót, távolítsa el a vokális, osztott szárak, távolítsa el az echo / reverb, érzékeli a kulcs / BPM, és konvertálja a formátumokat.

Hangcsevegés

Valós idejű hangbeszélgetés MI-vel. Válasszon modellt és hangot interaktív chat élményhez.

Fejlesztő API

OpenAI-kompatibilis REST API. Python SDK, kód példák, és átfogó dokumentáció. Build hangfunkciók az alkalmazásokat.

Első a nyílt forrás

A TTS.ai minden modellje nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Hiszünk az átláthatóságban és a közösségi innovációban.

Mi nem.

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

Minden modell súlyt letöltenek a hivatalos adattárból. Nem adunk hozzá szabadalmaztatott módosításokat.

Infrastruktúra

A TTS.ai az NVIDIA Tesla P40 GPU-val (96GB VRAM összesen) dedikált GPU szervereket futtat. Az infrastruktúránkat alacsony késésre és magas teljesítményre tervezték:

  • Célzott GPU klaszterek a következtetésekre - nincs közös forrás
  • Dinamikus GPU-kiosztás a VRAM-modell követelményei alapján
  • 5 queue prioritású rendszer az optimális átfutáshoz
  • Modellek előre betöltve VRAM azonnali következtetések
  • CDN-alapú audió szolgáltatás gyors letöltésekhez

Adatvédelem

  • Nincs adatképzés: Soha nem használjuk az audiót vagy szöveget vonatmodellekhez
  • Auto-törlés: A generated audio automatikusan törölve 24 óra elteltével
  • Titkosítás: Minden adat titkosított tranzitban (TLS 1.2+) és pihenőben
  • Nincs nyomkövetés: We don
  • GDPR megfelelő: Adatainak kérése vagy törlése bármikor

A TTS.ai GYIK-ről

A TTS.ai-t egy független fejlesztői csapat építette, amely szenvedélyesen mindenki számára elérhetővé teszi az MI hangtechnológiát. A közösség legjobb nyílt forráskódú modelljeit kezeljük és szolgáljuk, ahelyett, hogy védetteket képeznénk.

Infrastruktúránk az NVIDIA Tesla P40 GPU-val rendelkezik, amely 96 GB VRAM-ot biztosít. A webfrontend és a GPU inference szerverek biztonságos adatközpontokban találhatók, alacsony latency kapcsolattal.

Mi minimalizáljuk az adattárolást. A szövegbemeneteket valós időben dolgozzuk fel, és nem tároljuk véglegesen. 24 órán belül minden feltöltött és generált audiófájl automatikusan törlésre kerül.

A TTS.ai fejlesztők, tartalomkészítők és vállalkozások növekvő közösségét szolgálja világszerte. Platformunk naponta több ezer hangfejlesztői kérést kezel 24+ AI modellek között.

Arra törekszünk, hogy a GPU infrastruktúránkkal és az 5queue prioritású rendszerünkkel nagy mértékben rendelkezésre álljunk. Bár nem kínálunk hivatalos SLA-t a szabadúszó felhasználók számára, a fizetett tervek előnyt élveznek a kiemelt feldolgozásból és a nagyobb megbízhatóságból.

Igen. A TTS.ai-n minden modell nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Aktívan támogatjuk a nyílt forráskódú hangú MI közösséget, és hozzájárulunk az optimalizációhoz és integrációhoz az ökoszisztémához.

Az útitervünk új, korszerű modelleket is tartalmaz, mivel azok megjelentek, bővítik a nyelvi támogatást, javítják a valós idejű hangcsevegőképességet, és több hangfeldolgozó eszközt építenek. Folyamatosan integráljuk a legújabb nyílt forráskódú hangalapú AI fejlesztéseket.

Mindig érdeklődünk a tehetséges fejlesztők iránt, akik szenvedélyesek a hang-AI és a nyílt forráskódú technológiák iránt. Ha szeretne hozzájárulni, kérjük, keresse fel a kapcsolati oldalunkat.

Igen, örömmel fogadjuk a partnereket a fejlesztőkkel, vállalkozásokkal és szervezetekkel, akik a hangalapú MI-t szeretnék integrálni termékeikbe. Lépjen velünk kapcsolatba, hogy megvitassuk az API integrációját, a volumenárazást vagy az egyedi modell telepítését.

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.