About TTS.ai
A legátfogóbb nyílt forráskódú hang MI platform. 24+ modellek, 100+ hangok, mind egy helyen.
Küldetésünk
A TTS.ai egy egyszerű hiedelemre épült: a legjobb MI hangtechnológiának mindenki számára elérhetőnek kell lennie . Míg a védett szolgáltatások prémium árakat számítanak fel az alap szövegtől-beszédig alapszintű szolgáltatásokért, a nyílt forráskódú közösség olyan modelleket hozott létre, amelyek megfelelnek vagy meghaladják a kereskedelmi minőséget.
Összegyűjtjük a legjobb nyílt forráskódú hang AI modelleket egyetlen, könnyen használható platformba. Nincs eladói zárolás. Nincs adatgyűjtés. Csak erős hangtechnológia tisztességes áron.
Amit felajánlunk
Szöveg a beszédhez
24+ modellek, köztük Kokoro, Chatterbox, Bark, és így tovább. A gyors könnyű szintézistől a stúdióminőségig.
Beszéd szövegre
Powered by Whisper, Faster-Whisper, and SenseVoice. Átírása audio 100+ nyelven időbélyegek és hangszóró detektálás.
Hang klónozása
Klón bármilyen hangot egy 5 másodperces minta. Chatterbox, GPT-Sovits, CosyVoice 2 és több. Hozzon létre egyedi hangokat a projektek.
Hangfeldolgozás
Fokozza az audiót, távolítsa el a vokális, osztott szárak, távolítsa el az echo / reverb, érzékeli a kulcs / BPM, és konvertálja a formátumokat.
Hangcsevegés
Valós idejű hangbeszélgetés MI-vel. Válasszon modellt és hangot interaktív chat élményhez.
Fejlesztő API
OpenAI-kompatibilis REST API. Python SDK, kód példák, és átfogó dokumentáció. Build hangfunkciók az alkalmazásokat.
Első a nyílt forrás
A TTS.ai minden modellje nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Hiszünk az átláthatóságban és a közösségi innovációban.
Mi nem.
Minden modell súlyt letöltenek a hivatalos adattárból. Nem adunk hozzá szabadalmaztatott módosításokat.
Infrastruktúra
A TTS.ai az NVIDIA Tesla P40 GPU-val (96GB VRAM összesen) dedikált GPU szervereket futtat. Az infrastruktúránkat alacsony késésre és magas teljesítményre tervezték:
- Célzott GPU klaszterek a következtetésekre - nincs közös forrás
- Dinamikus GPU-kiosztás a VRAM-modell követelményei alapján
- 5 queue prioritású rendszer az optimális átfutáshoz
- Modellek előre betöltve VRAM azonnali következtetések
- CDN-alapú audió szolgáltatás gyors letöltésekhez
Adatvédelem
- Nincs adatképzés: Soha nem használjuk az audiót vagy szöveget vonatmodellekhez
- Auto-törlés: A generated audio automatikusan törölve 24 óra elteltével
- Titkosítás: Minden adat titkosított tranzitban (TLS 1.2+) és pihenőben
- Nincs nyomkövetés: We don
- GDPR megfelelő: Adatainak kérése vagy törlése bármikor