Körülbelül
A legátfogóbb nyílt forráskódú hang AI platform. 20+ modellek, 100+ hangok, mind egy helyen.
Létrehozta
A TTS.ai-t a TTS.ai hozta létre John Nader (nadermx), egy független fejlesztő épület nyílt forráskódú AI eszközök. TTS.ai része egy küldetésnek, hogy a legjobb AI hangtechnológia mindenki számára elérhető legyen · nem eladói zárolás, nincs adatgyűjtés, csak erős hangtechnológia tisztességes áron.
Küldetésünk
A TTS.ai egy egyszerű hitre épült: a legjobb MI hangtechnológiának mindenki számára elérhetőnek kell lennie. Míg a szabadalmaztatott szolgáltatások prémium árakat számítanak fel az alapszövegtől a beszédig, a nyílt forráskódú közösség olyan modelleket hozott létre, amelyek megfelelnek vagy meghaladják a kereskedelmi minőséget.
Összegyűjtjük a legjobb nyílt forráskódú hang AI modelleket egyetlen, könnyen használható platformba. Nincs eladói zárolás. Nincs adatgyűjtés. Csak erős hangtechnológia tisztességes áron.
Amit felajánlunk
Szöveg a beszédhez
20+ modellek, beleértve Kokoro, Chatterbox, Bark, és így tovább. A gyors könnyű szintézistől a stúdióminőségig.
Beszéd szövegre
Powered by Whisper, Faster-Whisper, and SenseVoice. Átírása audio 100+ nyelven időbélyegek és hangszóró detektálás.
Hang klónozása
Klón bármilyen hangot egy 5 másodperces minta. Chatterbox, GPT-Sovits, CosyVoice 2 és több. Hozzon létre egyedi hangokat a projektek.
Hangfeldolgozás
Fokozza az audiót, távolítsa el a vokális, osztott szárak, távolítsa el az echo / reverb, érzékeli a kulcs / BPM, és konvertálja a formátumokat.
Hangcsevegés
Valós idejű hangbeszélgetés MI-vel. Válasszon modellt és hangot interaktív chat élményhez.
Fejlesztő API
OpenAI-kompatibilis REST API. Python SDK, kód példák, és átfogó dokumentáció. Build hangfunkciók az alkalmazásokat.
Első a nyílt forrás
A TTS.ai minden modellje nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Hiszünk az átláthatóságban és a közösségi innovációban.
Mi nem.
Minden modell súlyt letöltenek a hivatalos adattárból. Nem adunk hozzá szabadalmaztatott módosításokat.
Infrastruktúra
A TTS.ai az NVIDIA Tesla P40 GPU-val (96GB VRAM összesen) dedikált GPU szervereket futtat. Az infrastruktúránkat alacsony késésre és magas teljesítményre tervezték:
- Célzott GPU klaszterek a következtetésekre - nincs közös forrás
- Dinamikus GPU-kiosztás a VRAM-modell követelményei alapján
- 5 queue prioritású rendszer az optimális átfutáshoz
- Modellek előre betöltve VRAM azonnali következtetések
- CDN-alapú audió szolgáltatás gyors letöltésekhez
Adatvédelem
- Nincs adatképzés: Soha nem használjuk az audió vagy szöveges vonat modellek
- Automatikus törlés: A generált audio automatikusan törölve 24 óra után
- Titkosítás: Minden adat titkosítva van tranzitban (TLS 1.2+) és pihenőben
- Nincs nyomkövetés: Mi nem.
- A GDPR-nek megfelelő: Adatainak kérése vagy törlése bármikor