Körülbelül

A legátfogóbb nyílt forráskódú hang AI platform. 20+ modellek, 100+ hangok, mind egy helyen.

Létrehozta

A TTS.ai-t a TTS.ai hozta létre John Nader (nadermx), egy független fejlesztő épület nyílt forráskódú AI eszközök. TTS.ai része egy küldetésnek, hogy a legjobb AI hangtechnológia mindenki számára elérhető legyen · nem eladói zárolás, nincs adatgyűjtés, csak erős hangtechnológia tisztességes áron.

Küldetésünk

A TTS.ai egy egyszerű hitre épült: a legjobb MI hangtechnológiának mindenki számára elérhetőnek kell lennie. Míg a szabadalmaztatott szolgáltatások prémium árakat számítanak fel az alapszövegtől a beszédig, a nyílt forráskódú közösség olyan modelleket hozott létre, amelyek megfelelnek vagy meghaladják a kereskedelmi minőséget.

Összegyűjtjük a legjobb nyílt forráskódú hang AI modelleket egyetlen, könnyen használható platformba. Nincs eladói zárolás. Nincs adatgyűjtés. Csak erős hangtechnológia tisztességes áron.

Amit felajánlunk

Szöveg a beszédhez

20+ modellek, beleértve Kokoro, Chatterbox, Bark, és így tovább. A gyors könnyű szintézistől a stúdióminőségig.

Beszéd szövegre

Powered by Whisper, Faster-Whisper, and SenseVoice. Átírása audio 100+ nyelven időbélyegek és hangszóró detektálás.

Hang klónozása

Klón bármilyen hangot egy 5 másodperces minta. Chatterbox, GPT-Sovits, CosyVoice 2 és több. Hozzon létre egyedi hangokat a projektek.

Hangfeldolgozás

Fokozza az audiót, távolítsa el a vokális, osztott szárak, távolítsa el az echo / reverb, érzékeli a kulcs / BPM, és konvertálja a formátumokat.

Hangcsevegés

Valós idejű hangbeszélgetés MI-vel. Válasszon modellt és hangot interaktív chat élményhez.

Fejlesztő API

OpenAI-kompatibilis REST API. Python SDK, kód példák, és átfogó dokumentáció. Build hangfunkciók az alkalmazásokat.

Első a nyílt forrás

A TTS.ai minden modellje nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Hiszünk az átláthatóságban és a közösségi innovációban.

Mi nem.

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
És még...

Minden modell súlyt letöltenek a hivatalos adattárból. Nem adunk hozzá szabadalmaztatott módosításokat.

Infrastruktúra

A TTS.ai az NVIDIA Tesla P40 GPU-val (96GB VRAM összesen) dedikált GPU szervereket futtat. Az infrastruktúránkat alacsony késésre és magas teljesítményre tervezték:

  • Célzott GPU klaszterek a következtetésekre - nincs közös forrás
  • Dinamikus GPU-kiosztás a VRAM-modell követelményei alapján
  • 5 queue prioritású rendszer az optimális átfutáshoz
  • Modellek előre betöltve VRAM azonnali következtetések
  • CDN-alapú audió szolgáltatás gyors letöltésekhez

Adatvédelem

  • Nincs adatképzés: Soha nem használjuk az audió vagy szöveges vonat modellek
  • Automatikus törlés: A generált audio automatikusan törölve 24 óra után
  • Titkosítás: Minden adat titkosítva van tranzitban (TLS 1.2+) és pihenőben
  • Nincs nyomkövetés: Mi nem.
  • A GDPR-nek megfelelő: Adatainak kérése vagy törlése bármikor

A TTS.ai GYIK-ről

TTS.ai-et John Nader (nadermx) hozott létre, egy független fejlesztő szenvedélye, hogy mindenki számára elérhető legyen az AI hangtechnológia. Mi a közösség legjobb nyílt forráskódú modelljeit ápoljuk és szolgáljuk, ahelyett, hogy a szabadalmaztatottakat képeznénk.

Infrastruktúránk az NVIDIA Tesla P40 GPU-val rendelkezik, amely 96 GB VRAM-ot biztosít. A webfrontend és a GPU inference szerverek biztonságos adatközpontokban találhatók, alacsony latency kapcsolattal.

Mi minimalizáljuk az adattárolást. A szövegbemeneteket valós időben dolgozzuk fel, és nem tároljuk véglegesen. 24 órán belül minden feltöltött és generált audiófájl automatikusan törlésre kerül.

TTS.ai a fejlesztők, tartalomkészítők és vállalkozások növekvő közösségét szolgálja világszerte. Platformunk naponta több ezer hangfejlesztői kérést kezel 20+ AI modellek között.

Arra törekszünk, hogy a GPU infrastruktúránkkal és az 5queue prioritású rendszerünkkel nagy mértékben rendelkezésre álljunk. Bár nem kínálunk hivatalos SLA-t a szabadúszó felhasználók számára, a fizetett tervek előnyt élveznek a kiemelt feldolgozásból és a nagyobb megbízhatóságból.

Igen. Minden modell TTS.ai nyílt forráskódú, az MIT vagy az Apache 2.0 alatt engedélyezett. Aktívan támogatjuk a nyílt forráskódú hangú MI közösséget, és hozzájárulunk az optimalizációhoz és integrációhoz vissza az ökoszisztémába.

Az útitervünk új, korszerű modelleket is tartalmaz, mivel azok megjelentek, bővítik a nyelvi támogatást, javítják a valós idejű hangcsevegőképességet, és több hangfeldolgozó eszközt építenek. Folyamatosan integráljuk a legújabb nyílt forráskódú hangalapú AI fejlesztéseket.

TTS.ai épül és karbantartja egy szóló fejlesztő, így nincsenek nyitott pozíciók. Azonban, nyílt forráskódú hozzájárulások mindig szívesen elérhető a kapcsolati oldalon keresztül, vagy GitHub.

Igen, örömmel fogadjuk a partnereket a fejlesztőkkel, vállalkozásokkal és szervezetekkel, akik a hangalapú MI-t szeretnék integrálni termékeikbe. Lépjen velünk kapcsolatba, hogy megvitassuk az API integrációját, a volumenárazást vagy az egyedi modell telepítését.

Rendszeres biztonsági felülvizsgálatokat végzünk az infrastruktúránkról. Minden adat TLS 1.2+-mal titkosítva van, a jelszavakat ipari szabvány algoritmusokkal hashed, és az API billentyűk egyirányú hashinget használnak. A szerver hozzáférés az SSH-kulcsokon keresztül engedélyezett személyzetre korlátozódik.

A TTS.ai megfelel a GDPR-nek, és az adatminimalizálási elveket követi. Nem tároljuk a személyes audió adatokat 24 órán túl, nem használjuk az ügyfelek adatait képzésre, és kérésre teljes körű adathozzáférést, helyesbítést és törlési jogokat biztosítunk.

Folyamatosan figyelemmel kísérjük a nyílt forráskódú hang AI tájképét, és új modelleket adunk hozzá, amint elérhetővé válnak, és bebizonyítjuk minőségüket. A nagyobb modellfrissítések általában havonta történnek, és a kisebb optimalizálások folyamatosan zajlanak.