Tietoja
Kattavampi avoimen lähdekoodin tekoälyalusta. 20+-mallia, 100+-ääntä, kaikki samassa paikassa.
Luonut
TTS.ai luotiin John Nader (nadermx), Riippumaton kehittäjä, joka rakentaa avoimen lähdekoodin tekoälytyökaluja. TTS.ai on osa tehtävää, jonka tarkoituksena on saada paras tekoälyn ääniteknologia kaikkien ulottuville – ei toimittajan lukitusta, ei datan keräämistä, vain tehokas ääniteknologia reiluun hintaan.
Tehtävämme
TTS.ai rakentui yksinkertaiselle uskomukselle: parhaan tekoälyn äänitekniikan pitäisi olla kaikkien ulottuvilla. Omistetut palvelut perivät perustekstistä puheen ollen premium-hintoja, mutta avoimen lähdekoodin yhteisö on luonut malleja, jotka vastaavat kaupallista laatua tai ylittävät sen.
Kokoamme parhaat avoimen lähdekoodin tekoälymallit yhdeksi, helppokäyttöiseksi alustaksi. Ei toimittajaa, ei datan keräämistä, vain tehokasta äänitekniikkaa reiluun hintaan.
Mitä me tarjoamme
Teksti puheenaiheeksi
20+-mallia, kuten Kokoro, Chatterbox, Bark ja muuta. Nopeasta kevyestä synteesistä studiolaatuiseen tuotokseen.
Puhe tekstille
Virtana Whisper, Faster-Whisper ja SenseVoice. Transscribe audio 100+ kielellä, aikaleimat ja kaiuttimen tunnistus.
Äänien kloonaus
Kloonaa mikä tahansa ääni viiden sekunnin näytteestä. Chatterbox, GPT-SoVITS, CosyVoice 2 ja enemmän. Luo projekteihisi mukautetut äänet.
Äänenkäsittely
Paranna ääntä, poista ääni, pilkko varret, poista kaiku/kaiku, tunnista avain/BPM ja muuntaa formaatteja. Kaikki toimivat tekoälyn avulla.
Äänikeskustelu
Reaaliaikaiset äänikeskustelut tekoälyn kanssa. Valitse mallisi ja äänesi vuorovaikutteiseen chat-kokemukseen.
Kehittäjän API
OpenAI-yhteensopiva REST API. Python SDK, koodiesimerkit ja kattava dokumentaatio. Rakenna sovelluksiin ääniominaisuuksia.
Avaa lähdekoodi ensin
Jokainen TTS.ain malli on MIT:n tai Apache 2.0:n lisensoima avoimen lähdekoodin malli. Uskomme avoimuuteen ja yhteisölliseen innovaatioon.
Me emme
Kaikki mallipainot ladataan niiden virallisista arkistoista.
Infrastruktuuri
TTS.ai toimii GPU-palvelimilla, joissa on NVIDIA Tesla P40 GPU (96GB VRAM yhteensä). Infrastruktuurimme on suunniteltu matalaan latenssiin ja korkeaan läpimenoon:
- Päättelyyn varatut GPU-klusterit - ei jaettuja resursseja
- Dynaaminen GPU-jako, joka perustuu mallin VRAM-vaatimuksiin
- 5-välin prioriteettijärjestelmä optimaalista läpimenoa varten
- Mallit esiladattu VRAM-muistilla välitöntä päättelyä varten
- CDN:n tukema äänitoimitus nopeaan lataukseen
Yksityisyys ja turvallisuus
- Ei datakoulutusta: Emme koskaan käytä ääni- tai tekstitietojasi mallien kouluttamiseen
- Automaattinen deletion: Luotu ääni poistetaan automaattisesti 24 tunnin kuluttua
- Salaus: Kaikki tiedot salataan kauttakulussa (TLS 1.2+) ja levossa
- Ei jäljitystä: Me emme
- GDPR-vaatimusten mukainen: Pyydä tietojasi tai poista ne milloin tahansa