Om
Den mest omfattende AI- plattformen med åpen kildekode. 20+ modeller, 100+ stemmer, alle på ett sted.
Laget av
TTS.ai ble laget av John Nader (nadermx), en uavhengig utvikler som bygger AI-verktøy med åpen kildekode. TTS.ai er en del av et oppdrag om å gjøre den beste AI-taleteknologien tilgjengelig for alle - ingen leverandør låser inn, ingen datafangst, bare kraftig taleteknologi til rettferdige priser.
Oppdraget vårt
TTS.ai ble bygget på en enkel tro: den beste AI-taleteknologien bør være tilgjengelig for alle. Selv om egne tjenester krever premiepriser for grunnleggende tekst-til-tale, har det åpne kildekodesamfunnet opprettet modeller som er av samme kvalitet som eller overstiger den kommersielle kvaliteten.
Vi samler de beste AI-modellene med åpen kildekode i en enkelt, brukervennlig plattform, ingen leverandør låser inn, ingen datafangst, bare kraftig stemmeteknologi til rettferdige priser.
Hva vi tilbyr
Tekst til tale
20+ modeller som inkluderer Kokoro, Chatterbox, Bark og mer. Fra rask lettvektssyntese til studiokvalitet.
Opplesning til tekst
Drivet av Visper, Hurtigere Visker og SenseVoice. Transcribe lyd på 100+ språk med tidsstempler og høyttalerdeteksjon.
Stemmekloning
Klone en stemme fra et 5- sekunds utvalg. Chatterbox, GPT- SoVITS, CosyVoice 2 og mer. Lag selvvalgte stemmer for prosjektene dine.
Lydbehandling
Forbedre lyd, fjerne vokaler, dele stilker, fjerne ekko/ reverb, oppdage nøkkel/ BPM og konvertere formater. Alle drevet av AI.
Taleprat
Stemmesamtaler i sanntid med AI. Velg modell og stemme for en interaktiv prateopplevelse.
Utvikler- API
OpenAI- kompatibel REST API. Python SDK, kodeeksempler og omfattende dokumentasjon. Bygg talefunksjoner i appene dine.
Åpne kildekode først
Hver modell på TTS.ai er åpen kildekode, lisensiert under MIT eller Apache 2.0.
Vi gjør det.
Alle modellvekter blir lastet ned fra deres offisielle arkiver. Vi legger ikke til noen egne endringer.
Infrastruktur
TTS.ai kjører på dedikerte GPU-tjenere med NVIDIA Tesla P40 GPUer (total 96 GB VRAM).
- Dedikerte GPU-hoper for konklusjoner – ingen delte ressurser
- Dynamisk GPU-tildeling på grunnlag av kravene til modell VRAM
- Femtrinns prioritetssystem for optimal gjennomstrømning
- Modeller som er lastet på forhånd i VRAM for øyeblikkskonferanse
- CDN-basert lydlevering for raske nedlastinger
Personvern og sikkerhet
- Ingen dataopplæring: Vi bruker aldri din lyd eller tekst til å trene modeller
- Autosletting: Generert lyd slettes automatisk etter 24 timer
- Kryptering: Alle data er kryptert under transitt (TLS 1.2+) og i hviletilstand
- Ingen sporing: Vi gjør det.
- BNPR- samsvar: Be om opplysninger eller sletting når som helst