Om
Den mest omfattende open source stemme AI platform. 20 + modeller, 100 + stemmer, alle på ét sted.
Oprettet af
TTS.ai blev skabt af John Nader (nadermx), en uafhængig udvikler bygning open source AI-værktøjer. TTS.ai er en del af en mission for at gøre den bedste AI stemmeteknologi tilgængelig for alle! ingen leverandør lås-in, ingen data høst, bare kraftfuld stemmeteknologi til rimelige priser.
Vores mission
TTS.ai blev bygget på en simpel tro: den bedste AI stemmeteknologi skal være tilgængelig for alle. Mens proprietære tjenester opkræve præmiepriser for grundlæggende tekst-til-tale, open source samfund har skabt modeller, der matcher eller overstiger kommerciel kvalitet.
Vi samler de bedste open source stemme AI modeller i en enkelt, nem at bruge platform. Ingen leverandør lås-in. Ingen høst af data. Bare kraftfuld stemmeteknologi til rimelige priser.
Hvad vi tilbyder
Tekst til tale
20+ modeller, herunder Kokoro, Chatterbox, Bark og meget mere. Fra hurtig letvægtssyntese til studie-kvalitet output.
Tale til tekst
Drevet af Whisper, Hurtigere-Whisper, og SenseVoice. Transskriber lyd på 100 + sprog med tidsstempler og højttaler afsløring.
Stemmekløvning
Clone enhver stemme fra en 5-sekunders prøve. Chatterbox, GPT-SoVITS, CosyVoice 2, og meget mere. Opret brugerdefinerede stemmer til dine projekter.
Lydbehandling
Forbedre lyd, fjerne vokal, split stilke, fjerne echo / reverb, opdage nøgle / BPM, og konvertere formater. Alle drevet af AI.
Stemmechat
Real-time stemme samtaler med AI. Vælg din model og stemme for en interaktiv chat oplevelse.
Udvikler- API
OpenAI-kompatibel REST API. Python SDK, kodeeksempler og omfattende dokumentation. Byg stemmefunktioner i dine apps.
Åbn kilde først
Hver model på TTS.ai er open source, licenseret under MIT eller Apache 2.0. Vi tror på gennemsigtighed og fællesskabsdrevet innovation.
Det gør vi.
Alle modelvægte downloades fra deres officielle arkiver. Vi tilføjer ingen proprietære modifikationer.
Infrastruktur
TTS.ai kører på dedikerede GPU-servere med NVIDIA Tesla P40 GPU'er (96GB VRAM i alt). Vores infrastruktur er designet til lav latenstid og høj gennemløb:
- Dedikeret GPU-klynger til inferens - ingen delte ressourcer
- Dynamisk GPU-tildeling baseret på model VRAM-krav
- 5-kø prioriteret system for optimal gennemløb
- Modeller pre-loadet i VRAM til øjeblikkelig inferens
- CDN-støttet audio levering til hurtige downloads
Beskyttelse af personlige oplysninger og sikkerhed
- Ingen datatræning: Vi bruger aldrig din lyd eller tekst til at træne modeller
- Automatisk sletning: Genereret lyd slettes automatisk efter 24 timer
- Kryptering: Alle data krypteres i transit (TLS 1.2+) og i hvile
- Ingen sporing: Det gør vi.
- GDPR- kompatibel: Anmod om dine data eller sletning til enhver tid