About TTS.ai

Najbardziej kompleksowa platforma open-source AI. 24+ modele, 100+ głosy, wszystkie w jednym miejscu.

Stworzony przez

TTS.ai został stworzony przez

Nasza misja

TTS.ai został zbudowany na prostej wiary: Najlepsza technologia głosowa AI powinna być dostępna dla wszystkich. Wprawdzie zastrzeżone usługi pobierają premię za podstawowe tekst-to-speech, społeczność open-source stworzyła modele, które pasują lub przekraczają jakość handlową.

Dołączamy do siebie najlepsze modele głosu otwartego AI w jedną, łatwą w użyciu platformę. Żadnego zamykania sprzedawców. Brak zbiorów danych. Tylko potężna technologia głosowa po uczciwych cenach.

Co oferujemy

Tekst do mowy

24+ modele, w tym Kokoro, Chatterbox, Bark i więcej. Od szybkiej syntezy lekkiej po jakość studiów.

Przemówienie do tekstu

Powered by Whisper, Faster-Whisper, i SenseVoice. Napisz audio w 100+ językach z czasami i wykrywanie głośnika.

Klonowanie głosu

Klonuj dowolny głos z 5-sekundowej próbki. Chatterbox, GPT-SoviTS, CosyVoice 2, i więcej. Tworzenie własnych głosów dla swoich projektów.

Przetwarzanie dźwięku

Powiększenie dźwięku, usunięcie wokałów, rozdzielenie stebr, usunięcie echo/reverb, wykrywanie klucza/BPM i konwertowanie formatów. Wszystkie zasilane przez AI.

Rozmowa głosowa

Rozmowy głosowe w czasie rzeczywistym z AI. Wybierz swój model i głos dla interaktywnego doświadczenia czatu.

Rozwijacz API

Kompatybilny z OpenAI REST API. Python SDK, przykłady kodów i kompleksowa dokumentacja. Zbuduj funkcje głosowe w aplikacjach.

Pierwsze otwarte źródło

Każdy model na TTS.ai jest otwarty, licencjonowany pod MIT lub Apache 2.0. Wierzymy w przejrzystość i innowacje prowadzone przez społeczność.

My to robimy.

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

Wszystkie wagi modelu są pobierane z ich oficjalnych repozytoriów. Nie dodajemy żadnych zastrzeżonych modyfikacji.

Infrastruktura

TTS.ai działa na dedykowanych serwerach GPU z NVIDIA Tesla P40 GPUs (w sumie 96GB VRAM). Nasza infrastruktura jest przeznaczona do niskiego latency i wysokiego przepustu:

  • Dedykowane klastry GPU dla wyników - brak dzielonych zasobów
  • Dynamiczny przydział GPU na podstawie wymogów modelu VRAM
  • 5-ekwiwalentowy system priorytetowy dla optymalnego przepustu
  • Modele wstępnie załadowane w VRAM w odniesieniu do wyników natychmiastowych
  • Dostawa dźwięku opartego na CDN do szybkich pobierań

Prywatność i bezpieczeństwo

  • Brak szkolenia danych: Nigdy nie używamy twojego audio lub tekstu do szkolenia modeli
  • Auto-delekcja: Wygenerowany dźwięk jest automatycznie usuwany po 24 godzinach
  • Zaszyfrowanie: Wszystkie dane są zaszyfrowane w tranzycie (TLS 1,2+) i w spoczynku
  • < strong> Brak śledzenia:
  • GDPR zgodny: Zapytaj o dane lub usunięcie w dowolnym momencie

O TTS.ai FAQ

TTS.ai został zbudowany przez niezależny zespół deweloperów pasjonujący do uczynienia technologią głosową AI dostępną dla wszystkich. Kurujemy i serwujemy najlepsze modele open-source od społeczności, a nie szkolenia zastrzeżonych.

Nasza infrastruktura działa na dedykowanych serwerach z NVIDIA Tesla P40 GPU zapewnia 96GB VRAM. Sprzęt internetowy i serwery wyników GPU są przechowywane w bezpiecznych centrach danych o niskiej długości łączności.

Zminimalizujemy przechowywanie danych. Wejścia tekstu są przetwarzane w czasie rzeczywistym i nie są na stałe przechowywane. Wszystkie wysłane i generowane pliki audio są automatycznie usuwane w ciągu 24 godzin. Nigdy nie używamy Twoich danych do szkolenia modeli AI.

TTS.ai służy rosnącej społeczności deweloperów, twórców treści i przedsiębiorstw na całym świecie. Nasza platforma zajmuje się tysiącami prośb o generację głosu codziennie w 24+ modelach AI.

Staramy się o wysoką dostępność z naszym dedykowanym systemem GPU i pięciokresowym priorytetem. Chociaż nie oferujemy formalnego SLA dla użytkowników wolnociągowych, plany płatnicze korzystają z priorytetowego przetwarzania i większej niezawodności.

Tak. Każdy model na TTS.ai jest otwartym źródłem, licencjonowanym pod MIT lub Apache 2.0. Aktywnie wspieramy otwartą społeczność głosową AI i przyczyniamy się do optymalizacji i integracji z powrotem do ekosystemu.

Nasz plan działania obejmuje dodawanie nowych najnowocześniejszych modeli, gdyż są one wydawane, rozszerzane wsparcie językowe, poprawa możliwości rozmowy głosowej w czasie rzeczywistym i budowanie więcej narzędzi do przetwarzania dźwięku. Ciągle integrujemy najnowsze otwarte głosy AI.

Zawsze interesują nas utalentowani deweloperzy pasjonujący do głosu AI i technologii open-source. Jeśli jesteś zainteresowany wkładem, prosimy o kontakt za pośrednictwem naszej strony kontaktowej.

Tak, z zadowoleniem przyjmujemy partnerstwa z deweloperami, firmami i organizacjami, którzy chcą włączyć głosowy AI do swoich produktów. Skontaktuj się z nami, aby omówić integrację API, cenę wolumenu lub wdrożenie modelu custom.

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.