O tematie

Najbardziej kompleksowa platforma open-source AI. 20+ modeli, 100+ głosów, wszystko w jednym miejscu.

Stworzony przez

TTS.ai został stworzony przez John Nader (nadermx), Niezależny deweloper budowy otwartego źródła narzędzi AI. TTS.ai jest częścią misji, aby umożliwić wszystkim dostęp do najlepszej technologii głosowej AI – brak zamykania sprzedawców, brak gromadzenia danych, tylko potężna technologia głosowa po uczciwych cenach.

Nasza misja

TTS.ai został zbudowany na prostej wierze: Najlepsza technologia głosowa AI powinna być dostępna dla każdego. Zapewnione usługi pobierają ceny premii za podstawowe teksty do języka, jednak społeczność otwarta stworzyła modele, które pasują lub przekraczają jakość handlową.

Dołączamy do siebie najlepsze modele głosu otwartego AI w jedną, łatwą w użyciu platformę. Żadnego zamykania sprzedawców. Brak zbiorów danych. Tylko potężna technologia głosowa po uczciwych cenach.

Co oferujemy

Tekst do mowy

20+ modeli, w tym Kokoro, Chatterbox, Bark i więcej. Od szybkiej syntezy lekkiej po jakość studiów.

Przemówienie do tekstu

Powered by Whisper, Faster-Whisper, i SenseVoice. Napisz audio w 100+ językach z czasami i wykrywanie głośnika.

Klonowanie głosu

Klonuj dowolny głos z 5-sekundowej próbki. Chatterbox, GPT-SoviTS, CosyVoice 2, i więcej. Tworzenie własnych głosów dla swoich projektów.

Przetwarzanie dźwięku

Powiększenie dźwięku, usunięcie wokałów, rozdzielenie stebr, usunięcie echo/reverb, wykrywanie klucza/BPM i konwertowanie formatów. Wszystkie zasilane przez AI.

Rozmowa głosowa

Rozmowy głosowe w czasie rzeczywistym z AI. Wybierz swój model i głos dla interaktywnego doświadczenia czatu.

Rozwijacz API

Kompatybilny z OpenAI REST API. Python SDK, przykłady kodów i kompleksowa dokumentacja. Zbuduj funkcje głosowe w aplikacjach.

Pierwsze otwarte źródło

Każdy model na TTS.ai jest otwarty, licencjonowany pod MIT lub Apache 2.0. Wierzymy w przejrzystość i innowacje prowadzone przez społeczność.

My to robimy.

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
I więcej...

Wszystkie wagi modelu są pobierane z ich oficjalnych repozytoriów. Nie dodajemy żadnych zastrzeżonych modyfikacji.

Infrastruktura

TTS.ai działa na dedykowanych serwerach GPU z NVIDIA Tesla P40 GPUs (w sumie 96GB VRAM). Nasza infrastruktura jest przeznaczona do niskiego latency i wysokiego przepustu:

  • Dedykowane klastry GPU dla wyników - brak dzielonych zasobów
  • Dynamiczny przydział GPU na podstawie wymogów modelu VRAM
  • 5-ekwiwalentowy system priorytetowy dla optymalnego przepustu
  • Modele wstępnie załadowane w VRAM w odniesieniu do wyników natychmiastowych
  • Dostawa dźwięku opartego na CDN do szybkich pobierań

Prywatność i bezpieczeństwo

  • Brak szkolenia w zakresie danych: Nigdy nie używamy twojego audio lub tekstu do treningu modeli
  • Automatyczne rozdzielanie: Wygenerowany dźwięk jest automatycznie usuwany po 24 godzinach
  • Szyfrowanie: Wszystkie dane są zaszyfrowane w tranzycie (TLS 1,2+) i w odpoczynku
  • Brak śledzenia: My to robimy.
  • Zgodność GDPR: Zapytać o dane lub usunięcie w dowolnym momencie

O TTS.ai FAQ

TTS.ai został stworzony przez Johna Nadera (nadermx), niezależnego dewelopera pasjonalnego do uczynienia technologią głosową AI dostępną dla wszystkich. Kurujemy i serwujemy najlepsze modele otwartego źródła ze społeczności, a nie szkolenia zastrzeżonych.

Nasza infrastruktura działa na dedykowanych serwerach z NVIDIA Tesla P40 GPU zapewnia 96GB VRAM. Sprzęt internetowy i serwery wyników GPU są przechowywane w bezpiecznych centrach danych o niskiej długości łączności.

Zminimalizujemy przechowywanie danych. Wejścia tekstu są przetwarzane w czasie rzeczywistym i nie są na stałe przechowywane. Wszystkie wysłane i generowane pliki audio są automatycznie usuwane w ciągu 24 godzin. Nigdy nie używamy Twoich danych do szkolenia modeli AI.

TTS.ai służy rosnącej społeczności deweloperów, twórców treści i przedsiębiorstw na całym świecie. Nasza platforma zajmuje się tysiącami prośb o generację głosu codziennie w 20+ modelach AI.

Staramy się o wysoką dostępność z naszym dedykowanym systemem GPU i pięciokresowym priorytetem. Chociaż nie oferujemy formalnego SLA dla użytkowników wolnociągowych, plany płatnicze korzystają z priorytetowego przetwarzania i większej niezawodności.

Tak. Każdy model na TTS.ai jest otwartym źródłem, licencjonowany pod MIT lub Apache 2.0. Aktywnie wspieramy otwartą społeczność głosową AI i przyczyniamy się do optymalizacji i integracji z powrotem do ekosystemu.

Nasz plan działania obejmuje dodawanie nowych najnowocześniejszych modeli, gdyż są one wydawane, rozszerzane wsparcie językowe, poprawa możliwości rozmowy głosowej w czasie rzeczywistym i budowanie więcej narzędzi do przetwarzania dźwięku. Ciągle integrujemy najnowsze otwarte głosy AI.

TTS.ai jest zbudowane i utrzymywane przez solo dewelopera, więc nie ma otwartych pozycji. Jednak wkłady z otwartym źródłem są zawsze mile widziane — dociegnąć do strony kontaktowej lub GitHub.

Tak, z zadowoleniem przyjmujemy partnerstwa z deweloperami, firmami i organizacjami, którzy chcą włączyć głosowy AI do swoich produktów. Skontaktuj się z nami, aby omówić integrację API, cenę wolumenu lub wdrożenie modelu custom.

Prowadzimy regularne przeglądy bezpieczeństwa naszej infrastruktury. Wszystkie dane są szyfrowane w tranzycie z TLS 1.2+, hasła są haszowane z algorytmami standardowymi w branży, a klawisze API używają jednokierunkowego hashingu. Dostęp do serwera jest ograniczony do autoryzowanego personelu za pomocą kluczy SSH.

TTS.ai jest zgodny z GDPR i przestrzega zasad minimizacji danych. Nie przechowywamy danych osobowych po 24 godziny, nie używamy danych klientów do szkolenia i zapewniamy pełny dostęp do danych, korektę i usuwanie na żądanie.

Nieustannie monitorujemy krajobraz otwartego źródła głosu AI i dodajemy nowe modele, gdy stają się dostępne i udowodnimy ich jakość. Największe aktualizacje modelu zwykle zdarzają się co miesiąc, z niewielkimi optymalizacjami rozmieszczone na bieżącej podstawie.