Hakkında
En kapsamlı açık kaynak ses yapay zeka platformu. 20'den fazla model, 100'den fazla ses, hepsi tek bir yerde.
Yaratıcı
TTS.ai tarafından yaratıldı John Nader (nadermx), TTS.ai, en iyi yapay zeka ses teknolojisini herkese ulaştırma misyonunun bir parçasıdır — satıcıya bağlılık yok, veri toplama yok, sadece güçlü ses teknolojisi ve adil fiyatlar.
Görevimiz
TTS.ai basit bir inanç üzerine kuruldu: En iyi yapay zeka ses teknolojisi herkes için ulaşılabilir olmalı.. Özel hizmetler temel metin-ses dönüşümü için premium fiyatlar talep ederken, açık kaynak topluluğu ticari kaliteyi karşılayan veya aşan modelleri yarattı.
En iyi açık kaynaklı sesli yapay zeka modellerini tek bir, kolay kullanılan platformda bir araya getiriyoruz. satıcıya bağlılık yok, veri toplama yok, sadece güçlü ses teknolojisi adil fiyatlarla.
Ne sunuyoruz?
Metinden KonuyaName
Kokoro, Chatterbox, Bark ve daha fazlası dahil 20'den fazla model.
Konuşmadan MetneName
Whisper, Faster-Whisper ve SenseVoice tarafından desteklenir. 100'den fazla dilde sesleri zaman damgaları ve konuşan tespiti ile kopyala.
Ses Klonlama
5 saniyelik bir örnekten herhangi bir sesi klonlayın. Chatterbox, GPT-SoVITS, CosyVoice 2 ve daha fazlası. Projeleriniz için özel sesler oluşturun.
Ses İşlemci
Sesleri iyileştirin, vokalleri kaldırın, dalları bölün, yankı/yankıyı kaldırın, anahtar/BPM'yi tespit edin ve formatları dönüştürün. Tüm bunlar yapay zeka tarafından destekleniyor.
Sesli Sohbet
Yapay zeka ile gerçek zamanlı sesli sohbetler. Etkileşimli bir sohbet deneyimi için modelinizi ve sesinizi seçin.
Geliştirici API
OpenAI uyumlu REST API. Python SDK, kod örnekleri ve kapsamlı belgeleme. Uygulamalarınıza ses özellikleri inşa edin.
Önce Açık Kaynak
TTS.ai'deki her model açık kaynaklı, MIT veya Apache 2.0 lisansı altında. şeffaflığa ve topluluk tarafından yönetilen yeniliğe inanıyoruz.
Biz yapmadık.
Tüm model ağırlıkları resmi depolarından indiriliyor. Hiçbir özel değişiklik yapmadık.
Altyapı
TTS.ai, NVIDIA Tesla P40 GPU'ları (toplam 96GB VRAM) ile özel GPU sunucularında çalışır. altyapımız düşük gecikme ve yüksek verimlilik için tasarlanmıştır:
- İnceleme için özel GPU kümeleri - paylaşılan kaynaklar yok
- Model VRAM gereksinimlerine dayalı dinamik GPU dağıtımı
- Optimum işlem gücü için 5-kuyruk öncelik sistemi
- Anında çıkarımlar için VRAM'de önceden yüklenmiş model
- Hızlı indirme için CDN destekli ses dağıtımı
Gizlilik ve Güvenlik
- Veri eğitimi yok: Modelleri eğitmek için seslerini veya mesajlarını asla kullanmayız.
- Otomatik silme: Üretilmiş ses 24 saat sonra otomatik olarak silinir
- Şifreleme: Tüm veriler geçiş sırasında (TLS 1. 2+) ve bekleme sırasında şifrelenir
- İzleme yok: Biz yapmadık.
- GDPR uyumlu: Verilerinizi isteyin veya her zaman silme