À propos
La plate-forme d'IA vocale open-source la plus complète. 20+ modèles, 100+ voix, tous en un seul endroit.
Créé par
TTS.ai a été créé par John Nader (nadermx), TTS.ai s'inscrit dans le cadre d'une mission visant à rendre la meilleure technologie vocale d'IA accessible à tous — pas de verrouillage des fournisseurs, pas de collecte de données, juste une technologie vocale puissante à des prix équitables.
Notre mission
TTS.ai a été construit sur une simple croyance: la meilleure technologie de voix d'IA devrait être accessible à tous. Bien que les services propriétaires facturent des prix élevés pour le texte de base à la parole, la communauté open-source a créé des modèles qui correspondent ou dépassent la qualité commerciale.
Nous réunissons les meilleurs modèles d'IA vocal open-source en une plate-forme unique et facile à utiliser. Pas de verrouillage de fournisseur. Pas de collecte de données.
Ce que nous offrons
Texte au discours
20+ modèles dont Kokoro, Chatterbox, Bark, et plus encore. De la synthèse légère rapide à la sortie en studio.
Discours au texte
Propulsé par Whisper, Faster-Whisper et SenseVoice. Trancez l'audio en plus de 100 langues avec des horodatages et la détection des haut-parleurs.
Clonage de la voix
Clone n'importe quelle voix d'un échantillon de 5 secondes. Chatterbox, GPT-SoVITS, CosyVoice 2, et plus encore. Créez des voix personnalisées pour vos projets.
Traitement audio
Améliorer l'audio, supprimer les voix, diviser les tiges, supprimer l'écho/réverbération, détecter la clé/BPM, et convertir les formats. Tous alimentés par l'IA.
Clavardage vocal
Conversations vocales en temps réel avec l'IA. Choisissez votre modèle et votre voix pour une expérience de chat interactive.
API développeur
API REST compatible OpenAI. Python SDK, exemples de code et documentation complète. Construisez des fonctions vocales dans vos applications.
Source ouverte d'abord
Chaque modèle sur TTS.ai est open-source, sous licence MIT ou Apache 2.0. Nous croyons en la transparence et l'innovation communautaire.
C'est ce que nous faisons.
Tous les poids du modèle sont téléchargés à partir de leurs dépôts officiels. Nous n'ajoutons aucune modification propriétaire.
Infrastructures
TTS.ai fonctionne sur des serveurs GPU dédiés avec des GPU NVIDIA Tesla P40 (96 Go de VRAM total). Notre infrastructure est conçue pour une faible latence et un débit élevé:
- Modules GPU dédiés à l'inférence - aucune ressource partagée
- Attribution dynamique du GPU sur la base des exigences du modèle VRAM
- Système prioritaire à 5 files pour un débit optimal
- Modèles préchargés en VRAM pour une inférence instantanée
- Livraison audio soutenue par CDN pour téléchargements rapides
Confidentialité et sécurité
- Pas de formation sur les données: Nous n'utilisons jamais votre audio ou votre texte pour former des modèles
- Suppression automatique: L'audio généré est automatiquement supprimé après 24 heures
- Chiffrement : Toutes les données sont cryptées en transit (TLS 1.2+) et au repos
- Pas de suivi: C'est ce que nous faisons.
- Conformément au RGPD: Demander vos données ou suppression à tout moment