À propos

La plate-forme d'IA vocale open-source la plus complète. 20+ modèles, 100+ voix, tous en un seul endroit.

Créé par

TTS.ai a été créé par John Nader (nadermx), TTS.ai s'inscrit dans le cadre d'une mission visant à rendre la meilleure technologie vocale d'IA accessible à tous — pas de verrouillage des fournisseurs, pas de collecte de données, juste une technologie vocale puissante à des prix équitables.

Notre mission

TTS.ai a été construit sur une simple croyance: la meilleure technologie de voix d'IA devrait être accessible à tous. Bien que les services propriétaires facturent des prix élevés pour le texte de base à la parole, la communauté open-source a créé des modèles qui correspondent ou dépassent la qualité commerciale.

Nous réunissons les meilleurs modèles d'IA vocal open-source en une plate-forme unique et facile à utiliser. Pas de verrouillage de fournisseur. Pas de collecte de données.

Ce que nous offrons

Texte au discours

20+ modèles dont Kokoro, Chatterbox, Bark, et plus encore. De la synthèse légère rapide à la sortie en studio.

Discours au texte

Propulsé par Whisper, Faster-Whisper et SenseVoice. Trancez l'audio en plus de 100 langues avec des horodatages et la détection des haut-parleurs.

Clonage de la voix

Clone n'importe quelle voix d'un échantillon de 5 secondes. Chatterbox, GPT-SoVITS, CosyVoice 2, et plus encore. Créez des voix personnalisées pour vos projets.

Traitement audio

Améliorer l'audio, supprimer les voix, diviser les tiges, supprimer l'écho/réverbération, détecter la clé/BPM, et convertir les formats. Tous alimentés par l'IA.

Clavardage vocal

Conversations vocales en temps réel avec l'IA. Choisissez votre modèle et votre voix pour une expérience de chat interactive.

API développeur

API REST compatible OpenAI. Python SDK, exemples de code et documentation complète. Construisez des fonctions vocales dans vos applications.

Source ouverte d'abord

Chaque modèle sur TTS.ai est open-source, sous licence MIT ou Apache 2.0. Nous croyons en la transparence et l'innovation communautaire.

C'est ce que nous faisons.

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
Et plus encore...

Tous les poids du modèle sont téléchargés à partir de leurs dépôts officiels. Nous n'ajoutons aucune modification propriétaire.

Infrastructures

TTS.ai fonctionne sur des serveurs GPU dédiés avec des GPU NVIDIA Tesla P40 (96 Go de VRAM total). Notre infrastructure est conçue pour une faible latence et un débit élevé:

  • Modules GPU dédiés à l'inférence - aucune ressource partagée
  • Attribution dynamique du GPU sur la base des exigences du modèle VRAM
  • Système prioritaire à 5 files pour un débit optimal
  • Modèles préchargés en VRAM pour une inférence instantanée
  • Livraison audio soutenue par CDN pour téléchargements rapides

Confidentialité et sécurité

  • Pas de formation sur les données: Nous n'utilisons jamais votre audio ou votre texte pour former des modèles
  • Suppression automatique: L'audio généré est automatiquement supprimé après 24 heures
  • Chiffrement : Toutes les données sont cryptées en transit (TLS 1.2+) et au repos
  • Pas de suivi: C'est ce que nous faisons.
  • Conformément au RGPD: Demander vos données ou suppression à tout moment

À propos de TTS.ai FAQ

TTS.ai a été créé par John Nader (nadermx), un développeur indépendant passionné de rendre la technologie vocale AI accessible à tout le monde. Nous préparons et servons les meilleurs modèles open-source de la communauté plutôt que de former des modèles propriétaires.

Notre infrastructure fonctionne sur des serveurs dédiés avec NVIDIA Tesla P40 GPU fournissant 96 Go de VRAM. Les serveurs de référence web et d'inférence GPU sont hébergés dans des centres de données sécurisés avec une connectivité à faible latence.

Nous minimisons le stockage des données. Les entrées de texte sont traitées en temps réel et ne sont pas stockées en permanence. Tous les fichiers audio téléchargés et générés sont automatiquement supprimés dans les 24 heures. Nous n'utilisons jamais vos données pour former des modèles d'IA.

TTS.ai sert une communauté croissante de développeurs, de créateurs de contenu et d'entreprises dans le monde entier. Notre plateforme traite des milliers de demandes de génération de voix chaque jour sur 20+ modèles d'IA.

Nous nous efforçons d'obtenir une grande disponibilité grâce à notre infrastructure GPU dédiée et à notre système prioritaire de 5 files. Bien que nous n'offrons pas de SLA formel pour les utilisateurs de niveau gratuit, les régimes payants bénéficient d'un traitement prioritaire et d'une fiabilité accrue.

Oui. Chaque modèle sur TTS.ai est open-source, sous licence MIT ou Apache 2.0. Nous soutenons activement la communauté d'IA vocale open-source et contribuons à l'optimisation et à l'intégration de l'écosystème.

Notre feuille de route inclut l'ajout de nouveaux modèles de pointe au fur et à mesure de leur lancement, l'extension du support linguistique, l'amélioration des capacités de chat vocal en temps réel et la construction d'outils de traitement audio.

TTS.ai est construit et entretenu par un développeur solo, de sorte qu'il n'y a pas de positions ouvertes. Cependant, les contributions open-source sont toujours les bienvenues — atteindre par l'intermédiaire de la page de contact ou GitHub.

Oui, nous accueillons les partenariats avec les développeurs, les entreprises et les organisations qui cherchent à intégrer l'IA vocale dans leurs produits. Contactez-nous pour discuter de l'intégration de l'API, du prix du volume ou du déploiement de modèles personnalisés.

Nous effectuons régulièrement des examens de sécurité de notre infrastructure. Toutes les données sont cryptées en transit avec TLS 1.2+, les mots de passe sont hashed avec des algorithmes standard de l'industrie, et les clés API utilisent le hashing à sens unique. L'accès du serveur est limité au personnel autorisé via les clés SSH.

TTS.ai est conforme au RGPD et respecte les principes de minimisation des données. Nous ne stockons pas les données audio personnelles au-delà de 24 heures, n'utilisons pas les données client pour la formation, et fournissons des droits complets d'accès, de correction et de suppression des données sur demande.

Nous surveillons en permanence le paysage d'IA vocal open-source et ajoutons de nouveaux modèles à mesure qu'ils deviennent disponibles et prouvent leur qualité.

Questions? Rétroaction?

Contactez-nous Docs de l'API