Détecteur de failles de la voix d'IA

Spot AI-généré, cloné, et la parole synthétique dans n'importe quel clip audio. Obtenez un score de probabilité plus la cote de confiance en secondes — l'inverse de TTS, construit sur les mêmes modèles.

Télécharger Audio pour vérifier

200 caractères

Faites glisser et déposez votre fichier ici, ou parcourir

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

fichier.mp3

0 MB
— ou enregistrer à partir de votre microphone —
00:00
Gratuit — 10 détections par jour, pas d'inscription nécessaire
Analyse de l'audio...

Analyse de l'audio contre le classificateur...

Utilisation du classificateur de base HuBERT (MIT)
Verdict

Probabilité que le clip soit généré par l'IA

Verdict
Confiance
Appréciation audio
Coût
Afficher les scores de la classe brute

                    

Comment ça marche

Le détecteur est un classificateur de base HuBERT (Meta AI, MIT sous licence) affiné sur FoR, ASVspoof, et WaveFake — trois des plus grands corps publics de discours humain-vs-synthétiques.

Il renvoie la probabilité que le clip ait été généré par un modèle TTS, un clone vocal ou un autre système d'IA, plus une cote de confiance. Traitez le score comme un signal fort, pas une preuve légale.

Qui l'utilise?

  • Les journalistes vérifient les enregistrements divulgués ou anonymes
  • Les acheteurs du marché qui vérifient les échantillons vocaux sont humains avant de payer
  • Les équipes de confiance et de sécurité dénoncent le harcèlement vocal
  • Les chercheurs étiquetent les ensembles de données à l'échelle
  • Les créateurs prouvant leur propre son est authentique

Formats pris en charge

MP3, WAV, FLAC, OGG, M4A

Max 50 Mo par fichier. Les 60 premières secondes sont notées — les longs clips sont tronqués.

Plans de détection des infimes profonds

Commencez gratuitement, mise à niveau lorsque vous avez besoin de plus

Gratuit
  • 10 détections par jour
  • Clips jusqu'à 60 secondes
  • Probabilité + score de confiance
  • Pas de compte requis
Les plus populaires
Compte gratuit
  • 15 000 caractères gratuits lors de l'inscription
  • 200 caractères par détection
  • Historique de la détection
  • Tous les détails de sortie (scores de classe brute)
Inscription gratuite
Pour
  • file d'attente GPU prioritaire
  • Détection en vrac via l'API
  • Alertes Webhook sur les verdicts des FAKE
  • Intégration du marché
Mise à jour

Foire aux questions

Il analyse un clip audio et vous indique la probabilité que le discours soit généré par l'IA, cloné, ou autrement synthétique. Vous obtenez une note de 0-100% plus une cote de confiance, de sorte que vous pouvez décider si l'enregistrement est suffisamment digne de confiance pour la publication, le paiement, ou la preuve.

Un classificateur de base HuBERT (Meta AI, MIT licensed) peaufiné sur trois des plus grands corps publics de discours humain-vs-synthétique: FoR (Fake-or-Real), ASVspoof, et WaveFake. La fine-tune est publiée sous le nom de MelodyMachine/Deepfake-audio-detection-V2 sur Hugging Face.

Sur le test public FoR, les rapports de modèle sous-jacents sont supérieurs à 95 % de précision, et sur les attaques de style ASVspoof, il affiche systématiquement TTS et sortie de fermeture vocale. L'exactitude sur les nouveaux modèles que le classificateur n'a jamais vu est plus faible — traiter le score comme un signal fort, et non une preuve légale.

Vous pouvez télécharger des clips jusqu'à 50 Mo et environ 60 secondes de parole. Les enregistrements plus longs sont automatiquement tronqués à la première minute, ce qui suffit pour que le classificateur prenne une décision stable.

Non. Le clip est traité en mémoire sur notre serveur GPU, le résultat vous est retourné, et le répertoire de téléchargement est supprimé immédiatement. Nous n'avons jamais enregistré, partagé ou utilisé votre audio pour la formation.

La détection coûte 200 caractères par clip, la plus petite opération payante sur la plate-forme. Les comptes gratuits peuvent exécuter quelques détections par jour; les utilisateurs payants peuvent les exécuter à pleine vitesse avec un accès prioritaire à la file d'attente.

Le marché permet aux acheteurs de vérifier qu'un échantillon téléchargé par un créateur est humain avant de payer. Les journalistes peuvent vérifier l'authenticité de l'enregistrement des fuites. Les équipes de sécurité de la plate-forme peuvent détecter le harcèlement vocal. Le détecteur est l'inverse de TTS: même expertise, objectif opposé.

Pas encore — le détecteur v1 ne produit que des résultats réels ou synthétiques. L'attribution du modèle (quel moteur TTS a fait cela?) est sur la feuille de route une fois que nous avons suffisamment d'échantillons étiquetés par modèle.
5.0/5 (1)

Que pourrions-nous améliorer? Vos commentaires nous aident à résoudre les problèmes.

Prêt à commencer?

Inscrivez-vous gratuitement et obtenez 50 crédits. Aucune carte de crédit requise.