KI-Stimme Deepfake-Detektor

Spot AI-generiert, geklont und synthetische Sprache in jedem Audio-Clip. Erhalten Sie eine Wahrscheinlichkeits-Score plus Vertrauens-Rating in Sekunden – die Umkehrung von TTS, auf den gleichen Modellen gebaut.

Audio hochladen, um zu überprüfen

200 Zeichen

Drag & Drop Ihre Datei hier, oder durchsuchen

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

Datei.mp3

0 MB
— oder von Ihrem Mikrofon aufnehmen —
00:00
Kostenlos — 10 Detektionen pro Tag, keine Anmeldung erforderlich
Analysieren von Audio...

Analysieren von Audio gegen den Deepfake-Klassifikator...

Verwendung des HuBERT-Basisklassifikators (MIT)
Urteil

Wahrscheinlichkeit, dass der Clip KI-generiert ist

Urteil
Vertrauen
Audiopartitur
Kosten
Rohe Klassenwerte anzeigen

                    

Wie es funktioniert

Der Detektor ist ein HuBERT-Basisklassifikator (Meta AI, MIT lizensiert) fein abgestimmt auf FoR, ASVspoof und WaveFake – drei der größten öffentlichen Korpora der menschlichen-vs-synthetischen Sprache.

Es gibt die Wahrscheinlichkeit, dass der Clip von einem TTS-Modell, Sprachklon oder einem anderen KI-System erzeugt wurde, plus eine Vertrauensbewertung. Behandeln Sie die Partitur als starkes Signal, nicht als rechtlicher Beweis.

Wer nutzt das?

  • Journalisten überprüfen durchgesickerte oder anonyme Aufnahmen
  • Marktplatzkäufer, die Sprachproben überprüfen, sind menschlich, bevor sie zahlen
  • Vertrauens- und Sicherheitsteams, die lautstarke Belästigung anprangern
  • Forscher, die Datensätze im Maßstab kennzeichnen
  • Schöpfer, die ihren eigenen Ton beweisen, sind echt

Unterstützte Formate

MP3, WAV, FLAC, OGG, M4A

Max. 50MB pro Datei. Die ersten 60 Sekunden werden gepunktet – lange Clips werden abgeschnitten.

Deepfake-Erkennungspläne

Starten Sie kostenlos, aktualisieren Sie, wenn Sie mehr benötigen

Frei
  • 10 Detektionen pro Tag
  • Clips bis zu 60 Sekunden
  • Wahrscheinlichkeit + Konfidenzwert
  • Kein Konto erforderlich
Am beliebtesten
Kostenloses Konto
  • 15.000 freie Zeichen auf Anmeldung
  • 200 Zeichen pro Erkennung
  • Vorgeschichte der Erkennung
  • Alle Ausgabedetails (Rohklasse-Scores)
Kostenlos anmelden
Pro
  • Prioritäts-GPU-Warteschlange
  • Massenerkennung über API
  • Webhook Warnungen auf FAKE Urteile
  • Integration der Märkte
Aktualisierung

Häufig gestellte Fragen

Es analysiert einen Audioclip und gibt Ihnen die Wahrscheinlichkeit, dass die Sprache KI-generiert, geklont oder auf andere Weise synthetisch ist. Sie erhalten eine 0-100%-Score plus eine Confidence-Rating, so dass Sie entscheiden können, ob die Aufnahme vertrauenswürdig genug für die Veröffentlichung, Zahlung oder Beweise ist.

Ein HuBERT-Basisklassifikator (Meta AI, MIT lizensiert) Feinabstimmung auf drei der größten öffentlichen Korpora der human-vs-synthetischen Rede: FoR (Fake-or-Real), ASVspoof und WaveFake. Der Feinabstimmung wird als MelodyMachine/Deepfake-Audio-Detection-V2 auf Hugging Face veröffentlicht.

Auf dem öffentlichen FoR-Test wurden die zugrunde liegenden Modellberichte über 95% Genauigkeit gesetzt, und auf ASVspoof-Stil greift es konsequent Flaggen TTS und Voice-Cloning-Ausgabe. Genauigkeit bei neuen Modellen, die der Klassifikator noch nie gesehen hat, ist niedriger – behandeln Sie die Partitur als ein starkes Signal, nicht rechtliche Beweise.

Sie können Clips bis zu 50MB und etwa 60 Sekunden Rede hochladen. Längere Aufnahmen werden automatisch auf die erste Minute gekürzt, was dem Klassifikator genügt, um eine stabile Entscheidung zu treffen.

Nein. Der Clip wird im Speicher auf unserem GPU-Server verarbeitet, das Ergebnis wird Ihnen zurückgegeben und das Upload-Verzeichnis wird sofort gelöscht. Wir protokollieren, teilen oder nutzen Ihre Audios nie für Schulungen.

Die Erkennung kostet 200 Zeichen pro Clip — die kleinste bezahlte Operation auf der Plattform. Kostenlose Konten können ein paar Detektionen pro Tag ausführen; angemeldete bezahlte Benutzer können sie mit voller Geschwindigkeit mit vorrangigem Warteschlangenzugriff ausführen.

Vertrauen zählt mehr, nicht weniger, in einer Welt voller synthetischer Stimmen. Der Marktplatz lässt Käufer überprüfen, ein Schöpfer-uploaded Probe ist menschlich vor dem Bezahlen. Journalisten können durchgesickert-Aufzeichnung Authentizität überprüfen. Plattform-Sicherheitsteams können Sprach-cloned Belästigungen erkennen. Der Detektor ist das Gegenteil von TTS: gleiche Expertise, entgegengesetztes Ziel.

Noch nicht — der v1 Detektor liefert nur reale vs. Synthetische. Modellzuweisung (welche TTS-Engine hat dies gemacht?) ist auf dem Fahrplan, sobald wir genug markierte Proben pro Modell haben.
5.0/5 (1)

Was könnten wir verbessern? Ihr Feedback hilft uns, Probleme zu beheben.

Bereit für den Anfang?

Melde dich kostenlos an und erhalte 15.000 Zeichen. Keine Kreditkarte erforderlich.