Fehler melden / Feature-Anforderung

KI-Stimme Deepfake-Detektor

Spot AI-generiert, geklont und synthetische Sprache in jedem Audio-Clip. Erhalten Sie eine Wahrscheinlichkeits-Score plus Vertrauens-Rating in Sekunden – die Umkehrung von TTS, auf den gleichen Modellen gebaut.

Kostenlos anmelden

Audio hochladen, um zu überprüfen

200 Zeichen

Drag & Drop Ihre Datei hier, oder durchsuchen

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

— oder von Ihrem Mikrofon aufnehmen —

00:00

Kostenlos — 10 Detektionen pro Tag, keine Anmeldung erforderlich

Wie es funktioniert

Der Detektor ist ein HuBERT-Basisklassifikator (Meta AI, MIT lizensiert) fein abgestimmt auf FoR, ASVspoof und WaveFake – drei der größten öffentlichen Korpora der menschlichen-vs-synthetischen Sprache.

Es gibt die Wahrscheinlichkeit, dass der Clip von einem TTS-Modell, Sprachklon oder einem anderen KI-System erzeugt wurde, plus eine Vertrauensbewertung. Behandeln Sie die Partitur als starkes Signal, nicht als rechtlicher Beweis.

Wer nutzt das?

Journalisten überprüfen durchgesickerte oder anonyme Aufnahmen
Marktplatzkäufer, die Sprachproben überprüfen, sind menschlich, bevor sie zahlen
Vertrauens- und Sicherheitsteams, die lautstarke Belästigung anprangern
Forscher, die Datensätze im Maßstab kennzeichnen
Schöpfer, die ihren eigenen Ton beweisen, sind echt

Unterstützte Formate

MP3, WAV, FLAC, OGG, M4A

Max. 50MB pro Datei. Die ersten 60 Sekunden werden gepunktet – lange Clips werden abgeschnitten.

Deepfake-Erkennungspläne

Starten Sie kostenlos, aktualisieren Sie, wenn Sie mehr benötigen

Frei

10 Detektionen pro Tag
Clips bis zu 60 Sekunden
Wahrscheinlichkeit + Konfidenzwert
Kein Konto erforderlich

Am beliebtesten

Kostenloses Konto

15.000 freie Zeichen auf Anmeldung
200 Zeichen pro Erkennung
Vorgeschichte der Erkennung
Alle Ausgabedetails (Rohklasse-Scores)

Kostenlos anmelden

Pro

Prioritäts-GPU-Warteschlange
Massenerkennung über API
Webhook Warnungen auf FAKE Urteile
Integration der Märkte

Aktualisierung

Häufig gestellte Fragen

Es analysiert einen Audioclip und gibt Ihnen die Wahrscheinlichkeit, dass die Sprache KI-generiert, geklont oder auf andere Weise synthetisch ist. Sie erhalten eine 0-100%-Score plus eine Confidence-Rating, so dass Sie entscheiden können, ob die Aufnahme vertrauenswürdig genug für die Veröffentlichung, Zahlung oder Beweise ist.

Ein HuBERT-Basisklassifikator (Meta AI, MIT lizensiert) Feinabstimmung auf drei der größten öffentlichen Korpora der human-vs-synthetischen Rede: FoR (Fake-or-Real), ASVspoof und WaveFake. Der Feinabstimmung wird als MelodyMachine/Deepfake-Audio-Detection-V2 auf Hugging Face veröffentlicht.

Auf dem öffentlichen FoR-Test wurden die zugrunde liegenden Modellberichte über 95% Genauigkeit gesetzt, und auf ASVspoof-Stil greift es konsequent Flaggen TTS und Voice-Cloning-Ausgabe. Genauigkeit bei neuen Modellen, die der Klassifikator noch nie gesehen hat, ist niedriger – behandeln Sie die Partitur als ein starkes Signal, nicht rechtliche Beweise.

Sie können Clips bis zu 50MB und etwa 60 Sekunden Rede hochladen. Längere Aufnahmen werden automatisch auf die erste Minute gekürzt, was dem Klassifikator genügt, um eine stabile Entscheidung zu treffen.

Nein. Der Clip wird im Speicher auf unserem GPU-Server verarbeitet, das Ergebnis wird Ihnen zurückgegeben und das Upload-Verzeichnis wird sofort gelöscht. Wir protokollieren, teilen oder nutzen Ihre Audios nie für Schulungen.

Die Erkennung kostet 200 Zeichen pro Clip — die kleinste bezahlte Operation auf der Plattform. Kostenlose Konten können ein paar Detektionen pro Tag ausführen; angemeldete bezahlte Benutzer können sie mit voller Geschwindigkeit mit vorrangigem Warteschlangenzugriff ausführen.

Vertrauen zählt mehr, nicht weniger, in einer Welt voller synthetischer Stimmen. Der Marktplatz lässt Käufer überprüfen, ein Schöpfer-uploaded Probe ist menschlich vor dem Bezahlen. Journalisten können durchgesickert-Aufzeichnung Authentizität überprüfen. Plattform-Sicherheitsteams können Sprach-cloned Belästigungen erkennen. Der Detektor ist das Gegenteil von TTS: gleiche Expertise, entgegengesetztes Ziel.

Noch nicht — der v1 Detektor liefert nur reale vs. Synthetische. Modellzuweisung (welche TTS-Engine hat dies gemacht?) ist auf dem Fahrplan, sobald wir genug markierte Proben pro Modell haben.

5.0/5 (1)

Bereit für den Anfang?

Melde dich kostenlos an und erhalte 15.000 Zeichen. Keine Kreditkarte erforderlich.

Kostenlos anmelden Preise anzeigen

KI-Stimme Deepfake-Detektor

Audio hochladen, um zu überprüfen

Wie es funktioniert

Wer nutzt das?

Unterstützte Formate

Deepfake-Erkennungspläne

Häufig gestellte Fragen

Was macht der Deepfake-Detektor?

Welches Modell treibt den Detektor an?

Wie genau ist das Ergebnis?

Wie lange kann mein Audio dauern?

Wird mein Audio nach der Erkennung gespeichert?

Wie viel kostet das?

Warum existiert dies auf einer TTS-Website?

Kann es erkennen, welches TTS-Modell einen Audioclip produziert hat?

Bereit für den Anfang?