Informar de fallo / Petición de características

Detector de Deepfake de voz de AI

Spot IA generado, clonado y voz sintética en cualquier clip de audio. Obtenga una puntuación de probabilidad más la calificación de confianza en segundos — el inverso de TTS, construido en los mismos modelos.

Regístrate gratis

Subir audio para verificar

200 caracteres

Arrastre y suelte su archivo aquí, o navegar

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

— o grabar desde su micrófono —

00:00

Gratis — 10 detecciones por día, no se necesita registro

Cómo funciona

El detector es un clasificador de base HuBERT (Meta AI, licenciado por el MIT) afinado en FoR, ASVspoof y WaveFake, tres de los mayores cuerpos públicos de habla humana-vs-sintética.

Devuelve la probabilidad de que el clip fue generado por un modelo TTS, clon de voz, u otro sistema de IA, además de una calificación de confianza. Trate la puntuación como una señal fuerte, no prueba legal.

¿Quién usa esto?

Periodistas que investigan grabaciones filtradas o anónimas
Compradores de mercado verificar muestras de voz son humanos antes de pagar
Equipos de confianza y seguridad que señalan el acoso cerrado por la voz
Investigadores etiquetan conjuntos de datos a escala
Los creadores que prueban su propio audio son genuinos

Formatos soportados

MP3, WAV, FLAC, OGG, M4A

Máximo 50MB por archivo. Se marcan los primeros 60 segundos — los clips largos son truncados.

Planes de detección de deepfake

Comience gratis, actualice cuando necesite más

Libre

10 detecciones por día
Clips de hasta 60 segundos
Probabilidad + puntuación de confianza
No se requiere cuenta

Preguntas frecuentes

Analiza un clip de audio y le dice la probabilidad de que el discurso sea generado por IA, clonado o sintético de otro modo. Obtendrá una puntuación de 0-100% más una calificación de confianza, por lo que puede decidir si la grabación es lo suficientemente confiable para su publicación, pago o evidencia.

Un clasificador de base HuBERT (Meta AI, licencia MIT) afinado en tres de los mayores cuerpos públicos de habla humana-vs-sintética: FoR (Fake-or-Real), ASVspoof, y WaveFake. El fino-tune se publica como MelodyMachine/Deepfake-audio-detection-V2 en Hugging Face.

En la prueba pública de FoR se establecen los informes de modelos subyacentes por encima de la precisión del 95%, y en los ataques de estilo ASVspoof que constantemente banderas TTS y voz-clonación salida. Precisión en nuevos modelos que el clasificador nunca ha visto es menor — tratar la puntuación como una señal fuerte, no prueba legal.

Puede subir clips de hasta 50MB y aproximadamente 60 segundos de voz. Las grabaciones más largas se truncan automáticamente hasta el primer minuto, lo que es suficiente para que el clasificador tome una decisión estable.

No. El clip se procesa en memoria en nuestro servidor GPU, el resultado se devuelve a usted, y el directorio de carga se elimina inmediatamente. Nunca registramos, compartimos o usamos su audio para entrenamiento.

La detección cuesta 200 caracteres por clip, la operación de pago más pequeña de la plataforma. Las cuentas gratuitas pueden ejecutar unas cuantas detecciones por día; los usuarios que inician sesión pueden ejecutarlas a toda velocidad con acceso prioritario a la cola.

La confianza importa más, no menos, en un mundo lleno de voces sintéticas. El mercado permite a los compradores verificar que una muestra cargada por el creador es humana antes de pagar. Los periodistas pueden investigar la autenticidad de la grabación filtrada. Los equipos de seguridad de la plataforma pueden detectar el acoso cerrado por voz. El detector es la inversa de TTS: la misma experiencia, objetivo opuesto.

Todavía no — el detector v1 sólo salidas real vs sintético. La atribución del modelo (que el motor TTS hizo esto?) está en la hoja de ruta una vez que tenemos suficientes muestras etiquetadas por modelo.

5.0/5 (1)

¿Listo para empezar?

Regístrese gratis y obtenga 15.000 caracteres. No se requiere tarjeta de crédito.

Regístrate gratis Ver precios

Detector de Deepfake de voz de AI

Subir audio para verificar

Cómo funciona

¿Quién usa esto?

Formatos soportados

Planes de detección de deepfake

Preguntas frecuentes

¿Qué hace el detector de deepfake?

¿Qué modelo activa el detector?

¿ Cuán exacto es el resultado?

¿Cuánto tiempo puede ser mi audio?

¿Se almacena mi audio después de la detección?

¿Cuánto cuesta?

¿Por qué existe esto en un sitio TTS?

¿Puede saber qué modelo TTS produjo un clip de audio?

¿Listo para empezar?