Detector de Deepfake de voz de AI

Spot IA generado, clonado y voz sintética en cualquier clip de audio. Obtenga una puntuación de probabilidad más la calificación de confianza en segundos — el inverso de TTS, construido en los mismos modelos.

Subir audio para verificar

200 caracteres

Arrastre y suelte su archivo aquí, o navegar

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

file.mp3

0 MB
— o grabar desde su micrófono —
00:00
Gratis — 10 detecciones por día, no se necesita registro
Analizando audio...

Analizar el audio contra el clasificador de deepfake...

Utilizando el clasificador de base HuBERT (MIT)
Veredicto

Probabilidad de que el clip esté generado por IA

Veredicto
Confianza
Puntuación de audio
Costo
Mostrar resultados de clase en bruto

                    

Cómo funciona

El detector es un clasificador de base HuBERT (Meta AI, licenciado por el MIT) afinado en FoR, ASVspoof y WaveFake, tres de los mayores cuerpos públicos de habla humana-vs-sintética.

Devuelve la probabilidad de que el clip fue generado por un modelo TTS, clon de voz, u otro sistema de IA, además de una calificación de confianza. Trate la puntuación como una señal fuerte, no prueba legal.

¿Quién usa esto?

  • Periodistas que investigan grabaciones filtradas o anónimas
  • Compradores de mercado verificar muestras de voz son humanos antes de pagar
  • Equipos de confianza y seguridad que señalan el acoso cerrado por la voz
  • Investigadores etiquetan conjuntos de datos a escala
  • Los creadores que prueban su propio audio son genuinos

Formatos soportados

MP3, WAV, FLAC, OGG, M4A

Máximo 50MB por archivo. Se marcan los primeros 60 segundos — los clips largos son truncados.

Planes de detección de deepfake

Comience gratis, actualice cuando necesite más

Libre
  • 10 detecciones por día
  • Clips de hasta 60 segundos
  • Probabilidad + puntuación de confianza
  • No se requiere cuenta
Más populares
Cuenta gratuita
  • 15.000 caracteres gratis en el registro
  • 200 caracteres por detección
  • Historial de detección
  • Todos los detalles de salida (puntuaciones de clase en bruto)
Regístrate gratis
Pro
  • Cola de GPU prioritaria
  • Detección a granel a través de API
  • Alertas webhook sobre veredictos falsos
  • Integración en el mercado
Actualizar

Preguntas frecuentes

Analiza un clip de audio y le dice la probabilidad de que el discurso sea generado por IA, clonado o sintético de otro modo. Obtendrá una puntuación de 0-100% más una calificación de confianza, por lo que puede decidir si la grabación es lo suficientemente confiable para su publicación, pago o evidencia.

Un clasificador de base HuBERT (Meta AI, licencia MIT) afinado en tres de los mayores cuerpos públicos de habla humana-vs-sintética: FoR (Fake-or-Real), ASVspoof, y WaveFake. El fino-tune se publica como MelodyMachine/Deepfake-audio-detection-V2 en Hugging Face.

En la prueba pública de FoR se establecen los informes de modelos subyacentes por encima de la precisión del 95%, y en los ataques de estilo ASVspoof que constantemente banderas TTS y voz-clonación salida. Precisión en nuevos modelos que el clasificador nunca ha visto es menor — tratar la puntuación como una señal fuerte, no prueba legal.

Puede subir clips de hasta 50MB y aproximadamente 60 segundos de voz. Las grabaciones más largas se truncan automáticamente hasta el primer minuto, lo que es suficiente para que el clasificador tome una decisión estable.

No. El clip se procesa en memoria en nuestro servidor GPU, el resultado se devuelve a usted, y el directorio de carga se elimina inmediatamente. Nunca registramos, compartimos o usamos su audio para entrenamiento.

La detección cuesta 200 caracteres por clip, la operación de pago más pequeña de la plataforma. Las cuentas gratuitas pueden ejecutar unas cuantas detecciones por día; los usuarios que inician sesión pueden ejecutarlas a toda velocidad con acceso prioritario a la cola.

La confianza importa más, no menos, en un mundo lleno de voces sintéticas. El mercado permite a los compradores verificar que una muestra cargada por el creador es humana antes de pagar. Los periodistas pueden investigar la autenticidad de la grabación filtrada. Los equipos de seguridad de la plataforma pueden detectar el acoso cerrado por voz. El detector es la inversa de TTS: la misma experiencia, objetivo opuesto.

Todavía no — el detector v1 sólo salidas real vs sintético. La atribución del modelo (que el motor TTS hizo esto?) está en la hoja de ruta una vez que tenemos suficientes muestras etiquetadas por modelo.
5.0/5 (1)

¿Qué podríamos mejorar? Sus comentarios nos ayudan a solucionar problemas.

¿Listo para empezar?

Regístrese gratis y obtenga 15.000 caracteres. No se requiere tarjeta de crédito.