Informar dun erro / Solicitar unha funcionalidade

Detector de falsificacións profundas de voz de IA

Detecte fala xerada por IA, clonada e sintética en calquera clip de son. Obteña unha puntuación de probabilidade máis unha puntuación de confianza en segundos, o inverso de TTS, construído sobre os mesmos modelos.

Non o facemos. Vender a túa voz

Enviar o son para verificalo

200 caracteres

Arrastre e solte o ficheiro aquí, ou navegar

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

ficheiro.mp3

0 MB
— ou gravar co seu micrófono —
00:00
Gratuito — 10 deteccións por día, non é preciso rexistrarse
A analizar o son...

A analizar o son contra o clasificador de deepfake...

Usando o clasificador baseado en HuBERT (MIT)
Verdict

Probabilidade de que o clip sexa xerado por IA

Verdict
Confianza
Áudio puntuado
Custo
Mostrar as puntuacións en bruto da clase

                    

Como funciona

O detector é un clasificador baseado en HuBERT (Meta AI, licenciado polo MIT) afinado en FoR, ASVspoof, e WaveFake — tres dos maiores corpora públicos de fala humana vs. sintética.

Devolve a probabilidade de que o clip fose xerado por un modelo TTS, un clon de voz ou outro sistema de IA, máis unha puntuación de confianza. Trate a puntuación como un sinal forte, non como proba legal.

Quen usa isto

  • Xornalistas que revisan gravacións filtradas ou anónimas
  • Os compradores do mercado verifican que as mostras de voz son humanas antes de pagar
  • Equipos de confianza e seguridade que denuncian acoso por clonación de voz
  • Investigadores etiquetando conxuntos de datos a escala
  • Os creadores proban que o seu propio son é orixinal

Formatos soportados

MP3, WAV, FLAC, OGG, M4A

Máximo 50MB por ficheiro. Os primeiros 60 segundos son contados - os clips longos son truncados.

Plans de detección de falsificacións profundas

Comece de balde, actualice cando precise máis

Libre
  • 10 deteccións por día
  • Clips de ata 60 segundos
  • Probabilidade + puntuación de confianza
  • Non se require conta
Máis popular
Conta libre
  • 15. 000 caracteres libres ao rexistrarse
  • 200 caracteres por detección
  • Historial de detección
  • Todos os detalles da saída (puntuacións das clases en bruto)
Inscríbete gratis
Pro
  • Fila de prioridade da GPU
  • Detección masiva mediante API
  • Alertas de webhook sobre veredictos falsos
  • Integración co mercado
Actualizar

Preguntas frecuentes

Analiza un clip de son e indica a probabilidade de que a voz sexa xerada por IA, clonada ou sintética. Obtén unha puntuación de 0 a 100% máis unha puntuación de confianza, para que poida decidir se a gravación é fiable dabondo para publicación, pagamento ou proba.

Un clasificador baseado en HuBERT (Meta AI, con licenza MIT) afinado en tres dos maiores corpus públicos de fala sintética humana: FoR (Fake- or- Real), ASVspoof e WaveFake. O axuste fino publicouse como MelodyMachine/Deepfake- audio- detection- V2 en Hugging Face.

No conxunto público de probas de FoR, o modelo subxacente informa de precisión superior ao 95%, e nos ataques ao estilo de ASVspoof marca consistentemente a saída de TTS e de clonación de voz. A precisión nos modelos novos que o clasificador nunca viu é menor; trate a puntuación como un sinal forte, non como proba legal.

Pode enviar clips de ata 50 MB e aproximadamente 60 segundos de fala. As gravacións máis longas son truncadas automaticamente ao primeiro minuto, o que é abondo para que o clasificador tome unha decisión estable.

Non. O clip é procesado en memoria no servidor da GPU, o resultado é devolto e o directorio de envío é borrado inmediatamente. Nunca rexistramos, compartimos ou usamos o seu son para adestramento.

A detección custa 200 caracteres por clip, a operación de pago máis pequena da plataforma. As contas gratuítas poden executar algunhas deteccións ao día; os usuarios de pago que teñan iniciada a sesión poden executalas a toda velocidade con acceso prioritario á fila.

A confianza importa máis, non menos, nun mundo cheo de voces sintéticas. O mercado permite aos compradores verificar que unha mostra enviada polo creador é humana antes de pagar. Os xornalistas poden verificar a autenticidade das gravacións filtradas. Os equipos de seguridade da plataforma poden detectar acoso por voz clonada. O detector é o inverso do TTS: a mesma experiencia, o obxectivo oposto.

Aínda non, o detector v1 só mostra a saída real vs sintética. A atribución de modelos (que motor TTS fixo isto?) está no mapa unha vez que teñamos mostras etiquetadas de abondo por modelo.
5.0/5 (1)

Que podemos mellorar? Os seus comentarios axúdannos a corrixir os problemas.

Listo para comezar?

Inscríbase de balde e obtén 15.000 caracteres. Non se require tarxeta de crédito.