Detector de Voz Deepfake da AI

Spot IA gerada, clonada e sintética fala em qualquer clipe de áudio. Obtenha uma pontuação de probabilidade mais a classificação de confiança em segundos — o inverso do TTS, construído nos mesmos modelos.

Carregar áudio para Verificar

200 caracteres

Arraste e largue o seu arquivo aqui, ou navegar

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

file.mp3

0 MB
— ou registo do seu microfone —
00:00
Grátis — 10 detecções por dia, sem necessidade de inscrição
Analisando áudio...

Analisando áudio contra o classificador de deepfake...

Utilização do classificador de base HuBERT (MIT)
Verdicto

Probabilidade que o clipe seja gerado por IA

Verdicto
Confiança
Pontuação do áudio
Custo
Mostrar os escores da classe bruta

                    

Como funciona

O detector é um classificador de base HuBERT (Meta AI, MIT licenciado) afinado em FoR, ASVspoof e WaveFake — três das maiores corporas públicas de discursos synthético-humano.

Devolve a probabilidade de que o clipe fosse gerado por um modelo TTS, clone de voz ou outro sistema de IA, mais uma classificação de confiança. Tratar a pontuação como um sinal forte, não prova legal.

Quem utiliza este

  • Periodistas que controlam gravações vazadas ou anónimas
  • Os compradores de mercado que verificam amostras de voz são humanos antes de pagar
  • As equipas de confiança e segurança marcam o assédio fechado por voz
  • Investigadores que rotulam conjuntos de dados em escala
  • Criadores provando seu próprio áudio é genuíno

Formatos Suportados

MP3, WAV, FLAC, OGG, M4A

Máximo 50MB por arquivo. Os primeiros 60 segundos são marcados — clipes longos são truncados.

Planos de Detecção de Deepfake

Comece livre, atualização quando você precisa mais

Grátis
  • 10 detecções por dia
  • Clips até 60 segundos
  • Probabilidade + pontuação de confiança
  • Não é necessária nenhuma conta
Mais Popular
Conta Livre
  • 15.000 caracteres livres na inscrição
  • 200 caracteres por detecção
  • Histórico de detecção
  • Todos os detalhes de saída (pontos de classe raw)
Inscreva-se gratuitamente
Pro
  • Fila GPU prioritária
  • Detecção de massa através da API
  • Webhook alertas sobre veredictos FAKE
  • Integração do mercado
Actualização

Perguntas Frequentes

Analisa um clipe de áudio e diz-lhe a probabilidade de que o discurso seja gerado pela IA, clonado ou sintético de outro modo. Você obtém um escore de 0-100% mais uma classificação de confiança, para que você possa decidir se a gravação é confiável o suficiente para publicação, pagamento ou evidência.

Um classificador de base HuBERT (Meta AI, MIT licenciado) ajustado em três das maiores corporas públicas de discurso humano-vs-synthetic: FoR (Fake-or-Real), ASVspoof e WaveFake. O fino-tuno é publicado como MelodyMachine/Deepfake-audio-detection-V2 em Sugging Face.

No teste público FoR definir os relatórios de modelo subjacentes acima de 95% de acurácia, e em ataques de estilo ASVspoof ele marca consistentemente TTS e saída de fechamento de voz. A precisão em modelos novos o classificador nunca viu é menor — tratar a pontuação como um sinal forte, não prova legal.

Você pode carregar clipes até 50MB e cerca de 60 segundos de fala. As gravações mais longas são automaticamente truncadas para o primeiro minuto, o que é suficiente para o classificador tomar uma decisão estável.

Não. O clipe é processado em memória no nosso servidor GPU, o resultado é devolvido para você, e o diretório de upload é excluído imediatamente. Nunca registramos, compartilhamos ou usamos seu áudio para treinar.

Detecção custa 200 caracteres por clipe — a menor operação paga na plataforma. Contas gratuitas podem executar algumas detecções por dia; os usuários assinados podem executá-los a toda velocidade com acesso prioritário à fila.

A confiança importa mais, não menos, num mundo cheio de vozes sintéticas. O mercado permite que os compradores verifiquem uma amostra carregada pelo criador é humana antes de pagar. Os jornalistas podem verificar a autenticidade de gravação de fugas. As equipes de segurança da plataforma podem detectar assédio fechado por voz. O detector é o inverso do TTS: a mesma expertise, meta oposta.

Ainda não — o detector v1 só saídas real vs sintética. Atribução do modelo (que o motor TTS fez isso?) está no roteiro uma vez que temos amostras etiquetadas suficientes por modelo.
5.0/5 (1)

O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.

Pronto para começar?

Inscreva-se gratuitamente e receba 15.000 caracteres. Não é necessário cartão de crédito.