تشخیص‌دهنده عمیق صدای هوش مصنوعی

تشخیص گفتار تولید شده توسط هوش مصنوعی، شبیه سازی شده و ترکیبی در هر کلیپ صوتی. یک نمره احتمالی به علاوه رتبه اعتماد را در ثانیه دریافت کنید - معکوس TTS، ساخته شده بر روی همان مدل‌ها.

هنوز صداهای TTS برای زبان شما نداریم. به ما کمک کنید تا صداهای خودتان را اضافه کنیم! فروش صدای خود

بارگذاری صدا برای تأیید

200 نویسه‌ها

پروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور

MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 60 seconds is scored.

پرونده.mp3

0 MB
یا از میکروفون خود ضبط کنید
00:00
رایگان — ۱۰ شناسایی در روز، نیازی به ثبت نام نیست
در حال تجزیه صدا...

...تحليل صدا در مقابل طبقه بندي جعل عميق

با استفاده از طبقه‌بندی‌کنندهٔ پایهٔ HUBERT (MIT)
حکم

احتمال اینکه این کلیپ توسط هوش مصنوعی ساخته شده

حکم
اعتماد
امتیازدهی صوتی
هزینه
نمایش نمرات خام کلاس

                    

چطور کار ميکنه

این آشکارساز یک طبقه‌بندی‌کننده بر پایهٔ HuBERT (متا AI، MIT licensed) است که بر روی FoR، ASVspoof و WaveFake تنظیم شده‌است - سه تا از بزرگترین مجموعه‌های عمومی از سخنرانی انسان در مقابل سنتز.

این احتمال را برمی‌گرداند که کلیپ توسط یک مدل TTS ، شبیه ساز صدا یا سیستم هوش مصنوعی دیگر تولید شده باشد ، به علاوه یک امتیاز اعتماد. امتیاز را به عنوان یک سیگنال قوی، نه یک مدرک قانونی، در نظر بگیرید.

کي از اين استفاده ميکنه؟

  • روزنامه‌نگاران در حال بررسی ضبط‌های نشت شده یا ناشناس
  • خريداران بازار قبل از پرداخت، نمونه صداها رو تائيد ميکنن که انسان هستن
  • تیم‌های اعتماد و امنیت، آزار و اذیت شبیه سازی شده را گزارش می‌کنند
  • محققان برچسب زدن مجموعه داده ها در مقیاس
  • . خلاقان ثابت مي کنند که صداي خودشان واقعيه

قالبهای پشتیبانی‌شده

MP3, WAV, FLAC, OGG, M4A

حداکثر ۵۰ مگابایت برای هر پرونده. ۶۰ ثانیه اول امتیاز داده می‌شود — کلیپ‌های طولانی قطع می‌شوند.

نقشه‌های شناسایی جعل عمیق

شروع مجانی، ارتقاء وقتی که بیشتر نیاز دارید

آزاد
  • 10 شناسايي در روز
  • ویدئوهای تا ۶۰ ثانیه
  • احتمال + امتیاز اعتماد
  • حساب مورد نیاز نیست
محبوب‌ترین
حساب آزاد
  • 15000 کاراکتر رایگان در ثبت نام
  • ۲۰۰ نویسۀ هر تشخیص
  • تاریخچه شناسایی
  • تمام جزئیات خروجی) نمرات کلاس خام (
ثبت نام
حرفه اي
  • صف اولویت GPU
  • شناسایی انبوه از طریق API
  • هشدارهای Webhook در مورد حکم‌های دروغین
  • ادغام بازار
ارتقا

پرسشهای متداول

این ابزار یک کلیپ صوتی را تحلیل می‌کند و احتمال اینکه سخنرانی توسط هوش مصنوعی تولید شده، شبیه سازی شده یا به هر شکل مصنوعی باشد را به شما می‌گوید. شما نمره ۰ تا ۱۰۰ درصد به علاوه یک نمره اعتماد دریافت می‌کنید، بنابراین می‌توانید تصمیم بگیرید که آیا ضبط شده به اندازه کافی قابل اعتماد است تا منتشر شود، پرداخت شود یا مدرک باشد.

یک طبقه‌بندی بر پایهٔ HUBERT (متا AI، MIT licensed) که بر روی سه تا از بزرگترین مجموعه‌های عمومی سخن انسان در مقابل سخن مصنوعی تنظیم شده‌است: FoR (دروغین یا واقعی)، ASVspoof، و WaveFake.

در تست عمومی FoR، مدل پایه دقت بالای ۹۵٪ را گزارش می‌دهد، و در حمله‌های ASVspoof-style، به طور مداوم TTS و خروجی شبیه‌سازی صدا را نشان می‌دهد.

شما می‌توانید کلیپ‌هایی با اندازه تا ۵۰ مگابایت و حدود ۶۰ ثانیه گفتار را بارگذاری کنید. ضبط‌های طولانی‌تر به صورت خودکار به دقیقه اول کوتاه می‌شوند ، که برای طبقه‌بندی‌کننده کافی است تا تصمیمی پایدار بگیرد.

نه. کلیپ در حافظه کارساز GPU ما پردازش می‌شود، نتیجه به شما برمی‌گردد و پوشه بارگذاری بلافاصله حذف می‌شود. ما هرگز صدای شما را ثبت، به اشتراک نمی‌گذاریم یا برای آموزش استفاده نمی‌کنیم.

حساب‌های رایگان می‌توانند چند تشخیص را در روز اجرا کنند؛ کاربران پرداختی می‌توانند آن‌ها را با سرعت کامل با دسترسی صف اولویت دار اجرا کنند.

در دنیایی که پر از صداهای مصنوعی است، اعتماد اهمیت بیشتری دارد، نه کمتر. بازار به خریداران اجازه می‌دهد تا نمونه‌هایی که توسط سازنده‌ها آپلود شده‌اند را قبل از پرداخت ارزیابی کنند. روزنامه‌نگاران می‌توانند صداهای ضبط شده را بررسی کنند. تیم‌های امنیتی پلتفرم می‌توانند آزار و اذیت شبیه سازی شده را شناسایی کنند.

هنوز نه — آشکارساز v1 فقط خروجی واقعی در مقابل مصنوعی را نشان می‌دهد. مدل اختصاصی (چه موتور TTS این کار را انجام داد؟) در نقشه راه است زمانی که ما نمونه‌های برچسب‌گذاری شده کافی برای هر مدل داشته باشیم.
5.0/5 (1)

چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.

آماده اي که شروع کني؟

ثبت نام مجاني کن و 50 کرید بگیر کارت اعتباری لازم نیست