مولد ویدئوی همگامسازی لب هوش مصنوعی
یک عکس صورت و یک کلیپ صوتی را بارگذاری کنید — یک ویدئو از سر صحبتکننده با همگامسازی لب واقعی، حالت سر و پلک زدن را دریافت کنید. با قدرت SadTalker (MIT). استفاده تجاری OK.
بارگذاری چهره + صدا
هزار نویسۀ در ثانیهپروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.پرونده.mp3
0 MBپروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.پرونده.mp3
0 MBدر حال رندر کردن ویدئو. این معمولاً ۳۰ ثانیه تا ۲ دقیقه طول میکشد.
ویدئو سر حرفزن شما
درباره SadTalker
SadTalker (CVPR 2023, Tencent ARC) یک مدل سر صحبت کنندهٔ منبع باز است که یک تصویر یک چهره را برای صحبت کردن هر صدای دیگری پویانمایی میکند.
کد و وزنها از ابتدا تا انتها تحت مجوز امآیتی هستند - بدون لامای، گما یا ستون فقرات غیر تجاری - بنابراین ویدئوهایی که تولید میکنید برای استفاده تجاری ایمن هستند.
نکات برای بهترین نتایج
- از پرتره با کیفیت بالا و نوردهی خوب استفاده کنید — چشمها قابل مشاهده، دهان بسته
- چهره مرکزی، مربع یا نسبت ابعاد ۴: ۵ بهترین کار را میکند
- صدای گفتار تمیز (بدون موسیقی) باعث همگامسازی لبهای محکمتر میشود
- فعال کردن GFPGAN برای شلیک قهرمانان — زمان رندر را دو برابر میکند اما جزئیات را تیزتر میکند
- از پیشفرض ثابت برای گرفتن عکس ثابت آواتار استفاده کنید
برنامههای ویدئویی همگامسازی لب
شروع مجانی، ارتقاء وقتی که بیشتر نیاز دارید
- محدودیت صوتی ۳۰ ثانیه
- خروجی ۲۵۶ پیکسل
- فقط پیشفرض » همچنان «
- بدون بهبود دهنده چهره
- محدودیت صوتی ۳۰ ثانیه
- هر دو پیشفرض » کامل « و » بیحرکت «
- خروجی ۲۵۶ / ۵۱۲ پیکسل
- تقویتکننده چهره GFPGAN
- محدودیت صوتی ۵ دقیقه
- صف اولویت GPU
- دسترسی API (بارگذاری چندبخشی)
- فراخوانهای بازگشتی تکمیل Webhook
- استفاده تجاری (مجوز MIT)
پرسشهای متداول
چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.