د AI د پاڼې د ویډیو جوړونکی
د مخ عکس او غږیز کلیپ پورته کړئ - د ریښتیني لپ سینک ، سر پوز او بلیک سره د خبرو اترو سر ویډیو ترلاسه کړئ. د SadTalker (MIT) لخوا ځواکمن شوی. سوداګریز کارولو OK.
مخ + غږيز لېږل
په سېکېنډ کې ۱۰۰۰ لوښهخپل دوتنه دلته ځغلول او پرېښودل، يا لټول
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.دوتنه.mp3
0 MBخپل دوتنه دلته ځغلول او پرېښودل، يا لټول
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.دوتنه.mp3
0 MBستاسو د ویډیو د ښودلو. دا معمولا 30 ثانیې 2 دقیقې نیسي.
ستاسو خبرې کول-سر ويډيو
په اړه SadTalker
SadTalker (CVPR 2023، Tencent ARC) یو خلاص سرچینه خبرې کول-سر ماډل دی چې د یو واحد مخ انځور د هر ډول غږیز خبرې کولو لپاره ژوندي کوي. د Wav2Lip ډولونو برعکس، SadTalker هم د ډیر طبیعي پایلې لپاره سر پوزې، بلیکونه او څرګندونه ژوندي کوي.
کوډ او وزنونه د MIT-لیکسین پای ته رسیدلي - نه د لام، جیما، یا غیر سوداګریز ستون - نو تاسو تولید شوي ویډیوګانې د سوداګریز کارولو لپاره خوندي دي.
د غوره پایلو لپاره لارښوونې
- د لوړ کیفیت، ښه روښانه عکس کاروئ - سترګې ښکاري، خوله تړل شوې
- مرکزي مخ، مربع یا 4: 5 اړخ نسبت غوره کار کوي
- پاک خبرې آډیو (نه موسیقي) توليدات tighter لپ sync
- د قهرمان عکسونو لپاره GFPGAN فعال کړئ - دوه ځله وخت رامینځته کوي مګر تفصیلات sharpens
- کله چې تاسو يو ثبات لرونکی انځورن انځور غواړﺉ، د سټېلېټ مخکوت کارول
د پاڼې د سمون ويډيو پلانونه
وړیا پیل کړئ، تازه کړئ کله چې تاسو ډیر اړتیا لرئ
- غږيزه کچه ۳۰ سېکېنډه
- وتۍ ٢٥٦ پکسلز
- يوازې "هغه هم" مخکوت
- هېڅ مخ زياتوونکی
- غږيزه کچه ۳۰ سېکېنډه
- دواړه "پورې" او "ناڅاپي" مخکوتونه
- ۲۵۶ / ۵۰۱ پکسله وتۍ
- GFPGAN مخ زياتونکی
- ۵-منۍ غږيزه کچه
- د GPU د اوليت لړۍ
- API لاسرسي (ډير برخې پورته کول)
- د وېب هوک بشپړولو اړيکنيو
- سوداګريزه کارونه (MIT منښتليک)
ډېرې پوښتنې
موږ څه کولای شي چې ښه شي؟ ستاسو د نظر موږ سره مرسته کوي د ستونزو د حل.
د پېلولو لپاره چمتو ياست؟
وړيا راجستر او 50 کریډیټ ترلاسه کړئ. د کریډیټ کارت اړتیا نشته.