AI لپ سنڪ وڊيو پيدا ڪندڙ
هڪ چهرو تصوير ۽ هڪ آڊيو ڪلپ اپ لوڊ ڪريو - هڪ ڳالهائيندڙ-سر ويڊيو حاصل ڪريو حقيقي لپ سنڪ، سر جي پوزي ۽ ڦوڪڻ سان. SadTalker (MIT) پاران هلايو ويو. تجارتي استعمال صحيح.
آڊيو اپ لوڊ ڪريو
1,000 نشان في سيڪنڊپنھنجي فائل ھتي ڌڪيو ۽ ھيٺ لايو، يا برائوزر
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.فائل.mp3
0 MBپنھنجي فائل ھتي ڌڪيو ۽ ھيٺ لايو، يا برائوزر
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.فائل.mp3
0 MBوڊيو رندرنگ ۾. عام طور تي 30 سيڪنڊن کان 2 منٽن تائين لڳندو.
توھان جو ڳالھائيندڙ-سر وڊيو
SadTalker بابت
SadTalker (CVPR 2023, Tencent ARC) هڪ مفت-سورس ڳالهائيندڙ-سر ماڊل آهي جيڪو ڪنهن به آڊيو ڳالهائڻ لاءِ هڪ چهري جي تصوير کي متحرڪ ڪري ٿو. Wav2Lip جي مختلفن جي برعڪس، SadTalker پڻ مٿي جي پوزي، ڦوڪن ۽ اظهار کي وڌيڪ قدرتي نتيجي لاءِ متحرڪ ڪري ٿو.
ڪوڊ ۽ وزن ايم آءِ ٽي جي لائسنس سان گڏ آهن - لاما، جيما يا غير تجارتي بيلٽ نه - تنهنڪري وڊيوز جيڪي توهان پيدا ڪندا آهيو سي تجارتي استعمال لاءِ محفوظ آهن.
بهترين نتيجن لاءِ صلاحون
- اعليٰ معياري، سٺي روشني وارو تصوير استعمال ڪريو - اکيون ڏسڻ ۾ اچن ٿيون، منھن بند
- وچولي چهري وارو، مربعو يا 4:5 ابعاد وارو نسبت بهترين ڪم ڪندو آھي
- صاف ڳالهائڻ جي آڊيو (ڪا ميڊيا) وڌيڪ مضبوط لپ سنڪ حاصل ڪري ٿي
- هيرو شوٽس لاءِ GFPGAN کي فعال ڪريو - رندر وقت ٻه ڀيرا ڪري ٿو پر تفصيل کي تيز ڪري ٿو
- جڏهن ته اوھان ھڪ سڌو آٽوگرافڪ شاٽ گھرو ٿا تڏھن سسٽم اڳ- ٺاھيل استعمال ڪريو
ليپ سنڪ وڊيو منصوبا
مفت شروع ڪريو، جڏھن توھان کي وڌيڪ گھرجي تڏھن اپ گريڊ ڪريو
- 30 سيڪنڊن جي آڊيو حد
- 256 پيڪسل آءوٽپوٽ
- صرف "Still" اڳيون ٺاھيو
- ڪوبه چهرو وڌائيندڙ نه
- 30 سيڪنڊن جي آڊيو حد
- "پورو" ۽ "سٺو" ٻهئي اڳيون ترتيب
- 256 / 512 پيڪسل آءوٽپوٽ
- GFPGAN چهرو وڌائيندڙ
- آڊيو حد
- GPU جي ترجيح واري قطار
- API رسائي (ٻئي حصا اپ لوڊ)
- Webhook مڪمل ڪرڻ جي ڪالمن
- واپاري استعمال (MIT لائسنس)
گھڻا پڇيا ويندا سوال
ڇا بهتر ڪري سگھون ٿا؟ توھان جي راءِ اسان کي مسئلا حل ڪرڻ ۾ مدد ڏيندي.
شروع ڪرڻ لاءِ تيار آھيو؟
مفت ۾ رجسٽر ٿيو ۽ 50 ڪريڊٽس حاصل ڪريو. ڪوبه ڪريڊٽ ڪارڊ گهربل ناهي.