AI لپ سنک ویڈیو جنریٹر

چہرے کا فوٹو اور آڈیو کلپ اپ لوڈ کریں - ایک بات کرنے والا سر ویڈیو حاصل کریں جس میں واقعی لپ سینک، سر پوز اور بلنگز ہیں. SadTalker (MIT) سے طاقتور. تجارتی استعمال ٹھیک ہے.

آپ کی زبان میں اب تک ہمارے پاس TTS آوازیں نہیں ہیں. ہمیں آپ کی آوازیں شامل کرنے میں مدد کریں! آپ کی آواز فروخت کریں

اپ لوڈ چہرہ + آڈیو

1000 حروف پر سیکنڈ

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

فائلیں

0 MB

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

فائلیں

0 MB

پروسیسنگ...

آپ کی ویڈیو رینڈرنگ. یہ عام طور پر 30 سیکنڈ سے 2 منٹ لے جاتا ہے.

آپ کا بات کرنے والا سر ویڈیو

MP4 ڈاؤن لوڈ کریں

ساڈ ٹوکر کے بارے میں

سڈ ٹوکر (CVPR 2023، Tencent ARC) ایک اوپن سورس بات کرنے والا سر ماڈل ہے جو کسی بھی آڈیو بولنے کے لئے ایک چہرے کی تصویر کو زندہ کرتا ہے۔Wav2Lip کے مختلف قسموں کی برعکس، سڈ ٹوکر بھی سر کے پوز، بلیک اور ایک زیادہ قدرتی نتیجہ کے لئے اظہار کو زندہ کرتا ہے۔

کوڈ اور وزن تمام طرف سے ایم آئی ٹی لائسنس سے متعلق ہیں - کوئی لام، جیما، یا غیر تجارتی پسماندہ نہیں - تو آپ کی پیدا کی گئی ویڈیوز تجارتی استعمال کے لئے محفوظ ہیں۔

بہترین نتائج کے لیے ہدایات

  • اعليٰ معيار ، اچھی روشني کا پورٹریٹ استعمال کريں - آنکھیں نظر آتي هيں ، منہ بند
  • مرکزي چہره، مربع يا 4:5 تناسب سب سے بہتر کام کرتا هے
  • صاف بولنے کی آڈیو (کوئی موسیقی نہیں) زیادہ مضبوط لپ سینک حاصل کرتی ہے
  • هيرو شوٹ کے ليے GFPGAN فعال کريں - دو گنا رنڈر وقت ليے ليے ليے
  • جب آپ ایک مستحکم آوٹار شوٹ چا هيتے هيں تو سٹائل پرائز استعمال کريں

لپ سنک ویڈیو منصوبے

مفت شروع کریں، آپ کو مزید ضرورت ہو تو اپگریڈ کریں

مفت
  • 30 سیکنڈ آڈیو حد
  • 256 px آؤٹ پٹ
  • صرف "Still" پریسیٹ
  • کوئی چہرہ انکشاف نہیں
سب سے زیادہ مقبول
مفت اکاؤنٹ
  • 30 سیکنڈ آڈیو حد
  • "فایل" اور "پیش سیٹ" دونوں
  • 256 / 512 px آؤٹ پٹ
  • GFPGAN چہرے کي طاقت افزائي
مفت میں رجسٹر کریں
پرو
  • 5 منٹ آڈیو حد
  • GPU کی ترجیح
  • API رسائی (مختلف حصوں کو اپ لوڈ)
  • Webhook مکمل کرنے کے کالبیکٹس
  • تجارتی استعمال (MIT لائسنس)
بہتری

بار بار پوچھے گئے سوالات

چہرے کا فوٹو اور آڈیو کلپ اپ لوڈ کریں اور AI اس چہرے کا ویڈیو بناتا ہے جو واقعی ہونٹوں کے حرکات، سر کے پوز اور بلیکنگ کے ساتھ آڈیو بولتا ہے۔ SadTalker (CVPR 2023) پر بنایا گیا، ایک MIT-لاائزنٹ بولنے والے سر کے ماڈل جو منہ کے شکل کے علاوہ اظہار کو زندہ کرتا ہے

چہرے کا انٹاپ ایک JPG يا PNG تصوير (10 ميگا بائٹ تک) يا يک مختصر MP4/WebM ڈرائنگ ويڈیو ( ہم اول فريم استعمال کريں ) ہو سکتا هے ڈرائنگ آڊيو MP3, WAV, M4A يا FLAC 10 ميگا بائٹ تک ہو سکتا هے ہم آڈیو کو 16 kHz تک اندروني طور پر ريسمپل کريں

مفت اکاؤنٹ: ہر کلیپ کے لیے 30 سیکنڈ تک۔ ادا کرنے والے صارف: ہر درخواست کے لیے 5 منٹ تک۔ زیادہ اوڈیو کا مطلب زیادہ رینڈر وقت اور زیادہ کردار کی قیمت ہے۔

لب سینک ویڈیو 1000 حروف پر سیکنڈ پیدا کی گئی ویڈیو استعمال کرتا ہے. 30 سیکنڈ کی کلیپ = 30000 حروف. لاگ آپ کے حروف کے بلین سے پہلے سے بل کی جاتی ہے اور خودکار طور پر واپس کی جاتی ہے اگر پیدائش ناکام ہو.

ہاں - سڈ ٹوکر کوڈ اور وزن ے MIT لا يسنس کے تحت ختم تک موجود هے (کوئي لا ما ، جمما يا غير تجارتي بيس بون نهيں هے) آپ جن ويڈیوز بناتے هيں وہ آپ کے تجارتي استعمال کے ليے هے آپ ذمہ دار هے کہ آپ کو اس چہرے کے اسم ج اور او ڊيو کے حق ملے جو آپ اپ لوڈ کريں هيں

ہمارے A100 سرور پر 5 سیکنڈ کلیپ کے لئے تقریباً 30 سیکنڈ، اوڈیو طول کے ساتھ تقریباً لاینری پیمانے. GFPGAN چہرے کو فعال کرنے سے تقریبا دوگنا رینڈر وقت ہوتا ہے لیکن تیز، اعلیٰ معیار کا خروجی پیدا کرتا ہے.

پورا پرائزٹ (دفٹر) سر کے پوز، نگا ں جھپکنا اور زبان کے ساتھ ساتھ اظہار کو زندہ کرتا ہے، ایک زیادہ قدرتی بات کرنے والا سر ویڈیو بناتا ہے. ابھی پرائزٹ سر کو جگہ پر بند کرتا ہے اور صرف منہ کو زندہ کرتا ہے -فائدہ مند جب آپ ایک مستحکم آوٹار شوٹ چاہتے ہیں.

GFPGAN چہرے کے اعادہ کا ماڈل هے جو چہرے کے تفصيلات کو لپ سنک رنڈنگ کے بعد تیز کر تا هے ۔ اس سے آرٹیفکٹس صاف ہوتے هيں اور 256 پيکسل آ وٹ پٹ 512 کے قریب لگتا هے ۔ اس سے تقريبا دوگنا رنڈنگ وقت ملتا هے مگر هيرو شوٹ کے ليے اس کا قيمتي ہوتا هے

سڈ ٹوکر 256 پيکسل پر دیفالٹ سے رنڈ کرتا ہے. تیز خروجی کے لیے 512 پيکسل سائز پر تبدیل کریں (سست، اعلیٰ VRAM) يا GFPGAN enhancer کو چہرے کی تفصیلات کو اپسکیل کرنے کے ليے فعال کريں. بهترين نتيجے کے ليے، اعليٰ معيار، خوب روشن پورٹریٹ فوٹو اپ لوڈ کريں.

جی ہاں. ایک MP4 یا WebM کو چہرے کی انپٹ کے طور پر اپ لوڈ کریں اور ہم پہلے فریم کو ڈرائینگ شناخت کے طور پر استعمال کریں گے۔ مکمل ویڈیو ری-ڈوبنگ کے لئے (پر فریم منہ کی جگہ)، آنے والی ڈوبنگ سٹوڈیو ویڈیو پائپ لائن دیکھیں.

ہاں. /api/v1/lipsync/ کو چہرے اور آڈیو فیلڈز کے ساتھ ایک ملٹی پارٹ درخواست POST کریں، پھر پول /api/v1/lipsync/result/?uuid= تک کہ حالت "تمام ہو جائے". جواب میں MP4 کے لئے ایک URL شامل ہے. API رسائی کے لیے ایک پیسہ لینے والا پلان ضروری ہے.

سڈ ٹوکر چہرے کا تناسب استعمال کرتا ہے تا کہ سب سے زیادہ نمایاں چہرے کو تلاش اور کرپ کريں بهترين نتيجے کے ليے ،اے شخص کے مرکز ، آنکھیں نظر آتي هيں اور کم از کم غلظت کے ليے پورٹریٹ اپ لوڈ کريں گروپ فوٹو نا پیش گوئي نتيجے لا سکتے هيں
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

شروع کرنے کے لئے تیار ہیں؟

مفت میں رجسٹر کریں اور 50 کریڈٹ حاصل کریں. کوئی کریڈٹ کارڈ کی ضرورت نہیں.