بگ / خصوصیت کی درخواست رپورٹ کریں

AI لپ سنک ویڈیو جنریٹر

چہرے کا فوٹو اور آڈیو کلپ اپ لوڈ کریں - ایک بات کرنے والا سر ویڈیو حاصل کریں جس میں واقعی لپ سینک، سر پوز اور بلنگز ہیں. SadTalker (MIT) سے طاقتور. تجارتی استعمال ٹھیک ہے.

مفت میں رجسٹر کریں

آپ کی زبان میں اب تک ہمارے پاس TTS آوازیں نہیں ہیں. ہمیں آپ کی آوازیں شامل کرنے میں مدد کریں! آپ کی آواز فروخت کریں

اپ لوڈ چہرہ + آڈیو

1000 حروف پر سیکنڈ

1. چہرے کی تصویر یا ڈرائیونگ ویڈیو

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

2. آڈیو ڈرائیو

اپنی فائل یہاں گھسیٹ کر ڈالیں، یا براؤز

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

متحرک پیش سیٹ

خروجی سائز

چہرے کا تحسين

GFPGAN (تيار، سست)

ساڈ ٹوکر کے بارے میں

سڈ ٹوکر (CVPR 2023، Tencent ARC) ایک اوپن سورس بات کرنے والا سر ماڈل ہے جو کسی بھی آڈیو بولنے کے لئے ایک چہرے کی تصویر کو زندہ کرتا ہے۔Wav2Lip کے مختلف قسموں کی برعکس، سڈ ٹوکر بھی سر کے پوز، بلیک اور ایک زیادہ قدرتی نتیجہ کے لئے اظہار کو زندہ کرتا ہے۔

کوڈ اور وزن تمام طرف سے ایم آئی ٹی لائسنس سے متعلق ہیں - کوئی لام، جیما، یا غیر تجارتی پسماندہ نہیں - تو آپ کی پیدا کی گئی ویڈیوز تجارتی استعمال کے لئے محفوظ ہیں۔

بہترین نتائج کے لیے ہدایات

اعليٰ معيار ، اچھی روشني کا پورٹریٹ استعمال کريں - آنکھیں نظر آتي هيں ، منہ بند
مرکزي چہره، مربع يا 4:5 تناسب سب سے بہتر کام کرتا هے
صاف بولنے کی آڈیو (کوئی موسیقی نہیں) زیادہ مضبوط لپ سینک حاصل کرتی ہے
هيرو شوٹ کے ليے GFPGAN فعال کريں - دو گنا رنڈر وقت ليے
جب آپ ایک مستحکم آوٹار شوٹ چا هيتے هيں تو سٹائل پرائز استعمال کريں

لپ سنک ویڈیو منصوبے

مفت شروع کریں، آپ کو مزید ضرورت ہو تو اپگریڈ کریں

مفت

30 سیکنڈ آڈیو حد
256 px آؤٹ پٹ
صرف "Still" پریسیٹ
کوئی چہرہ انکشاف نہیں

سب سے زیادہ مقبول

مفت اکاؤنٹ

30 سیکنڈ آڈیو حد
"فایل" اور "پیش سیٹ" دونوں
256 / 512 px آؤٹ پٹ
GFPGAN چہرے کي طاقت افزائي

مفت میں رجسٹر کریں

پرو

5 منٹ آڈیو حد
GPU کی ترجیح
API رسائی (مختلف حصوں کو اپ لوڈ)
Webhook مکمل کرنے کے کالبیکٹس
تجارتی استعمال (MIT لائسنس)

بہتری

بار بار پوچھے گئے سوالات

چہرے کا فوٹو اور آڈیو کلپ اپ لوڈ کریں اور AI اس چہرے کا ویڈیو بناتا ہے جو واقعی ہونٹوں کے حرکات، سر کے پوز اور بلیکنگ کے ساتھ آڈیو بولتا ہے۔ SadTalker (CVPR 2023) پر بنایا گیا، ایک MIT-لاائزنٹ بولنے والے سر کے ماڈل جو منہ کے شکل کے علاوہ اظہار کو زندہ کرتا ہے

چہرے کا انٹاپ ایک JPG يا PNG تصوير (10 ميگا بائٹ تک) يا يک مختصر MP4/WebM ڈرائنگ ويڈیو ( ہم اول فريم استعمال کريں ) ہو سکتا هے ڈرائنگ آڊيو MP3, WAV, M4A يا FLAC 10 ميگا بائٹ تک ہو سکتا هے ہم آڈیو کو 16 kHz تک اندروني طور پر ريسمپل کريں

مفت اکاؤنٹ: ہر کلیپ کے لیے 30 سیکنڈ تک۔ ادا کرنے والے صارف: ہر درخواست کے لیے 5 منٹ تک۔ زیادہ اوڈیو کا مطلب زیادہ رینڈر وقت اور زیادہ کردار کی قیمت ہے۔

لب سینک ویڈیو 1000 حروف پر سیکنڈ پیدا کی گئی ویڈیو استعمال کرتا ہے. 30 سیکنڈ کی کلیپ = 30 حروف. لاگ آپ کے حروف کے بلین سے پہلے سے بل کی جاتی ہے اور خودکار طور پر واپس کی جاتی ہے اگر پیدائش ناکام ہو.

ہاں - سڈ ٹوکر کوڈ اور وزن ے MIT لا يسنس کے تحت ختم تک موجود هے (کوئي لا ما ، جمما يا غير تجارتي بيس بون نهيں هے) آپ جن ويڈیوز بناتے هيں وہ آپ کے تجارتي استعمال کے ليے هے آپ ذمہ دار هے کہ آپ کو اس چہرے کے اسم ج اور او ڊيو کے حق ملے جو آپ اپ لوڈ کريں هيں

ہمارے A100 سرور پر 5 سیکنڈ کلیپ کے لئے تقریباً 30 سیکنڈ، اوڈیو طول کے ساتھ تقریباً لاینری پیمانے. GFPGAN چہرے کو فعال کرنے سے تقریبا دوگنا رینڈر وقت ہوتا ہے لیکن تیز، اعلیٰ معیار کا خروجی پیدا کرتا ہے.

پورا پرائزٹ (دفٹر) سر کے پوز، نگا ں جھپکنا اور زبان کے ساتھ ساتھ اظہار کو زندہ کرتا ہے، ایک زیادہ قدرتی بات کرنے والا سر ویڈیو بناتا ہے. ابھی پرائزٹ سر کو جگہ پر بند کرتا ہے اور صرف منہ کو زندہ کرتا ہے -فائدہ مند جب آپ ایک مستحکم آوٹار شوٹ چاہتے ہیں.

GFPGAN چہرے کے اعادہ کا ماڈل هے جو چہرے کے تفصيلات کو لپ سنک رنڈنگ کے بعد تیز کر تا هے ۔ اس سے آرٹیفکٹس صاف ہوتے هيں اور 256 پيکسل آ وٹ پٹ 512 کے قریب لگتا هے ۔ اس سے تقريبا دوگنا رنڈنگ وقت ملتا هے مگر هيرو شوٹ کے ليے اس کا قيمتي ہوتا هے

سڈ ٹوکر 256 پيکسل پر دیفالٹ سے رنڈ کرتا ہے. تیز خروجی کے لیے 512 پيکسل سائز پر تبدیل کریں (سست، اعلیٰ VRAM) يا GFPGAN enhancer کو چہرے کی تفصیلات کو اپسکیل کرنے کے ليے فعال کريں. بهترين نتيجے کے ليے، اعليٰ معيار، خوب روشن پورٹریٹ فوٹو اپ لوڈ کريں.

جی ہاں. ایک MP4 یا WebM کو چہرے کی انپٹ کے طور پر اپ لوڈ کریں اور ہم پہلے فریم کو ڈرائینگ شناخت کے طور پر استعمال کریں گے۔ مکمل ویڈیو ری-ڈوبنگ کے لئے (پر فریم منہ کی جگہ)، آنے والی ڈوبنگ سٹوڈیو ویڈیو پائپ لائن دیکھیں.

ہاں. /api/v1/lipsync/ کو چہرے اور آڈیو فیلڈز کے ساتھ ایک ملٹی پارٹ درخواست POST کریں، پھر پول /api/v1/lipsync/result/?uuid= تک کہ حالت "تمام ہو جائے". جواب میں MP4 کے لئے ایک URL شامل ہے. API رسائی کے لیے ایک پیسہ لینے والا پلان ضروری ہے.

سڈ ٹوکر چہرے کا تناسب استعمال کرتا ہے تا کہ سب سے زیادہ نمایاں چہرے کو تلاش اور کرپ کريں بهترين نتيجے کے ليے ،اے شخص کے مرکز ، آنکھیں نظر آتي هيں اور کم از کم غلظت کے ليے پورٹریٹ اپ لوڈ کريں گروپ فوٹو نا پیش گوئي نتيجے لا سکتے هيں

5.0/5 (1)

شروع کرنے کے لئے تیار ہیں؟

مفت میں رجسٹر کریں اور 50 کریڈٹ حاصل کریں. کوئی کریڈٹ کارڈ کی ضرورت نہیں.

مفت میں رجسٹر کریں قیمت دیکھیں

AI لپ سنک ویڈیو جنریٹر

اپ لوڈ چہرہ + آڈیو

آپ کا بات کرنے والا سر ویڈیو

ساڈ ٹوکر کے بارے میں

بہترین نتائج کے لیے ہدایات

لپ سنک ویڈیو منصوبے

بار بار پوچھے گئے سوالات

AI لپ سینک ٹول کیا کرتا ہے؟

کیا ان پٹ فارمیٹ مدد دیے جاتے ہیں؟

آڈیو کتنی دیر تک ہو سکتا ہے؟

اس کی قیمت کتنی ہے؟

کیا میں ویڈیوز کو تجارتی طور پر استعمال کر سکتا ہوں؟

نسل کتنا وقت لے گا؟

"پورا" اور "کھلا" پریسیٹ کے درمیان کیا فرق ہے؟

GFPGAN enhancer کیا ہے؟

میرا آؤٹ پٹ کیوں کم رزولوشن کی طرح لگتا ہے؟

کیا میں ویڈیو کو نئی آڈیو میں لیپ سینک کر سکتا ہوں؟

ایک API ہے؟

اگر میرے چہرے کی فوٹو میں کئی لوگ ہوں تو کیا ہوگا؟

شروع کرنے کے لئے تیار ہیں؟