AI Lip Sync ቪዲዮ ማምረቻ
የፊት ፎቶ እና የድምፅ ክሊፕን ጫን - እውነተኛ የላባ synchronization, የራስ ፎቶ እና ብልጭታዎችን የሚናገሩ የራስ ቪዲዮን ያግኙ. SadTalker (MIT) የተሰራ. የቢዝነስ ጥቅም በቂ ነው.
ድምፅ
ፊደል(ሎች)ስለ SadTalker
SadTalker (CVPR 2023, Tencent ARC) የግል ፊቱን ምስል ማንኛውንም ድምፅ ለመናገር የሚያንቀሳቅስ የክፈት ምንጭ የንግግር-አፍ ሞዴል ነው. Wav2Lip ልዩነቶች በተቃራኒው፣ SadTalker የራስን ፎቶግራፍ፣ ብልጭታዎችን እና የበለጠ ተፈጥሯዊ ውጤት ለማግኘት መግለጫዎችንም ያንቀሳቅሳል.
ኮድ እና ክብደት ከመጨረሻ እስከ መጨረሻ MIT-ሊስንስ አላቸው - ምንም ላማ፣ ጄማ ወይም ያልተሸጠ ራስ - ስለዚህ ቪዲዮዎቹ ለሽያጭ ጥቅም ደህን ናቸው.
ምርጥ ውጤቶች
- ከፍተኛ ጥራት ያለው፣ በደንብ የተቀረጸ ፎቶግራፍ ይጠቀሙ - ዓይኖች ይታያሉ፣ አፍም ይከፈታል
- መካከለኛ ፊት፣ ስድስት ማዕዘን ወይም 4:5 የቅርጽ መጠን በጣም ጥሩ ነው
- የንግግር ድምፅ (ሙዚቃ የለም) ቀጥ ያለ የምላስ synchronization ይሰጣል
- GFPGANን ለታጋይ ፎቶዎች አስጀምር - የቀረጻ ጊዜን ያድጋል ግን ዝርዝሮችን ያጠናክራል
- የቀድሞው ፎቶ
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
ምን ማሻሻል እንችላለን? አስተያየቶችዎ ችግሮችን ለመፍታት ይረዳሉ.