AI Lip Sync myndskeiðsrafall

Hlaða upp andlitsmynd og hljóðmynd - fáðu talandi höfuð myndband með raunhæfum vör samstillingu, höfuð stellingu og blikkar. Powered by SadTalker (MIT).

Hlaða upp andlit + hljóð

1. 000 stafir á sekúndu

Dragðu og slepptu skránni hér, eða fletta

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

skrá.mp3

0 MB

Dragðu og slepptu skránni hér, eða fletta

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

skrá.mp3

0 MB

Vinna...

Þetta tekur yfirleitt 30 sekúndur til 2 mínútur.

Talandi-Head myndbandið þitt

Sækja

Um SadTalker

SadTalker (CVPR 2023, Tencent ARC) er opinn uppspretta talandi höfuð líkan sem hreyfir eitt andlit mynd til að tala hvaða hljóð.Ólíkt Wav2Lip afbrigði, SadTalker einnig hreyfa höfuð stelling, blikkar, og tjáning fyrir náttúrulegri niðurstöðu.

Kóði og þyngd eru MIT-leyfi endir til enda - engin Llama, Gemma, eða non-commercial öxl - þannig að myndbönd sem þú býrð eru örugg fyrir viðskiptalega notkun.

Ábendingar fyrir bestu niðurstöður

  • Notaðu hágæða, vel upplýst andlitsmynd - augu sýnileg, munnur lokaður
  • Miðjuð andlit, ferningur eða 4: 5 hlutfall virkar best
  • Hreint talhljóð (engin tónlist) skilar þéttari samstillingu á vörum
  • Virkja GFPGAN fyrir hetja skot - tvöfaldar gera tíma en skerpir smáatriði
  • Notaðu Still forstillinguna þegar þú vilt stöðugt avatar skot

Lip Sync myndbandsáætlanir

Byrjaðu ókeypis, uppfærðu þegar þú þarft meira

Frjáls
  • 30 sekúndna hljóðtakmörk
  • 256 px úttak
  • "Still" forstilling eingöngu
  • Engin andlit auka
Vinsælasta
Ókeypis reikningur
  • 30 sekúndna hljóðtakmörk
  • Bæði "full" og "stillt" forstillingar
  • 256 / 512 px úttak
  • GFPGAN andlit auka
Skráðu þig ókeypis
Pro
  • 5 mínútna hljóðtakmörk
  • Forgangsröð GPU
  • API aðgangur (multipart upphleðsla)
  • Til bakakalla fyrir Webhook- fullnustu
  • Notkun í atvinnuskyni (MIT leyfi)
Uppfærsla

Algengar spurningar (FAQ)

Hladdu upp andlitsmynd og hljóðmynd og AI býr til myndband af því andliti sem talar hljóðinu með raunhæfum vörhreyfingum, höfuðstöðu og blikkar.Byggð á SadTalker (CVPR 2023), MIT-leyfi talandi höfuð líkan sem lífga tjáningu auk munnforms.

Andlitið getur verið JPG eða PNG mynd (allt að 10 MB) eða stutt MP4 / WebM akstursmyndband (við notum fyrsta ramma). Aksturshljóðið getur verið MP3, WAV, M4A eða FLAC allt að 10 MB.

Frjáls reikningar: allt að 30 sekúndur á myndskeiði.Greiðandi notendur: allt að 5 mínútur á beiðni. Lengri hljóð þýðir lengri endurgerð og hærri kostnaður.

Lip sync vídeó notar 1.000 stafi á sekúndu af myndskeiði sem myndast. 30 sekúndna myndskeið = 30.000 stafir.Kostnaðurinn er innheimtur fyrirfram frá persónujöfnuðinum þínum og endurgreiddur sjálfkrafa ef kynslóð mistekst.

Já - SadTalker kóða og þyngd eru MIT leyfi endir til enda (engin Lama, Gemma, eða ekki í viðskiptalegum tilgangi backbone). The vídeó sem þú býrð eru þínar til að nota í viðskiptalegum tilgangi.Þú ert ábyrgur fyrir að hafa réttindi til uppruna andlit mynd og hljóð sem þú hleður.

Um 30 sekúndur fyrir 5 sekúndna myndskeið á A100 netþjóninum okkar, sem er um það bil línuleg með hljóðlengd.Það að virkja GFPGAN andlitsþjálfara tvöfaldar um það bil endurgerðartímann en framleiðir skarpari, hágæða framleiðsla.

Full forstilling (sjálfgefið) hreyfir höfuðstöðu, blikkar og tjáning ásamt vörunum, sem framleiðir náttúrulegra talandi höfuðmyndband.Still forstilling læsir höfðinu á sínum stað og hreyfir aðeins munninn - gagnlegt þegar þú vilt stöðugt avatar skot.

GFPGAN er andlits endurreisnarlíkan sem skerpir andlitsupplýsingar eftir lip-sync gerð. Það hreinsar upp artifacts og gerir 256-pixla framleiðsla líta nær 512. Það tvöfaldar um það bil gerð tíma en er þess virði fyrir hetja skot.

SadTalker er sjálfgefið 256 px. Skiptu yfir í 512 px fyrir skarpari úttak (hægara, hærra VRAM) eða virkjaðu GFPGAN- aukarann til að uppskalera andlitsupplýsingar. Til að fá sem besta útkomu skaltu senda inn hágæða, vel upplýsta mynd.

Já. Hladdu upp MP4 eða WebM sem andlitsinntak og við notum fyrsta ramma sem akstursauðkenni. Fyrir fullan vídeó endur-dubbing (per-frame munn skipti), sjá komandi Dubbing Studio vídeó leiðslum.

Já. POSTaðu fjölhluta beiðni til /api/v1/lipsync/ með andlits- og hljóðreitunum, þá spyrðu /api/v1/lipsync/result/?uuid= þar til staða er "lokið". Svarið inniheldur slóð á MP4 mynd. API aðgangur krefst greidds áætlunar.

SadTalker notar andlitssamræmi til að greina og skera áberandi andlit. Til að ná sem bestum árangri skaltu hlaða upp mynd með einum manni miðju, augu sýnileg og lágmarks lokun.
5.0/5 (1)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Tilbúinn til að byrja?

Skráðu þig ókeypis og fáðu 50 einingar. Engin kreditkort krafist.