AI Lip Sync Video Generator

Upload yon foto figi ak yon clip son — jwenn yon videyo pale-chèf ak realist lip sync, pose tèt, ak blinks. Powered by SadTalker (MIT).

Nou fè Vann Voy ou

Upload Face + Audio

1,000 karaktè pa segond

Drag & drop your file here, or Navigasyon

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

Fichiè.mp3

0 MB

Drag & drop your file here, or Navigasyon

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

Fichiè.mp3

0 MB

Pwosesan...

Render vidéo ou. Sa a pran tipikman 30 segonn a 2 minit.

Votre vidéo Talking-Head

Telechaje

Atik sou SadTalker

SadTalker (CVPR 2023, Tencent ARC) se yon open-source pale-chèf modèl ki anime yon imaj sèl figi pou pale nenpòt ki son. Diferan de Wav2Lip varyete, SadTalker tou anime pozè tèt, blinkings, ak ekspresyon pou yon rezilta plis natirèl.

Kode ak pwa yo gen lisans MIT soti nan bout nan bout — pa gen Llama, Gemma, oswa backbone ki pa komèsyal — se konsa videyo ou kreye yo an sekirite pou itilize komèsyal.

Konsèy pou pi bon rezilta

  • Itilize yon portrait bon jan kalite, byen iluminé — je vizib, bouch fèmen
  • Face sant, kare oswa 4: 5 ratio fonksyone pi byen
  • Clean speech audio (no music) yields tighter lip sync
  • Enfim GFPGAN pou foto eritaj — double tan render men ranfòse detay
  • Enpòte presetansyon ki pa deplase lè ou vle yon foto avatar ki pa deplase

Lip Sync videyo Plans

Kòmanse gratis, mete ajou lè ou bezwen plis

Gratis
  • Limit son 30 segonn
  • 256 px rezilta
  • "Still" preset sèlman
  • Pa gen entansifikasyon figi
Pi popilè
Kont gratis
  • Limit son 30 segonn
  • Presetan "pleni" ak "pa janm"
  • 256 / 512 px rezilta
  • GFPGAN face enhancer
Enskri pou gratis
Pro
  • Limit son 5 minit
  • Priyorite GPU
  • Akses API (upload multipart)
  • Konplot
  • Komèsyal (lisans MIT)
Mete ajou

Kesyon ki poze souvan

Upload yon foto figi ak yon clip son, epi AI a kreye yon videyo nan figi a pale son an ak mouvman labial reyèl, pose tèt, ak blinkings.Konstrui sou SadTalker (CVPR 2023), yon MIT-licensed pale-tèt modèl ki anime ekspresyon an kòm byen ke fòm bouch.

Enfòmasyon sou figi a ka yon imaj JPG oswa PNG (jouk a 10 MB) oswa yon videyo MP4 / WebM kout (nou itilize premye kadran an). Son an ka MP3, WAV, M4A oswa FLAC jiska 10 MB. Nou retape son an nan 16 kHz endividyèlman.

Kont gratis: jiska 30 segonn pou chak klip. Itilizatè ki peye: jiska 5 minit pou chak demann. Yon son ki pi long vle di yon tan render ki pi long ak yon pri karaktè ki pi wo.

Videyo sync lèz itilize 1000 karaktè pou chak segonn nan videyo ki pwodwi. Yon klip 30-dezyèm = 30,000 karaktè. Koute a se facturé devan de balans karaktè ou ak retounen otomatikman si jenerasyon an pa travay.

Wi — Kode ak pwa SadTalker yo anba lisans MIT (pa gen Llama, Gemma, oswa backbone ki pa komèsyal). Videyo ou kreye yo pou ou itilize pou rezon komèsyal. Ou responsab pou w gen dwa sou imaj figi ak son ki soti nan sous ou uploade.

Avèk yon tan renderman ki pi kout, li pran apeprè 30 segonn pou yon klip 5 segonn sou sèvè A100 nou an, ki ap grandi linètman ak longè son an.

Presetan konplè (pa défaut) anime pozisyon tèt, klòch, ak ekspresyon ansanm ak bouch, ki pwodwi yon videyo ki pale-chèf plis natirèl. Presetan toujou verrouille tèt nan plas li epi anime sèlman bouch la — itil lè ou vle yon avatar shot ki estab.

GFPGAN se yon modèl restorasyon figi ki fè detay figi a pi klè apre rendering lip-sync. Li netwaye artefakte epi fè 256-piksèl rezilta a sanble pi pre 512. Li prèske double tan rendering men li vo li pou shots erè.

SadTalker renderize nan 256 px pa default. Kouri sou 512 px pou yon rezilta pi klè (pi lent, VRAM pi wo) oswa pèmèt GFPGAN enhancer pou upscale detay figi. Pou pi bon rezilta, upload a segondè-kalite, byen-eklere portrait foto.

Wi. Upload yon MP4 oswa WebM kòm enpòte figi a epi nou pral itilize premye kadran an kòm idantite kondwi. Pou re-double vidéo konplè (per-frame bouch ranplasman), gade pwochen Dubbing Studio video pipeline.

Wi. POST yon demann multipart pou /api/v1/lipsync/ ak jaden figi ak son, Lè sa a, sondaj /api/v1/lipsync/result/?uuid= jiskaske estati a se "komplete". Reponn an gen yon URL pou MP4 renderized. Akses API mande yon plan peye.

SadTalker itilize alignman figi pou deteksyon ak kouvri figi ki pi prominent. Pou pi bon rezilta, upload yon portrait ak yon moun nan sant, je vizib, ak minimòm occlusion. Group foto ka pwodwi rezilta ki pa ka prevwa.
5.0/5 (1)

Ki sa nou ka amelyore? Feedback ou ede nou rezoud pwoblèm.

Prepare pou w kòmanse?

Enskri pou gratis epi jwenn 50 kredi. Pa gen okenn kat kredi nesesè.