AI Lip Sync Video Generator
Alŝutu vizaĝfoton kaj sondosieron - ricevu videon de parolanta kapo kun realisma lip- sinkronigo, kapo- pozicio kaj okulfrapado. Propulsita de SadTalker (MIT). Komerca uzo estas permesita.
Alŝuti vizaĝon kaj aŭdon
1000 signoj po sekundoŜovu vian dosieron ĉi tien, aŭ foliumi
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.dosiero.mp3
0 MBŜovu vian dosieron ĉi tien, aŭ foliumi
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.dosiero.mp3
0 MBRenderigas vian videon. Tio kutime daŭras 30 sekundojn ĝis 2 minutojn.
Via parolanta videoName
Pri SadTalker
SadTalker (CVPR 2023, Tencent ARC) estas malfermkoda parolanta-kapo modelo kiu animas ununuran vizaĝbildon por paroli ajnan sonon. Malsame al Wav2Lip variantoj, SadTalker ankaŭ animas kapopozon, palpebrumon, kaj esprimon por pli natura rezulto.
La kodo kaj la pezoj estas licencitaj de MIT de fino al fino — ne ekzistas Lama, Gemma aŭ nekomercaj dorso — do la videoj kiujn vi kreas estas sekura por komerca uzo.
Konsiloj por plej bonaj rezultoj
- Uzi altkvalitan, bone lumigitan portreton - okuloj videblaj, buŝo fermita
- Centra vizaĝo, kvadrato aŭ 4:5 aspekto estas plej bona
- Pura parola aŭdo (sen muziko) donas pli striktan lip- sinkronigon
- Ebligi GFPGAN por heroaj pafoj - duobligas la rendertempon sed akrigas detalojn
- Uzi la antaŭdifinitan bildon por stabila avatara foto
Lipoj- sinkronigaj video- planoj
Komencu senpage, ĝisdatigu kiam vi bezonas pli
- 30-sekunda aŭda limo
- 256 px eligo
- Nur "Still" antaŭagordo
- Neniu vizaĝplibonigo
- 30-sekunda aŭda limo
- Ambaŭ "plena" kaj "malplena" antaŭagordoj
- 256 / 512 px eligo
- GFPGAN vizaĝ-plibonigilo
- 5-minuta aŭdlimito
- GPU- prioritata vico
- API- aliro (multparta alŝuto)
- Revoko de kompletigo de TTT-hokoj
- Komerca uzo (MIT-permesilo)
Oftaj demandoj
Kion ni povus plibonigi? Via reago helpas nin solvi problemojn.
Ĉu vi pretas komenci?
Aliĝi senpage kaj ricevi 15,000 signojn. Neniu kreditkarto necesas.