Al Lip Sync Video Generator
Nahrajte fotku obličeje a audio klip a získejte video s mluvenou hlavou s realistickou synchronizací rtů, pózou hlavy a mrknutím. Powered by SadTalker (MIT). Komerční použití OK.
Odeslat obličej + Audio
1000 znaků za sekunduPřetáhněte váš soubor sem, nebo Procházet
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.soubor.mp3
0 MBPřetáhněte váš soubor sem, nebo Procházet
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.soubor.mp3
0 MBTohle obvykle trvá 30 sekund až 2 minuty.
Vaše mluvící-hlava video
O SadTalkerovi
SadTalker (CVPR 2023, Tencent ARC) je open-source mluvící-hlava model, který animuje jeden obrázek obličeje mluvit jakýkoli zvuk. Na rozdíl od variant Wav2Lip, SadTalker také animuje hlavu pózovat, mrkne, a výraz pro přirozenější výsledek.
Kód a váhy jsou MIT-licensed konec do konce, žádné lama, Gemma, nebo non-commercial páteře, takže videa, které vytváříte, jsou bezpečné pro komerční použití.
Tipy pro nejlepší výsledky
- Použijte kvalitní, dobře osvětlený portrét viditelné oči, ústa zavřená
- Středová tvář, čtverec nebo 4:5 poměr stran funguje nejlépe
- Čistý zvuk řeči (bez hudby) přináší těsnější synchronizaci rtů
- Povolit GFPGAN pro hrdinské záběry Doubles vykresluje čas, ale ořezává detail
- Použijte stále přednastavený, když chcete stabilní avatar záběr
Synchronizované videoplány Lip
Start zdarma, upgrade, když potřebujete více
- 30-sekundový audio limit
- 256 px výstup
- "Still" pouze přednastaveno
- Žádný zesilovač obličeje
- 30-sekundový audio limit
- Oba "plná" a "stále" předvolby
- 256 / 512 px výstup
- GFPGAN zesilovač obličeje
- 5-minutový audio limit
- Prioritní fronta GPU
- API přístup (multipart upload)
- Webhook dokončení volání zpět
- Komerční použití (license MIT)
Často kladené otázky
Co bychom mohli zlepšit? Vaše zpětná vazba nám pomáhá řešit problémy.
Připraveni začít?
Zaregistrujte se zdarma a získejte 15,000 znaků. Není vyžadována kreditní karta.