AI Lip Sync Videogenerator
Laden eng Gesiichtsfoto an en Audioclip erop - kritt e Video mat engem schwätzenden Kopf mat realistischer Lippensynchroniséierung, Kopfpositioun a Bléckwiessel. Mat SadTalker (MIT). Kommerziell Benotzung OK.
Audio
1000 Zeichen pro SekonnZiehen a léisen Är Datei hei, oder Sich
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.Datei.mp3
0 MBZiehen a léisen Är Datei hei, oder Sich
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.Datei.mp3
0 MBÄert Video gëtt gerendert. Dat dauert normalerweis 30 Sekonnen bis 2 Minutten.
Websäit vum Video
Websäit vum Saarland
De SadTalker (CVPR 2023, Tencent ARC) ass en Open-Source-Modell, deen e Gesiicht animéiert fir all Audio ze schwätzen. Am Géigesaz zu Wav2Lip-Varianten animéiert SadTalker och Kopfpositiounen, Bléckwiessel an Ausdréck fir e méi natierlecht Resultat.
Et gëtt och e puer aner Aarte vu Videospiller, déi net op Video-CDen erauskommen, mä op DVDen, déi et och gëtt.
Tipps fir déi bescht Resultater
- Benotzt e gutt beliichte Porträt mat héijer Qualitéit - Aen sichtbar, Mond geschloss
- Zentréiert Gesiicht, Quadrat oder 4:5 Säitenverhältnes funktionnéiert am Beschten
- D'Sprooch ass net méi am Gebrauch, d'Musek ass méi räich un Texter.
- GFPGAN fir Helden-Schëss aktivéieren - verdoppelt d'Renderzäit, awer verschärft d'Detailer
- Benotzt d'Standbild-Vireinstellung wann Dir e stännege Avatar-Schnappschuss wëllt
Websäit vu Syndicat National de l'Édition Phonographique
Gratis ufänken, aktualiséieren wann Dir méi braucht
- 30-Sekonnen-Audiolimit
- 256 px Ausgab
- Just "Still"-Vireinstellung
- Keng Gesiichtsverbesserung
- 30-Sekonnen-Audiolimit
- Beide "voll" an "still" Vireinstellungen
- 256 / 512 px Ausgab
- GFPGAN Gesiichtsverbesserung
- 5 Minutten
- Prioritéit GPU-Warteschlange
- API-Access (Mehrfach-Upload)
- Webhook-Vervollstännegung Callbacks
- Kommerziell Benotzung (MIT Lizenz)
Häufig gestallte Froen
Wat kéinte mir verbesseren? Äert Feedback hëlleft eis, Problemer ze léisen.