AI Синхронизатор видеомагнитофона Lip
Загрузить фото лица и аудиоклип — получить видеоролик с реалистической синхронизацией губ, головной позы и моргами.
Загрузить лицо + звук
1 000 знаков в секундуПеретащите свой файл здесь, или Просмотр
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.файл mp3
0 MBПеретащите свой файл здесь, или Просмотр
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.файл mp3
0 MBКак правило, это занимает от 30 секунд до 2 минут.
Твоё видео-голову-голову-голову
О Сад-Талкере
SadTalker (CVPR 2023, Tencent ARC) — модель с открытым исходным кодом, которая анимирует одно лицо, чтобы сказать любой звук. В отличие от Wav2Lip, SadTalker также анимирует позу головы, мигает и выражение для более естественного результата.
Код и вес - это конец MIT-лицензии — нет Ламы, Джеммы или некоммерческой опоры — так что видео, которое вы создаете, безопасно для коммерческого использования.
Рекомендации в отношении наилучших результатов
- Использовать высококачественный, хорошо освещенный портрет: видимые глаза, закрытый рот
- Скрытое лицо, квадратное или 4:5 соотношение сторон работает лучше всего
- Чистая речь звук (без музыки) дает более жесткий синхронизм губ
- Включите GFPGAN для героев — удваивает время, но уточняет детали
- Используйте все еще сетку, когда хотите, чтобы аватар был снят.
Синхронные видеопланы Lip
Начать бесплатно, обновить, когда нужно больше
- 30-секундный предел звука
- 256 px выходных
- Только "по-прежнему"
- Никакого усилителя лица
- 30-секундный предел звука
- Как "полные", так и "по-прежнему"
- 256 / 512 вывода px
- Усилитель лица GFPAN
- 5-минутное ограничение звука
- Приоритетная очередь GPU
- Доступ к API (многоразрядная загрузка)
- Обратные звонки в Webhook
- Коммерческое использование (лицензия МТИ)
Часто задаваемые вопросы
Твоя обратная связь помогает нам решать проблемы.