Generador de vídeo AI Lip Sync

Oñemomiẽ peteĩ foto cara rehegua ha peteĩ clip ñe'ẽnguéra rehegua - ohupyty peteĩ video ñe'ẽnguéra reheguáva, oguerekóva sincronización de pupitre, postura de cabeza ha ojo'a. Ojeporu SadTalker (MIT). Oñemuporã jeporu ñemuhápe g̃uarã.

Ndoguerekói gueteri ñe'ẽ TTS nde ñe'ẽme. Yvy'akuaa ñamoĩnge umi nde'éregua! Oñemu ñe'ẽ

Ojejuhu cara ha ñehendurã

1000 caractere peteĩ segundo-pe

Arrastra ha oheja archivo ko'ápe, térã jehecha

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

archivo.mp3

0 MB

Arrastra ha oheja archivo ko'ápe, térã jehecha

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

archivo.mp3

0 MB

Procesando...

Oñemohenda video. Kóva katuínte hi'are 30 segundo guive 2 minuto peve.

Video Talking-Head-pegua

Oñeguenohẽ MP4

SadTalker rehegua

SadTalker (CVPR 2023, Tencent ARC) ha'e peteĩ modelo ñe'ẽ'ỹmegua oguerekóva fuente abierto omoheñóihápe peteĩ imagen peteĩ cara-pegua oñe'ẽ hag̃ua oimeraẽ sonido rehe. Wav2Lip variante-kuéra rovake, SadTalker avei omoheñói akã postura, ojo'o ha expresión ojehupyty hag̃ua peteĩ resultado natural.

Código ha peso-kuéra oguereko MIT licencia tuichaháicha, ndaipóri Llama, Gemma térã backbone ndaha'éiva ñemurãgua, upévare umi video oguenohẽva ikatu ojeporu ñemurãgua.

Ñemomarandu ojehupyty hag̃ua ojehupyty porãvéva

  • Oiporu peteĩ retrato iñapysẽvéva ha iñapysẽ porãva: ojejesarekokuaa, ñe'ẽnguéra oñembotýva.
  • Cara central, cuadrado térã proporción 4:5 oiko porãve.
  • Ñe'ẽ ñehendurã hekopete (música ndaipóri) ome'ẽ peteĩ sincronización labial imbaretevéva
  • Oñemongu'e GFPGAN disparo héroe-pe g̃uarã - ombojoavy renderización tiempo katu ombopya'eve detalle-kuéra
  • Oiporu preconfiguración itĩva ojeipotáva peteĩ toma itĩva avatar-pe g̃uarã

Plan de vídeo Lip Sync

Oñepyrũva'erã terã'ỹre, oñemoambue oñeikotevẽ jave hetave

Libre
  • Audio límite 30 segundo
  • 256 px-pegua salida
  • Preconfiguración "Aúne" añónte
  • Ndojehechavéima cara-kuéra
Ojehecharamovéva
Conta libre
  • Audio límite 30 segundo
  • Umi preajuste "omyenyhẽ" ha "oñemomombyry"
  • 256 / 512 px jeikuaauka
  • Jehechaporãve GFPGAN
Oñemoinge'ỹre
Pro
  • Audio límite 5 minuto
  • GPU cola ñemboguatapy
  • API jeike (jejupive heta parte)
  • Retorno de llamada webhook ñeikumbyrã
  • Ojeporu ñemuhápe (Licencia MIT)
Ñemoambue

Pregunta ojejapóva py'ỹinte

Oñemomichĩve peteĩ cara rehegua foto ha peteĩ clip ñehendurã, ha IA omoheñói peteĩ video upe cara rehegua oñe'ẽva ñehendurã rehe, oguerekóva ñemomombyry iñambuéva, akã rehegua postura ha akãrague. Oñemopu'ã SadTalker-pe (CVPR 2023), peteĩ modelo akãrague ñehendurã oguerekóva licencia MIT-pegua, ombohekohápe ñe'ẽmbojoaju, ha avei ñe'ẽmbojoaju.

Umi cara rehegua jeike ikatu peteĩ JPG térã PNG ta'ãnga (10 MB peve) térã peteĩ video MP4/WebM mbykymi (ojeporu foto ypy). Ñemboyke ikatu MP3, WAV, M4A térã FLAC 10 MB peve. Ñemboyke remuestra 16 kHz peve.

Cuentas gratuitas: 30 segundo peve peteĩ clip-pe g̃uarã. Usuario-kuéra ojapyhyva: 5 minuto peve peteĩ pedido-pe g̃uarã. Ñembohasa ipukuvéva he'ise renderización tiempo ipukuveha ha caractere repy tuichaveha.

Pe video sincronización labial oiporu 1000 caractere peteĩ segundo-pe peteĩ video generado-pe. Peteĩ clip 30 segundo pukukue = 30.000 caractere. Ko costo ojejapyhy tapykueve balance de caracteres-gui ha ojevy jey jey jey jey automaticamente generación osẽ porã jave.

Aye — SadTalker código ha peso oguereko MIT licencia tuichaháicha (oĩ'ỹre Llama, Gemma térã backbone ndaha'éiva ñemurãrã). Umi video oguenohẽva nderehegua hína ikatu hag̃uaicha ojeporu ñemurãrã. Reikokuaa hína derecho oguerekóva oúva imagen ha ñehendurã oipe'áva.

Aimete 30 segundo peteĩ clip 5 segundo pukukue javeve ñane servidor A100-pe, oñemoambuéva aimete linealmente ñehendurã pukukue javeve. Oñemongu'e face enhancer GFPGAN ombohetave renderización tiempo, katu ome'ẽ peteĩ salida imbaretevéva ha ikatupyrýva.

Preestablecido tuichaháicha (por defecto) omoheñói akã postura, ojo'áva ha ñe'ẽjoaju, ha avei ñe'ẽmbojoaju, ombohape hag̃ua peteĩ video ñe'ẽmbojoaju natural-véva. Añetehápe, preestablecido omohenda akã upe posición-pe ha omoheñói ñe'ẽmbojoaju añónte, ojeporuporã ojeipotáva peteĩ toma avatar-pegua imbaretevéva.

GFPGAN hína peteĩ modelo cara ñemohenda jey rehegua omopyendáva cara detalle renderizado labio-kuéra sincronización rire. Oñemopu'ã umi artefacto ha ojapo umi 256 pixel-pegua salida ojueheguaite 512-pe. Ombovy'a renderizado tiempo, katu ojehechaporãve ta'ãnga héroe-pe g̃uarã.

SadTalker omboheko 256 px-pe por defecto. Oñemoambue 512 px tuichakue gotyo ojehecha hag̃ua tuichave (michĩve, VRAM tuichavéva) térã oheja GFPGAN oñemomorãve hag̃ua detalle facial. Oñemohu'ã hag̃ua ojehupytýva, oguerahauka peteĩ retrato foto iñambuéva ha iñambuéva.

Avei. Oñemomichĩ peteĩ MP4 térã WebM cara-pe g̃uarã ha ojeporukuaa ko fotograma ypy identidad-ramo. Ojehecha hag̃ua video-kuéra ñembohasa jey tuichaháicha (jehekombo'e ñe'ẽnguéra rehe peteĩ fotograma-pe g̃uarã), ehecha video-kuéra ñembohasa pya'evéva Dubbing Studio-pe.

Avei. POST peteĩ petición multiparte /api/v1/lipsync/-pe, oguerekóva campo cara ha audio, upéi ohesa'ỹijo /api/v1/lipsync/result/?uuid= estado "oñemohu'ã peve". Respuesta oguereko peteĩ URL MP4-pe g̃uarã. API jeike oikotevẽ peteĩ plan ojejapyhyva.

SadTalker oipuru alineación cara rehegua ojuhu ha oñemombyky hag̃ua cara ojehecharamovéva. Ojejuhu porãve hag̃uã, oguerahauka peteĩ retrato peteĩ tapicha oĩva mbytetépe rehe, ohecháva ha occlusion michĩvéva. Umi aty rehegua foto ikatu ome'ẽ resultado ndojeikuaáiva.
5.0/5 (1)

Mba'épa ikatu ñambohape? Tuichave ñemoneĩ oipytyvõta ñamoambue hag̃ua umi apañuãi.

Oñeha'ãmbaitépa oñepyrũ?

Oñemoinge'ỹre ha ohupyty 15.000 carácter. Ndoikói tarjeta de crédito.