Ndesịta ihenhọrọ ndị ahụ

AI Lip Sync Video Generator

Wepụta foto ihu na ọdachi - nweta vidio nke na-ekwu okwu na-eji n'aka, n'isi, nakwa na-atụgharị uche. Ejiri SadTalker (MIT) rụọ ya. Ọrụ ọha na eze OK.

Anyị enweghị ụda TTS n'asụsụ gị kemgbe. Meekwa ka anyị tinye gị! Kpọnye ụda gị

Wepụ

1,000 akara n'ime sekọnd

Tinye faịlụ gị ebe a, mọọbụ Browse

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

faịlụ.mp3

0 MB

Tinye faịlụ gị ebe a, mọọbụ Browse

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

faịlụ.mp3

0 MB

Na-arụ ọrụ...

Na-egosipụta vidyo gị. Nke a na-ewe sekọnd 30 ruo minit 2.

Vidéọ̀dù Talking-Head gị

Bubata

Báà SadTalker

SadTalker (CVPR 2023, Tencent ARC) bụ ohuru-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọnụ-ọ

Ọdịdị na nrọ bụ MIT-licensed n'akụkụ niile - ọ dịghị Llama, Gemma, ma ọ bụ backbone na-enweghị ọrụ - yabụ vidiyo ị na-emepụta bụ nchebe maka ọrụ ọrụ.

Ndụmọdụ maka nsonaazụ kacha mma

  • Jiri ogoelu, onyonyoo-n'okporo ụzọ - anya na-egosi, ọdụm mechie
  • N'etiti ihu, square mọọbụ 4:5 aspect ratio na-arụ ọrụ ka mma
  • Nsọ okwu dị ọcha (enweghị egwu) na-enye n'ụdị synchronization nke ụkwụ
  • Mepee GFPGAN maka ihenhọrọ - na-emegharị oge ngosipụta ma na-emegharị nkọwa
  • Jiri Still preset mgbe ịchọrọ apụl apụl na-adịgide

Nhazi vidio Lip Sync

Bido n'efu, gbasaa mgbe ịchọrọ ihe ọzọ

Free
  • 30-sekọnd ụda
  • 256 px ọbụna
  • "Still" preset naanị
  • Enweghị onye na-eme ka ihu dị mma
Nke kacha amasị
Akaụntụ
  • 30-sekọnd ụda
  • "full" na "still" presets abụọ ahụ
  • 256 / 512 px ọbụna
  • GFPGAN n'ime ihu nkwalite
Akaụntụ
Nhazi
  • 5-minute audio limit
  • Nhazi GPU
  • API nbanye (ọ̀dị̀ọ̀gụ̀ọ̀gụ̀)
  • Webhooks ngwụcha callbacks
  • Oji azụmahịa (MIT ikikembanye)
Nkwalite

Ajụjụ ndị a na-ajụkarị

Wepụta foto ihu na ọdachi, nakwa AI ga-emelite vidio nke ihu ahụ na-ekwu okwu na ọdachi na-emegharị n'ime ihu, n'ime isi, nakwa n'ime ụkwụ. E mepụtara ya na SadTalker (CVPR 2023), MIT-laịsịnta na-ekwu okwu-isi model nke na-anụgharị ihe n'ime n'ime n'ime n'ime.

N'ime ihu nwere ike ịbụ JPG ma ọ bụ PNG inyogo (ụdị ruo 10 MB) ma ọ bụ vidiyo MP4/WebM n'ime obere oge (ọ na-eji fréèmu mbụ). Ọdịdị n'ime oge nwere ike ịbụ MP3, WAV, M4A, ma ọ bụ FLAC ruo 10 MB. Anyị na-ewepụ ụda na 16 kHz n'ime.

Akaụntụ ọbụla: ruo sekọnd 30 kwa clip. Ndị ọrụ na-akwụ ụgwọ: ruo minit 5 kwa arịrịọ. Ogo dị ogologo pụtara oge render dị ogologo nakwa ọnụọgụgụ dị elu.

Vidéọ̀tụ̀ọ̀tụ̀ọ̀tụ̀ na-eji akara 1,000 n'otu sekọnd nke vidio a haziri. Klip 30-sekọnd = akara 30,000. A na-ebipụta ụgwọ ahụ n'ihu site na ego akara gị ma na-ebuli ya n'ụzọ mepere emepe ma ọ bụrụ na ọbịbịa ahụ arụghị ọrụ.

Ee — SadTalker kọdị na ọba ndị ahụ bụ MIT na-enye ikike n'oche (ọ dịghị Llama, Gemma, mọọbụ backbone na-enweghị ọrụ). Videọ ndị ị na-ebipụta bụ gị iji jiri ha n'ọrụ. I nwere ikike n'ime inyogo ihu na ụda ị na-ebubata.

N'ihe banyere sekọnd 30 maka 5-sekọnd clip na A100 sava anyị, na-egosipụta n'ụzọ lineari na ogologo ụda. Ikwe ka GFPGAN n'ihu na-emelite na-eme ka oge render dị ka ugboro abụọ mana na-emepụta ihe n'ime, ihe n'ime-ọdịnaya.

Nhazi nke zuru ezu (dìfọ́ọ̀ltụ̀) na-anụgharị ọnọdụ n'elu, na-anụgharị, nakwa ngosipụta n'otu aka na-abịa n'otu na-apụtakwa vidio n'elu na-ekwu okwu. Nhazi nke ka na-anụgharị n'ebe ahụ na-anụgharị naanị n'anụnụ - bara uru mgbe ịchọrọ apụl apụl na-adịgide.

GFPGAN bụ móòdù nrụzigharị ihu nke na-ewepụ ihe ndị dị n'ihu n'ihu mgbe lip-sync na-egosipụta. O na-ewepụ artifaktị ma na-eme ka 256-pixels pụtapụta na-egosipụta n'ụzọ dị nso na 512. O na-ewepụ oge egosipụta ugboro abụọ ma ọ bụ na-emeri ya maka ihenhọrọ ndị dị egwu.

SadTalker na-egosipụta na 256 px site na difọ́ọ̀ltụ̀. Kpụgharịa na 512 px nha maka ọbụna ihenhọrọ (n'okporo ụzọ, VRAM elu) mọọbụ mee ka GFPGAN enhancer rụọ ọrụ ka ọ na-egosipụta nkọwa ihu. Maka nsonaazụ kacha mma, bulie foto portrait nke nwere ogo elu na-acha ọkụ.

Ee. Bubata MP4 mọọbụ WebM dịka n'ime ihu na anyị ga-eji fréèmù mbụ dịka n'ime ụgbọala. Maka n'ike nke vidio n'ime onwe ya (n'ime-fréèmù gbanwee n'ime), hụ na vidiyo pipeline nke Dubbing Studio na-aga.

Ee. POST a multipart arịrịọ na /api/v1/lipsync/ na ihu na ụda ebe, mgbe ahụ pọọl /api/v1/lipsync/result/?uuid= ruo mgbe ọnọdụ bụ "kwuru". Nzaghachi ahụ nwere URL na-egosi MP4. Nbanye API chọrọ n'ihe nlereanya a na-akwụ ụgwọ.

SadTalker na-eji ntọgharị ihu iji chọpụta ma kpụga ihu ndị kasị mara mma. Maka nsonaazụ kacha mma, bulie portrait na onye ọbụla nọ n'etiti, anya na-ahụ anya, nakwa occlusion nke obere. Ụlọọrụ foto nwere ike ịpụta nsonaazụ na-adịghị aghọta.
5.0/5 (1)

Gịnị ka anyị ga-eme ka ọ dịrị mma? Ntụziaka gị na-enyere anyị aka idozi nsogbu.

Nwere ike ịmalite?

Nweta 15,000 characters. No credit card required.