AI Lip Sync Video Generator

Pakua picha ya uso na kipande cha sauti cha hondia (MIT) pata video inayozungumza kwa kutumia mdomo halisi, sopeli ya kichwa, na nyusiko za macho. Imeandaliwa na Sad Sever Sexer (MIT).

Pakia Uso wa + Audio

Herufi 1,000 kwa sekunde

Drag & shusha faili yako hapa, au print operation status

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

faili.m3

0 MB

Drag & shusha faili yako hapa, au print operation status

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

faili.m3

0 MB

Kutayarisha...

Kwa kawaida, inachukua sekunde 30 hadi dakika 2.

Video Yako Yenye Kuongea

Pakia

Kuhusu Mzungumzaji Mwenye Huzuni

Sad Talker (CVPR 2023, Tencent ARC) ni mfano ulio wazi wa kuzungumza na kichwa ambao huchochea sura moja ya uso kusema sauti yoyote. Tofauti na Wav2Lippi tofauti, Said Scarker pia husisimua kichwa, kupepesa macho, na kusema kwa ajili ya matokeo ya asili zaidi.

Sheria na uzito ni sehemu ya mwisho iliyotiwa alama ya mT-linzi ili kusitishwa na Llama, Gemma, au uti wa mgongo usio wa kibiashara kwa hiyo video unazotoa ni salama kwa matumizi ya kibiashara.

Madokezo ya Kupata Matokeo Bora Zaidi

  • Tumia picha ya hali ya juu, inayong'aa vizuri macho yenye kuonekana, mdomo ukiwa umefungwa
  • Uso ulio katikati, wenye umbo la mraba au 4:5 kwa upande mmoja una matokeo bora zaidi
  • Sauti safi (hakuna muziki) hutoa mdomo mgumu
  • Dawa ya kuchanjia yenye nguvu inayoitwa GFPGAN hutoa wakati mara mbili lakini hunoa mambo madogo - madogo
  • Tumia hata kabla ya hapo unapotaka kupigwa risasi mfululizo

Programu za Vidio za Lip Sync

Anza kazi ukiwa huru unapohitaji msaada zaidi

Huru
  • Mpaka wa sauti ya pili 30
  • Utokezwaji wa pex 256
  • "Still" imejikita tu
  • Hakuna aboreshaye uso
Wanapendwa Sana
Sh.
  • Mpaka wa sauti ya pili 30
  • Vipawa vyote viwili "vimejaa" na "bado" vimewekwa
  • 256 / 512 pox pox
  • GFPGAN anakabiliana na nyongeza
Fanyeni Ishara kwa Hiari
Project
  • Mpaka wa sauti yenye ukubwa wa mara 5
  • Njia za Kwanza za USPU
  • MILIONI (sehemu kubwa ya mizigo)
  • Vipindi vya kukamilisha programu za kompyuta
  • Utumizi wa kibiashara (na leseni ya MIT)
keyboard label

Maswali Ambayo Watu Huuliza Mara Nyingi

Pakua picha ya uso na kipande cha sauti, na AI hutokeza video ya uso huo ukizungumza kwa kutumia midomo halisi, mchomoo wa kichwa, na nyusi za macho. Imejengwa kwenye Sad Sad Sever Sexer (CVPR 2023), mfano wa MT-uligezi wenye kichwa unaochochea usemi zaidi ya umbo la mdomo.

Uso unaweza kuwa picha ya JPG au PNG (karibu 10 MB) au video fupi ya MP4/WbM inayoendesha gari (tunatumia fremu ya kwanza). Sauti inayoendeshwa inaweza kuwa MP3, UV, M4A, au FLCA hadi 10 MB. Sisi hurudisha sauti ya sauti hadi 16 kHz kwa ndani.

Akaunti huru: Malipo ya sekunde 30 hivi kwa kila kipande cha matangazo: Malipo kwa dakika 5 kwa kila ombi. Sauti ndefu zaidi humaanisha kutumia muda mrefu zaidi na gharama za juu zaidi.

Video hiyo inatumia herufi 1,000 kwa sekunde moja za video iliyochorwa.

Ndio, mfumo wa sheria wa Sadineer na uzito wake una leseni ya kumaliza (hakuna Lala, Gemma, au mfumo wa bahari usio wa kibiashara). Video unazotengeneza ni zako kutumia biashara. Wewe una daraka la kuwa na haki za chanzo cha sura yako na sauti unayobeba.

Karibu sekunde 30 kwa kipande cha sekunde 5 kwenye kipande chetu cha A100, kikizunguka karibu na lice kwa urefu wa sauti.

Picha kamili huamsha kichwa, kupepesa macho, na kujieleza pamoja na midomo, ikitokeza video ya asili zaidi ya kuongea.

GFPGAN ni kigezo cha kurudisha hali ya hewa ambacho hunoa habari za uso baada ya kutafsiri mdomo. Husafisha vitu vya kale na kufanya matunda 256 yatazame karibu 512.

Sad Sexer anatafsiri kwenye pex 256 kwa kukosa shabaha. Switch to 512 px kwa ajili ya kutoa taarifa za juu zaidi (za juu zaidi, za juu zaidi) au anamuwezesha GFPGAN kuboresha picha za uso. Kwa matokeo bora, apakia picha ya hali ya juu, iliyo nyangavu.

Naam. Pakua kiungo cha MP4 au Mtandaoni kama alama ya uso na tutatumia fremu ya kwanza kama utambulisho wa kuendesha gari.

Naam, kura ya maoni /async/v1/lipsync/ ikiwa na nyanja za uso na sauti, kisha kura ya maoni /api/v1/lipsync/resuult/?uifid Bradton mpaka hadhi "ikamili".

Sad Talker hutumia ishara ya uso kugundua na kuvuna uso maarufu zaidi. Kwa matokeo bora zaidi, pakia picha ya mtu mmoja akiwa na utu wake, macho yanayoonekana, na picha chache tu zisizotarajiwa.
5.0/5 (1)

Uwezo wako wa kutatua matatizo ni nini?

Je, uko tayari kuanza?

Tia sahihi kadi ya mkopo 50 bila malipo.