AI Lip Sync Video Oýnatyjy

Yzyň fotosuratyny we ses klipini ýükle - realistik agyz synk, baş pozisiýon we göz gyrpyş bilen gürleşen baş wideo al. SadTalker (MIT) tarapyndan işledilýär. Ticar ulanmak OK.

Siziň dilinde häzirlikçe TTS sesleri ýok. Bize özüňkileri goşmaga kömek et! Sesini Saýla

_Eňkalar

1000 karakter/sekunde

Faýlyňyzy şu ýere çek we goý, ýa-da _Gözle

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

faýl.mp3

0 MB

Faýlyňyzy şu ýere çek we goý, ýa-da _Gözle

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

faýl.mp3

0 MB

Işlenilýär...

Videoň renderlenýär. Bu adatça 30 sekuntdan 2 minuta çenli wagt alar.

Siziň Talking-Head Video

_Güncelle

SadTalker Hakkynda

SadTalker (CVPR 2023, Tencent ARC) bir açyk çeşme gürleşen baş modelidir, ol bir ýüz resimini animasiýa edip her hili sesleri aýtmak üçin. Wav2Lip variantlardan tapawutly, SadTalker baş pozisiýa, göz gyrpma we sözleri animasiýa edip has dogry netije almak üçin.

Kod we agramlar MIT-den lisenziyaly - Llama, Gemma ýa-da tiz-tiz däl backbone ýok - şonuň üçin döredýän wideolar tiz-tiz ulanmak üçin howpsuz.

Nätijeler üçin maslahatlar

  • Beýik hiliň, gowy ýagtylanan portreti ullan - gözler görünýär, agyz ýapylýar
  • Merkezi ýüz, dörtburç ýa 4:5 reňk gaýşy iň gowy işleýär
  • Saýlanan söz ses (müzik ýok) has gowy söz deňlemesini getirýär
  • GFPGAN-y gahryman çakmalar üçin işe giriz - render wagtyny ikiye böleýär emma detallary çuňlaşdyrýar
  • Bir avatar çekimini durnukly etmek isleseň, Durnukly öň bellenişi ullan

Lip Sync Video Plans

Beýiklik

Free
  • 30 sekunt ses çäklendirmesi
  • 256 px çykdajy
  • "Still" preset only
  • Yz bejergisi ýok
Eň meşhur
Free Account
  • 30 sekunt ses çäklendirmesi
  • Eýsem "full" hem "still" öň bellemeler
  • 256 / 512 px çykylyş
  • GFPGAN ýüz giňeltme
Beýiklik
Pro
  • 5 minut ses çäklendirmesi
  • GPU nobatçylygyň öňeligi
  • API erişmek (çok bölek ýüklemek)
  • Webhook tamamlaýjy çakylyklar
  • Ticar ulanmak (MIT lisenzi)
Üstlenç

Gynançly Soraglar

Yzyň bir fotosuratyny we ses klipini ýükläň, we AI o ýüzüň ses bilen gürleýän wideosyny hakykatçyk burnuň hereketleri, başyň durşy, we göz ýumruklary bilen döreder. SadTalker (CVPR 2023) üstünde bina edildi, bir MIT-licensiýalanan gürleýän baş modeli, agyz şekiline goşmaça animasiýa edýän beýan.

Görkezme girdeji JPG ýa PNG resim (10 MB çenli) ýa-da gysga MP4/WebM video (biz ilkinji fraýmy ulanýarys) bolup biler. Ses girdeji MP3, WAV, M4A ýa-da FLAC 10 MB çenli bolup biler. Biz sesni 16 kHz çenli içlikde täzeden nusgalaýarys.

Beýiklik:

Lip sync video saniýe içinde 1000 karakteri ulanýar. 30 sekuntlyk klip = 30,000 karakter. Bu töleg siziň karakter balansyňyzdan öňden tölenýär we eğer emele gelmek başartmasa otomatik gaýtarylýar.

Eý — SadTalker kodlary we agramlary MIT lisenziýaly (Llama, Gemma ýa-da tiz işleýän däl backbone ýok). Siz döredýän wideolar tiz işleýän üçin siziňdir. Siz ýüklän ýüz reňki we ses haklarynyň eýesi bolmak üçin jogapkärsiňiz.

5 sekunt klip üçin A100 serwerimizde takmynan 30 sekunt, ses uzunlygy bilen takmynan düz ölçelip. GFPGAN ýüz güýçlendirijini işe girizmek takmynan iki esse render wagtyny artdyrýar emma has çuňňur, has ýokary hilli çykdajylary döredýär.

Täzeden bellenen (öň bellenen) başy, gözi, we ýüzi dudak bilen bir hatarda animasiýa edýär, has dogry gürleşen baş wideosyny döredip. Hala öň bellenen başy ýerinde kiçirýär we diňe aýagy animasiýa edýär - durnukly avatar çekimini isleseňiz peýdaly.

GFPGAN bir ýüzi dikeldiş modelidir ol ýüzi render etmekden soňra has çuňňur edip bilýär. Ol artifakty arassalap 256-piksel çykdajy 512'e golaý görnüp bilýär. Ol render wagtyny iki esse azaldýar emma gahryman suratlar üçin muny etmeli.

SadTalker öň bellenen 256 px render eder. 512 px ululyga geçiň has çuňňur çykyşlar üçin (ýokarky VRAM) ýa-da ýüz detailsini ýokarlandyrmak üçin GFPGAN güýçlendirijini işe giriziň. Iň gowy netijeler üçin ýokary hilli, gowy ýagtylanan portret fotoy ýükläň.

Eý. Bir MP4 ýa-da WebM-i ýüz girizmek üçin ýükle we biz ilkinji fraýmy sürüji kimlik hökmünde ulanyp bileris. Tam wideo tekrar dublajy üçin (fraýmda agyz alyşy), geljek Dubbing Studio video pipeline-ni gör.

Eý. /api/v1/lipsync/'e ýüz we ses meýdançalary bilen bir köp bölegi soragy POST et, soňra "dogry" statusa ýetene çenli /api/v1/lipsync/result/?uuid= sora. Jawap renderlenen MP4'e bir URL içer. API erişmek tölenmeli plany talap edýär.

SadTalker ýüzi tapmak we en görnükli ýüzi kesmek üçin ýüz-ýüze düzmegi ulanýar. En gowy netijeler üçin, bir adamyň merkezinde, gözleri görünýän we az oklüzsiýaly bir portreti ýükle. Toplum fotolary çak edilmedik netijeler döretýär.
5.0/5 (1)

Biz nämeni gowy edip bileris? Siziň pikiriňiz bize kynçylyklary düzetmäge kömek eder.

Başlamaga taýýarmy?

Beýik