ബഗ് / സാങ്കേതിക അപേക്ഷ അറിയിയ്ക്കുക

AILp Sync വീഡിയോ നിര്‍മ്മാണം

ഒരു മുഖചിത്രവും ഒരു ഓഡിയോ ക്ലിപ്പും — യഥാര്‍ത്ഥത്തില്‍ ലിപി സിന്‍ക്, ഹെഡ്‌ പോസ്, മിന്നിങ് എന്നിവയുമായി ഒരു വര്‍ത്തമാനം വരച്ച വീഡിയോ എടുക്കുക. സാഡ് വോര്‍ണര്‍ (MIT) എന്ന രീതിയില്‍ പ്രാവര്‍ത്തികമാക്കിയതു് ഓപ്പണ്‍.

നിന്‍റെ ഭാഷയില്‍ ടിടിഎസ് ശബ്ദങ്ങളില്ല, നിന്‍റെ ശബ്ദം കൂട്ടാന്‍ ഞങ്ങളെ സഹായിക്കൂ! ശബ്ദം വിൽക്കുക

മോഡിഫയര്‍ & ഓഡിയോ ലോഡ് ചെയ്യുക

ഒരു സെക്കന്‍ഡില്‍ 1,000 അക്ഷരങ്ങള്‍

നിങ്ങളുടെ ഫയല്‍ ഇവിടെ വലിച്ചിടുക, അല്ലെങ്കില്‍ വലിച്ചിടുക പരതുക

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

ഫയല്‍.mp3

0 MB

നിങ്ങളുടെ ഫയല്‍ ഇവിടെ വലിച്ചിടുക, അല്ലെങ്കില്‍ വലിച്ചിടുക പരതുക

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

ഫയല്‍.mp3

0 MB

പ്രവര്‍ത്തനത്തില്‍...

നിങ്ങളുടെ വീഡിയോ പൂര്‍ത്തിയാക്കുന്നതിന് 30 സെക്കന്‍റ് എടുക്കും.

നിങ്ങളുടെ സംസാര വീഡിയോ

എംപി4 ഡൌണ്‍ലോഡ് ചെയ്യുക

സാഡ് ടെലിഫോര്‍ഡിനെക്കുറിച്ച്

സാദി ടെലിഫോര്‍ഡര്‍ (CVPR23, റ്റെനാന്റ് ARC) ഏതു് ഓഡിയോ സംസാരിക്കുന്നതിനായി ഒരു മുഖത്തെ ചലിപ്പിക്കുന്ന ഒരു തുറന്ന ശബ്ദ-തല അച്ചടക്കമാണ്. വവ്‌ലിപ്‌നീറ്റുകള്‍ പോലെ, സാദി ഡ്രാഡിനേറ്റര്‍ തലവെട്ടികള്‍, മിന്നലുകള്‍, കൂടുതല്‍ സ്വാഭാവികമായ ഫലങ്ങള്‍ എന്നിവയും.

കോഡ്, തൂക്കം എന്നിവ ഒടുവില്‍ അവസാനിക്കും. ലാമാ, ഗമ, കമ്മ്യൂണിക്കേഷൻ എന്നിവയല്ല. അതുകൊണ്ട്, നിങ്ങള്‍ ഉണ്ടാക്കുന്ന വീഡിയോകള്‍ വാണിജ്യ ഉപയോഗത്തിനു സുരക്ഷിതമാണ്.

നല്ല ഫലങ്ങളുടെ സൂചനകൾ

  • ഉയര്‍ന്ന, സുതാര്യമായ ചിത്രചിത്രം ഉപയോഗിക്കുക — കണ്ണുകള്‍ കാണാവുന്നവ, വായ അടച്ചിരിക്കുന്നു
  • സെന്‍ട്രല്‍ മുഖത്തെ, സ്ക്വയര്‍ അല്ലെങ്കില്‍ 4: 5 ആംഗ്യ റേറ്റ് നന്നായി പ്രവര്‍ത്തിക്കുന്നു
  • സംസാര സംയോജക ഓഡിയോ (സംഗീതം ഇല്ല) ശക്തമായ ലിപി സിന്‍ക് നല്‍കുന്നുName
  • ഹീറോ ഷൂട്ടുകള്‍ക്കായി GFPGAN പ്രവര്‍ത്തന സജ്ജമാക്കുക —⁠ ഇരട്ട റെന്‍റ്, പക്ഷെ മിന്നല്‍ വിശദാംശങ്ങള്‍
  • നിങ്ങള്‍ക്ക് ഒരു സ്ഥിരമായ അവതാര വെടിവയ്ക്കണമെങ്കില്‍ മുന്‍ഗണന ഉപയോഗിക്കുക.

ലിപി സിന്‍ക് വീഡിയോ പ്ലാന്‍സ്Name

നിങ്ങള്‍ക്ക് കൂടുതല്‍ ആവശ്യമുണ്ടെങ്കില്‍ സ്വതന്ത്രമായി തുടങ്ങുക, അപ്ഗ്രേഡ് ചെയ്യുക

ഫ്രീ
  • 30- സെക്കന്റ് ഓഡിയോ പരിധി
  • 256 px ഔട്ട്പുട്ട്
  • "സ്റ്റില്‍" മുന്‍സെറ്റ് മാത്രം
  • മുഖത്തെ കൂടുതല്‍ മെച്ചപ്പെടുത്താന്‍ പറ്റില്ല.
ഏറ്റവും പ്രസിദ്ധം
ഫ്രീ അക്കൗണ്ട്
  • 30- സെക്കന്റ് ഓഡിയോ പരിധി
  • "മുഴുവന്‍" എന്നും "വിജയിച്ചു" എന്നും.
  • 256 / 512 px ഔട്ട്പുട്ട്
  • ജിപിപിജിന്‍ മുഖമുദ്രാകൃതിName
ഫ്രീ ആയി ഒപ്പ് വയ്ക്കുക
പ്രൊഫൈല്‍
  • 5- മിനിട്ട് ഓഡിയോ പരിധി
  • മുന്‍ഗണന GPU റേറ്റര്‍
  • API സമീപനം (multipart അപ്‌ലോഡ്) Name
  • വെബ് ഹൂക്ക് കോള്‍ പൂര്‍ത്തിയാക്കല്‍ ബാക്കെന്‍ഡുകള്‍
  • വാണിജ്യ ഉപയോഗം (MIT ലൈസന്‍സ്)
അപ്ഗ്രേഡ് ചെയ്യുക

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

മുഖചിത്രവും ഓഡിയോ ക്ലിപ്പും അപഗ്രഥനങ്ങള്‍, തലയോട്ടികള്‍, സ്മൃതികള്‍ എന്നിവയുമായി ശബ്ദങ്ങള്‍ സംസാരിക്കുന്ന ഒരു വീഡിയോ പ്രസദ്ധീകരിക്കുന്നു. സാഡ് വോര്‍ലിമെന്റില്‍ (CPR23), വായുടെ ആകൃതിയുമായി ബന്ധപ്പെട്ട സംസാരം നിര്‍മ്മിക്കുന്ന, MITL-തലം നിര്‍മ്മിക്കുന്ന, വായുടെ ആകൃതിയുമായി ബന്ധപ്പെട്ട എക്സ്പ്രെഫൈല്‍ (CPR23).

മുഖത്തിന്റെ ഇന്‍പുട്ട് ഒരു JPG അല്ലെങ്കില്‍ PNG ഇമേജ് (ഉപയോഗിയ്ക്കാന്‍ 10 എം.പി.എം.എം. എം. എം. എം. എസ് ഡ്രോഡ് വീഡിയോ (ഞങ്ങള്‍ ആദ്യത്തെ ഫ്രെയിം ഉപയോഗിക്കാം). ഡ്രൈവിങ് ഓഡിയോ MP3, WAV, MAV, FLAC, അല്ലെങ്കില്‍ FLAC 10 എം.എം.എം. ല്‍ (KHSLC) - ല്‍ നിന്നും 16HS-ല്‍ നിന്നും ഓഡിയോ ആണ്.

ഫ്രീ അക്കൗണ്ടുകള്‍: ഒരു ക്ലിപ് ചെയ്യാന്‍ 30 സെക്കന്റ് വരെ. ഉപയോക്താക്കള്‍ക്ക് നല്‍കുന്നു: ഒരു അപേക്ഷയ്ക്ക് 5 മിനിറ്റോളം വരെ സമയം നല്‍കുന്നു. അധികകാലം ഓഡിയോ വര്‍ദ്ധിപ്പിക്കുന്നു.

നിര്‍മ്മിച്ച വീഡിയോയുടെ ഒരു സെക്കന്‍ഡില്‍ 1,000 അക്ഷരങ്ങള്‍ ലിപ് സിന്‍സിങ്ക് ഉപയോഗിക്കുന്നു. ഒരു 30- സെക്കന്‍ഡ് ക്ലിക്ക് = 30,000 അക്ഷരങ്ങള്‍. ഈ വില നിങ്ങളുടെ ക്ളൈന്‍ സ്കൌണ്ടില്‍ നിന്നും മുന്‍പോട്ട് മാറ്റി, തലമുറ പരാജയപ്പെട്ടാല്‍ സ്വയം പുതുക്കി.

- അതെ, സാഡ് ടെര്‍കോര്‍ കോഡും തൂക്കങ്ങളും MIT ലൈസന്‍സും അവസാനമാകുന്നു (ഇല്ല, Lama, Gama, Gamma, അല്ലെങ്കില്‍ കമ്പ്യൂട്ടര്‍ ലഭ്യമല്ല). നിങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്ന വീഡിയോകള്‍ വാണിജ്യത്തില്‍ ഉപയോഗിക്കാനുള്ള അവകാശങ്ങള്‍. ഉറവിട ഇമേജുകള്‍ക്കും നിങ്ങള്‍ അപ്‌ലോഡേറ്റ് ചെയ്യുന്നതിനുള്ള അവകാശങ്ങള്‍ക്കും നിങ്ങള്‍ക്കുള്ളതാണ്.

ഞങ്ങളുടെ A100 സര്‍വറില്‍ ഒരു 5 സെക്കന്റിനു് 30 സെക്കന്റുകള്‍, ഓഡിയോ നീളത്തില്‍ സ്കേല്‍പ്പിക്കുന്നു. GFPGAN മുഖത്തെ കൂടുതല്‍ ഇരട്ടി വരകള്‍ വര്‍ദ്ധിപ്പിക്കുന്നു, പക്ഷേ കൂടുതല്‍, കൂടുതല്‍, കൂടുതല്‍, കൂടുതല്‍ ഗുണകരമല്ലാത്ത ഔട്ട്പുട്ട് ഉത്പന്നങ്ങള്‍ ഉല്‍പാദിപ്പിക്കുന്നു.

ഏറ്റവും മുന്‍പുള്ള (സഹജമായ) തല (സഹജമായ) അഭിനയിക്കുന്ന തലകള്‍, ചുണ്ടുകള്‍, ഭാവം, ഭാവം എന്നിവ കൂടുതല്‍ സ്വാഭാവികമായ ഒരു വീഡിയോ ഉല്‍പാദിപ്പിക്കുന്നു.

GFPGAN ഒരു മുഖപരിഷ്കരണ മാതൃകയാണ്, ലിപ്-സണൈറ്റിങ്ങ് റെഡിങ്ങിനു ശേഷം മുഖത്തെ വിശദാംശങ്ങള്‍ വര്‍ദ്ധിപ്പിക്കുന്നു. ഇത് കലകള്‍ വൃത്തിയാക്കുന്നു, 256 പിക്സില്‍ ഉല്‍പ്പന്നങ്ങള്‍ 512-നു് കൂടുതല്‍ അടുത്തിരിക്കുന്നു. ഇത് വളരെ അധികം സമയം റെഡി ആക്കുന്നു, പക്ഷെ ഹീറോ ഷൂട്ടുകള്‍ക്ക് അത് മൂല്യവത്താണ്.

സാദാ ചാറ്റര്‍ 256 px- ല്‍ സ്വതവേ പരിഭാഷപ്പെടുത്തുന്നു. മൂര്‍ച്ചയുള്ള ഔട്ട്പുട്ട് (സ്ലോവര്‍, ഉയര്‍ന്ന VRAM) ആയി 512- ലേക്കു് മാറ്റുക അല്ലെങ്കില്‍ GFPGAN വര്‍ദ്ധന വര്‍ദ്ധനവിവരങ്ങള്‍ക്കു് GFPGAN വര്‍ദ്ധിപ്പിക്കുന്നു. ഏറ്റവും നല്ല ഫലങ്ങള്‍, ഉയര്‍ന്ന, നല്ല ഫ്ളൈല്‍ഡ് ചിത്രം അപ്ലോഡ് ചെയ്യുക.

അതെ. ഒരു എംബി4 അല്ലെങ്കില്‍ വെബ്എം ഇന്‍പുട്ടായി അപ്‌ലോഡ് ചെയ്യുക. ആദ്യത്തെ ഫ്രെയിം ഡ്രൈവര്‍ തിരിച്ചറിയല്‍ തിരിച്ചറിയല്‍ ഐഡന്റിറ്റി ആയി ഉപയോഗിക്കാം. പൂര്‍ണ്ണ വീഡിയോ വീണ്ടും നിര്‍വ്വീര്യമാക്കാന്‍ (ഓപ്പര്‍ ഫ്രെയിമിങ്ങ്), വരുന്ന ഡ്ബിങ് സ്റ്റുഡിയോ പൈപ്പ്.

അതെ. /ap/v1/ lib/ lib ഫീള്‍ഡുകള്‍, മുഖവും ഓഡിയോ ഫീള്‍ഡുകളുമായി ഒന്നിലധികം അഭ്യർഥനകള്‍, പിന്നെ /api/vip/1 lib/ libsocus/ riputt/? uuid= " പൂര്‍ത്തിയാകുന്നതുവരെ" എന്ന യുആര്‍എല്‍ MP4- ല്‍ ഒരു യുആര്‍എല്‍ ലഭ്യമാണു്. API സമീപനത്തിന് ഒരു പ്രൊജക്റ്റ് പദ്ധതി ആവശ്യമുണ്ട്.

ഏറ്റവും പ്രമുഖമായ മുഖം കണ്ടുപിടിക്കാനും വിതയ്ക്കാനും സാഡ് റിമോര്‍ട്ടര്‍ ഉപയോഗിക്കുന്നു. നല്ല ഫലങ്ങള്‍ക്കായി, ഒരു വ്യക്തിയുമായി ഒരു ചിത്രം അപ്‌ലോഡ് ചെയ്യുക. ഗ്രൂപ്പ് ഫോട്ടോകള്‍ തെറ്റായ ഫലങ്ങള്‍ ഉളവാക്കിയേക്കാം.
5.0/5 (1)

നിങ്ങളുടെ പ്രതികരണം പ്രശ്‌നങ്ങൾ പരിഹരിക്കാൻ നമ്മെ സഹായിക്കുന്നു.

തുടങ്ങാന്‍ തയ്യാറാണോ?

ഫ്രീ ആയി 50 ക്രെഡിറ്റ്‌ എടുക്ക്.