AILp Sync ವಿಡಿಯೊ ಉತ್ಪತ್ತಿQuery

ಒಂದು ಮುಖ ಫೋಟೋ ಹಾಗು ಒಂದು ಆಡಿಯೋ ಕ್ಲಾಪ್ —⁠ ಒಂದು ಸಂಭಾಷಣಾ ಚಲನಾ ವಿಡಿಯೋವನ್ನು, ನೈಜವಾದ ಎಕ್ಸ್‍ಕ್ಯಾಪ್‌ಕೇಸ್, ತಲೆಯ ಪೋಸ್ ಮತ್ತು ಮಿನುಗುವಿಕೆಗಳೊಂದಿಗೆ ಪಡೆದುಕೊಳ್ಳಿ. ಸಾಲ್ ಫಾರ್ಟರ್ (MIT) ನಿಂದ ಅಧಿಕಾರವನ್ನು ಪಡೆದಿರುವ. ಮಾರುತವು OKK.

ನಿನ್ನ ಭಾಷೆಯಲ್ಲಿ ನಮಗೆ ಟಿಟ್ಸ್‌ ಇಲ್ಲ, ನಿನ್ನ ಸ್ವರಗಳನ್ನು ಕೂಡಿಸು; ನಮಗೆ ಸಹಾಯಮಾಡು. ಧ್ವನಿಯನ್ನು ಮಾರಿರಿ

ಮುಖ + ಆಡಿಯೊವನ್ನು ಅಪ್‌ಲೋಡ್ ಮಾಡು

ಸೆಕೆಂಡಿಗೆ 1,000 ಅಕ್ಷರಗಳು

ನಿಮ್ಮ ಕಡತವನ್ನು ಇಲ್ಲಿಗೆ ಎಳೆದುಹಾಕು( T) ವೀಕ್ಷಿಸು

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

ಕಡತ. ಫಾರ್ಮಾಟ್3

0 MB

ನಿಮ್ಮ ಕಡತವನ್ನು ಇಲ್ಲಿಗೆ ಎಳೆದುಹಾಕು( T) ವೀಕ್ಷಿಸು

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

ಕಡತ. ಫಾರ್ಮಾಟ್3

0 MB

ಕಾರ್ಯಗತಗೊಳಿಸಲಾಗುತ್ತಿದೆ...

ನಿಮ್ಮ ವಿಡಿಯೋವನ್ನು ಸಿದ್ಧಗೊಳಿಸಿ. ಇದು ಸಾಮಾನ್ಯವಾಗಿ 30 ಸೆಕೆಂಡಿನಿಂದ ೨ ನಿಮಿಷ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.

ನಿಮ್ಮ ಸಂವಾದ ವೀಕ್ಷಣೆName

MP4 ಅನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡು

ಸಾಪ್ತಾಹಿಕ ಸಂಭಾಷಣೆಗಾರನ ಬಗ್ಗೆ

ಸಾಯ್ ಟೆಂಪೆಟರ್ (CVPR223, ಟೆನ್‌ಪ್ರೆಷನ್ ARC) ಯಾವುದೇ ಆಡಿಯೊವನ್ನು ಮಾತನಾಡಲು ಒಂದು ಮುಖದ ಚಿತ್ರವನ್ನು ಸಜೀವವಾಗಿಸುವಂಥ, ಸಾಪ್ತಾ ಟೆಲಿಗ್ರಾಫ್‌ವಿಕ್ಸಸ್ ನಂತಿರದೆ, ಸಾಪ್ತಾ ಟೆಲಿಗ್ರಾಫರ್ ತಲೆನೋಗಳು, ಮಿನುಗುವಿಕೆಗಳು ಮತ್ತು ನೈಸರ್ಗಿಕ ಫಲಿತಾಂಶಗಳಿಗಾಗಿ ಎಕ್ಸ್‍ಪ್ರೆಶನ್ ಎಕ್ಸ್‍ಪ್ರೆಸ್(CVPR2).

ಕೋಡ್‌ ಹಾಗು ತೂಕಗಳು ಅಂತ್ಯಗೊಳ್ಳುತ್ತವೆ.

ಉತ್ತಮ ಫಲಿತಾಂಶಗಳಿಗೆ ಸುಳಿವು

  • ಒಂದು ನೀಟಾಗಿ, ಸುಗಮವಾಗಿ ಚಿತ್ರವನ್ನು ಬಳಸು ಕಣ್ಣುಗಳು ಗೋಚರಿಸುತ್ತವೆ, ಬಾಯಿಯನ್ನು ಮುಚ್ಚುತ್ತದೆ
  • ಕೇಂದ್ರೀಕೃತ ಮುಖ, ಚೌಕ ಅಥವಾ 4: 5 ಆಕಾರ ದರ ವಿಭಜನೆಯೇ ಅತ್ಯುತ್ತಮವಾಗಿದೆ
  • ವಾಚನಾ ಶ್ರೇಣಿಯನ್ನು ಸ್ವಚ್ಛಗೊಳಿಸು (ಮೌನ ಇಲ್ಲ) Name
  • GFPGan ಅನ್ನು ಹೀಬ್ರೂಟ್ಸ್‌ಗಳಿಗೆ ಶಕ್ತಗೊಳಿಸು —⁠ ಇಬ್ಬಗೆಯ ಸಾಲು ಸಮಯ ಆದರೆ ಚುರುಕಿನ ವಿವರವನ್ನು ಶಕ್ತಗೊಳಿಸು
  • ನೀವು ಸ್ಥಿರವಲ್ಲದ ವಿಶ್ಲೇಷಣೆಗೆ ಗುರಿಯಾದಾಗ, ಸ್ಥಿರವಾಗಿ ನಿಲ್ಲುವ ಪೂರ್ವಸಂಸ್ಥೆಯನ್ನು ಉಪಯೋಗಿಸಿರಿ

ಲಿಪ್ Sync ವಿಡಿಯೋ ತಂತ್ರಾಂಶಗಳುName

ನಿಮಗೆ ಹೆಚ್ಚು ಅಗತ್ಯವಿರುವಾಗ ಮುಕ್ತವಾಗಿ ಆರಂಭಿಸು, ಅಪ್‌ಡೇಟ್ ಮಾಡು

ಉಚಿತ
  • 30-ಎರಡು ಶ್ರವ್ಯಾಂಶ (ಆಡಿಯೋ) ಮಿತಿ
  • 256 px ಪ್ರದಾನ (ಔಟ್ ಪುಟ್)
  • "leill" ಮುಂಬದಿ ಮಾತ್ರ
  • ಯಾವುದೇ ಮುಖದ ವಿಸ್ತರಣಾಕಾರವಿಲ್ಲ
ಹೆಚ್ಚು ಜನಪ್ರಿಯ
ಮುಕ್ತ ಖಾತೆ
  • 30-ಎರಡು ಶ್ರವ್ಯಾಂಶ (ಆಡಿಯೋ) ಮಿತಿ
  • "ಪೂರ್ಣ" ಹಾಗು "ಸಂಪೂರ್ಣ" ಮುದ್ರಿತ ಸೆಟ್‌ಗಳು
  • 256 / 512 px ಉತ್ಪತ್ತಿ
  • GFPGan ಮುಖವು ಹೆಚ್ಚುವಹಿಸುತ್ತದೆ
ಮುಕ್ತವಾಗಿ ಮೇಲೆ ಗುರುತಿಸು
ಪ್ರಾಥಮಿಕName
  • ೫- ನಿಮಿಷಗಳ ಆಡಿಯೊ ಮಿತಿ
  • ಆದ್ಯತೆ GPU ವರ್ಗ
  • API ನಿಲುಕಣೆ (multipartup ನೌನ್‌ಲೋಡ್)
  • ಜಾಲ ಗೂಗಲ್ ಪೂರ್ಣಗೊಳಿಕೆ ಬ್ಯಾಕ್‌ಗಳು
  • ವ್ಯಾಪಾರ ಬಳಕೆ (MIT ಲೈಸನ್ಸ್)
ಊರ್ಜಿತಗೊಳಿಸು

ಅನೇಕವೇಳೆ ಪ್ರಶ್ನೆಗಳು

ಒಂದು ಮುಖದ ಚಿತ್ರ ಹಾಗು ಒಂದು ಆಡಿಯೋ ಕ್ಲಿಪ್ ಮತ್ತು AI ಆ ಮುಖದ ಒಂದು ವಿಡಿಯೋವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ ಆ ವೀಕ್ಷಣೆಯನ್ನು ವಾಸ್ತವಿಕವಾದ ತುಟಿಯ ಚಲನೆಗಳೊಂದಿಗೆ, ತಲೆಯ ಪೋಸ್‌ ಮತ್ತು ಮಿನುಗುವ(CVR23) ಗಳೊಂದಿಗೆ ಮಾತಾಡುತ್ತದೆ. ಸಾಲ್ ಪ್ಲೇಕರ್ (CVR23) ಮೇಲೆ (CVR 2023), ಬಾಯಿ ಆಕಾರಕ್ಕೆ ಸಂಬಂಧಿಸಿದ ಸಂವೇದಿಸುವ ವಾಕ್ಸಣಾ ಮಾದರಿ.

ಪ್ರದಾನ (aptPG) ಅಥವಾ JPG ಅಥವ PNG ಚಿತ್ರ (UP MB 10 MB) ಅಥವ ಒಂದು ಚಿಕ್ಕ MP4 ಡ್ರೈವ್ ಡ್ರೈವ್ ವಿಡಿಯೋ (ನಾವು ಮೊದಲ ಚೌಕವನ್ನು ಬಳಸುತ್ತೇವೆ). ಡ್ರೈವ್ ಆಡುವುದು MP3, WAV, MAV, ಅಥವಾ FLC 10 MB ಗೆ. ನಾವು ChM-ಗೆ ಒಂದು RAMSE ಆಡಿಯೊವನ್ನು ಆಂತರಿಕವಾಗಿ ಪುನರಾವರ್ತಿಸುತ್ತೇವೆ. ನಾವು CTHS ನಲ್ಲಿ DAC ಅನ್ನು ಮರುಸ್ಥಾಪಿಸುತ್ತೇವೆ.

ಮುಕ್ತ ಖಾತೆಗಳು: ಒಂದು Clip ಗೆ 30 ಸೆಕೆಂಡುಗಳವರೆಗೆ. ಬಕೆಟ್‌ಗಳನ್ನು ಬಳಸುವುದು: ಪ್ರತಿ ಮನವಿಗೆ ಸುಮಾರು 5 ನಿಮಿಷಗಳವರೆಗೆ ಕೇಳಲಾಗುತ್ತದೆ. ಹೆಚ್ಚು ಸಮಯ ಆಡುವುದು ಮತ್ತು ಹೆಚ್ಚಿನ ಅಕ್ಷರದ ಬೆಲೆ.

Lip ಸಹನ್ ವಿಡಿಯೋ ಒಂದು ಪುನರುಜ್ಜೀವನ ವಿಡಿಯೋದಲ್ಲಿ 1,000 ಅಕ್ಷರಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಒಂದು 30-ಅಧಿವೇಶನ ಕ್ಲಿಪ್ = 30,000 ಅಕ್ಷರಗಳನ್ನು. ವೆಚ್ಚವು ನಿಮ್ಮ ಅಕ್ಷರಸಾಮಲತೆಯಿಂದ ಮುಂಭಾಗವನ್ನು ಜೋಡಿಸುತ್ತದೆ ಹಾಗು ಪೀಳಿಗೆಯು ವಿಫಲಗೊಂಡಾಗ ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪುನರುಜ್ಜೀವನವಾಗುತ್ತದೆ.

ಹೌದು, ಸಾಫ್ಟ್ ಟೆಲಿಗರಿ ಕೋಡ್ ಹಾಗು ತೂಕಗಳು MIT ಗೆ ಅಂತ್ಯಗೊಳಿಸಲ್ಪಟ್ಟಿವೆ (no Lama, Gamma, ಅಥವ ಕಾಮ್ಮೌ ಅಲ್ಲದ). ನೀವು ಉತ್ಪಾದಿಸುವ ವಿಡಿಯೋಗಳು, ಜಾಹೀರಾತುಗಳಲ್ಲಿ ಜಾಹೀರಾತುಗಳನ್ನು ಬಳಸಲು ನಿಮ್ಮದಾಗಿವೆ. ಮೂಲ ಚಿತ್ರ ಹಾಗು ನೀವು ತೆರೆಯನ್ನು ವೀಕ್ಷಿಸುವ ಹಕ್ಕುಗಳನ್ನು ಹೊಂದಲು ಕಾರಣವಾಗಿರುತ್ತವೆ.

ನಮ್ಮ A100 ಪರಿಚಾರಕದಲ್ಲಿ ಒಂದು ೫ ಸೆಕೆಂಡುಗಳ ಕ್ಲಿಪ್, ಆಡಿಯಾ ಉದ್ದದಿಂದ ಸಮಪ್ರಮಾಣವಾಗಿ ಅಳತೆಮಾಡುವಿಕೆ. GFPGAN ಮುಖದ ಹವಳ ಇಬ್ಬಗೆಯ ಇಮ್ಮಡಿಯನ್ನು ಶಕ್ತಗೊಳಿಸುವುದು, ಆದರೆ ಹೆಚ್ಚು ಹದಗೆರಿದ, ಹೆಚ್ಚು ಉತ್ತಮ ಉತ್ಪತ್ತಿಯನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.

ಸಂಪೂರ್ಣ ಅನಿವಾರ್ಯ (ಪೂರ್ವನಿಯೋಜಿತ) ತಲೆ, ಮಿನುಗುವಿಕೆ, ತುಟಿಗಳೊಂದಿಗೆ ವೀಕ್ಷಣೆ ಮತ್ತು ಅಭಿವ್ಯಕ್ತಿಯು ಹೆಚ್ಚು ಸ್ವಾಭಾವಿಕವಾಗಿ ಮಾತಾಡುತ್ತಿರುವ ವಿಡಿಯೋವನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.

GFPGAN ಒಂದು ಮುಖ ಪುನರುಜ್ಜೀವನದ ಮಾದರಿ ಇದು ಲಿಪಿ-ಸಂಸ್ಕಾರದ ನಂತರ ಮುಖದ ವಿವರಗಳನ್ನು ಚುರುಕುಗೊಳಿಸುತ್ತದೆ. ಇದು ಕಲಾವಣೆಗಳನ್ನು ಶುಚಿಗೊಳಿಸುತ್ತದೆ ಮತ್ತು 256- password ಪ್ರೊಗ್ರಾಮ್ 512 ಗೆ ಹೆಚ್ಚು ಗಮನ ಸೆಳೆಯುತ್ತದೆ. ಇದು ತೀರ ಹೆಚ್ಚು ಸಮಯ ಬರುತ್ತದೆ ಆದರೆ ವೀಕ್ಷಣೆ ವೃತ್ತವಾಗಿದೆ.

ಸಾಫ್ಟ್ ಮಾಪನರ್ 256 ಪಕ್ಸ್‌ನಲ್ಲಿ ಪೂರ್ವನಿಯೋಜಿತವಾಗಿ ಅನುವಾದಿಸಲ್ಪಡುತ್ತದೆ. ಸ್ಫುಟ ಔಟ್‌ಪುಟ್‌ಗೆ 512 ಗೆ ಬದಲಾಯಿಸು (ಸಮಾನುತ, ಹೆಚ್ಚಿನ VRAM) ಅಥವ GFGAN ಮುಖದ ವಿವರಗಳನ್ನು ಹೆಚ್ಚಿಸಲು ಅದನ್ನು ಶಕ್ತಗೊಳಿಸಿ. ಉತ್ತಮ ಫಲಿತಾಂಶಗಳಿಗೆ, ಒಂದು ಉತ್ತಮ, ಉತ್ತಮ ಹಾಗೂ ಉತ್ತಮ- ಸರಳ ಚಿತ್ರ ಚಿತ್ರ ಚಿತ್ರವನ್ನು ಅಪ್‌ಡೇಟ್ ಮಾಡು.

ಹೌದು. MP4 ಅಥವಾ ವೆಬ್M ಅನ್ನು ಮುಖದ ಇನ್‌ಪುಟ್ ಆಗಿ ಉತ್ಥಾಪಿಸಿ ನಾವು ಮೊದಲ ಚೌಕಟ್ಟನ್ನು ಡ್ರೈವ್ ಗುರುತಾಗಿ ಬಳಸುತ್ತೇವೆ. ಪೂರ್ಣ ವಿಡಿಯೋ ಮತ್ತೆ ಡಬ್ಬಿಂಗ್ ಬಾಯನ್ನು ಬದಲಾಯಿಸುವಿಕೆ (ಹೆಚ್ಚೆ ಬಾಯ ಬದಲಿ), ಬರಲಿರುವ ಡಬ್ಬಿಂಗ್ ಪ್ಲಗಿಂಗ್ ವಿಡಿಯೋ ಪ್ಲಗಿನ್ ನೋಡಿ.

Yapi/ Vip/ 1 lip/ lib ಗೆ ಬಹುಪಾಲು ಕೋರಿಕೆ (ಪ್ರೋಗ್ರಾಂ), ಮುಖ ಮತ್ತು ಧ್ವನಿ ಕ್ಷೇತ್ರಗಳೊಂದಿಗೆ/ಸಂಪರ್ಕಸ್ಥಾನಗಳಿಗೆ, ನಂತರ /api/v1/libscript/result= "ಪೂರ್ಣಗೊಳ್ಳುವುದು". MP4 ಗೆ ಪ್ರತ್ಯುತ್ತರವು ಒಂದು ತಾಣವನ್ನು ಒಳಗೊಂಡಿದೆ. API ಗೆ ಒಂದು ಪಾರದರ್ಶಕ ಪ್ರೋಗದ ಅಗತ್ಯವಿರುತ್ತದೆ.

ಸಾಪ್ತಾ ಚಾಲಕಿಯು ಅತ್ಯಂತ ಪ್ರಸಿದ್ಧವಾದ ಮುಖವನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಹಾಗು ಬೆಳೆಸಲು ಮುಖ-ಸಂಸ್ಕಾರವನ್ನು ಬಳಸುತ್ತದೆ. ಉತ್ತಮ ಫಲಿತಾಂಶಕ್ಕಾಗಿ, ಒಂದು ವ್ಯಕ್ತಿಯೊಂದಿಗೆ ಚಿತ್ರವನ್ನು ಅಪ್‌ಡೇಟ್‌ ಮಾಡಲಾಗುತ್ತದೆ. ಗುಂಪು ಫೋಟೋಗಳು ಊಹಿಸಲಾಗದ ಫಲಿತಾಂಶಗಳನ್ನು ತರಬಹುದು.
5.0/5 (1)

ನೀವೇನು ಉತ್ತರ ಕೊಡುವಿರಿ?

ಆರಂಭಿಸಲು ಸಿದ್ಧನಾ?

50 ರ ದರಗಳನ್ನು ಪಡೆಯಿರಿ.