កម្មវិធីສ້າງວີດີໂອ AI Lip Sync
ສົ່ງຮູບໜ້າ ແລະ ວິດີໂອສຽງ — ໄດ້ຮັບວິດີໂອຫົວເວົ້າທີ່ສະແດງໃຫ້ເຫັນຄວາມຄືບໜ້າຂອງປາກ, ທ່າທາງຂອງຫົວ ແລະ ການປິດຕາ. ພັດທະນາໂດຍ SadTalker (MIT). ການນໍາໃຊ້ທາງທຸລະກິດ OK.
ສົ່ງອອກສຽງ
1,000 តួអក្សរຕໍ່ວິນາທີດຶງ ແລະ ປ່ອຍໄຟລ໌ຢູ່ທີ່ນີ້, ຫຼື ຄົ້ນຫາ
JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.ໄຟລ໌.mp3
0 MBດຶງ ແລະ ປ່ອຍໄຟລ໌ຢູ່ທີ່ນີ້, ຫຼື ຄົ້ນຫາ
MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.ໄຟລ໌.mp3
0 MBສະແດງວີດີໂອຂອງທ່ານ. ປົກກະຕິແລ້ວ ໃຊ້ເວລາ 30 ວິນາທີ ຫາ2ນາທີ.
ວິດີໂອ Talking-Head ຂອງທ່ານ
ກ່ຽວກັບ SadTalker
SadTalker (CVPR 2023, Tencent ARC) ແມ່ນແບບຟອມຫົວເວົ້າ Open-source ທີ່ເຮັດໃຫ້ຮູບ ໜ້າ ດຽວມີຊີວິດຊີວາເພື່ອເວົ້າສຽງໃດໆ. ບໍ່ຄືກັບ Wav2Lip ຕົວແປ, SadTalker ຍັງເຮັດໃຫ້ຫົວ pose, ເບິ່ງແລະສະແດງອອກເພື່ອຜົນໄດ້ຮັບທີ່ສະອາດກວ່າ.
ລະຫັດ ແລະ ນໍ້າໜັກ ແມ່ນ MIT-ອະນຸຍາດຈາກຕົ້ນຫາທ້າຍ - ບໍ່ Llama, Gemma, ຫຼື ບໍ່ແມ່ນ backbone ການຄ້າ - ດັ່ງນັ້ນວິດີໂອທີ່ທ່ານສ້າງແມ່ນປອດໄພສໍາລັບການໃຊ້ທຸລະກິດ.
ຂໍ້ແນະນຳສຳລັບຜົນທີ່ດີທີ່ສຸດ
- ໃຊ້ຮູບປັ້ນທີ່ມີຄຸນນະພາບສູງ, ຖືກແສງສະຫວ່າງດີ - ຕາເບິ່ງເຫັນໄດ້, ປາກປິດ
- ຕັ້ງໃຈກາງໜ້າ, ຮູບສີ່ຫຼ່ຽມ ຫຼື ອັດຕາສ່ວນ 4:5 ເຮັດວຽກໄດ້ດີທີ່ສຸດ
- ສຽງເວົ້າທີ່ສະອາດ (ບໍ່ມີດົນຕີ) ສົ່ງຜົນໃຫ້ມີສຽງທີ່ເຂົ້າກັນໄດ້ດີກວ່າ
- ເປີດໃຊ້ GFPGAN ສຳລັບການຖ່າຍຮູບຂອງນັກຮົບ - ເພີ່ມເວລາສະແດງເປັນສອງເທົ່າ ແຕ່ເພີ່ມຄວາມລະອຽດ
- Use the Still preset when you want a steady avatar shot
ແຜນການວິດີໂອ Lip Sync
ເລີ່ມຕົ້ນຟຣີ, ປັບປຸງເມື່ອທ່ານຕ້ອງການຫຼາຍຂຶ້ນ
- ຈໍາກັດສຽງ 30 ວິນາທີ
- ຜົນອອກ 256 ພິກເຊວ
- ຕັ້ງຄ່າລ່ວງໜ້າ "ຍັງ" ເທົ່ານັ້ນ
- ບໍ່ມີຕົວເພີ່ມໜ້າ
- ຈໍາກັດສຽງ 30 ວິນາທີ
- ທັງສອງການຕັ້ງຄ່າລ່ວງໜ້າ "ເຕັມ" ແລະ "ບໍ່ປ່ຽນແປງ"
- ຜົນອອກ 256 / 512 ພິກະເຊນ
- ຕົວເພີ່ມຄວາມສວຍງາມໜ້າ GFPGAN
- ຈໍາກັດສຽງ5ນາທີ
- ជួរ GPU ដែលមានអាទិភាព
- ເຂົ້າເຖິງ API (ອັບໂຫລດຫຼາຍສ່ວນ)
- ການໂທຄືນການເຮັດໃຫ້ Webhook ສົມບູນ
- ການໃຊ້ໃນການຄ້າ (ໃບອະນຸຍາດ MIT)
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.