ແຕ້ມ​ສຽງ AI

ປ່ຽນສ່ວນຂອງສຽງດ້ວຍສຽງທີ່ synthesized ໂດຍ AI ທີ່ກົງກັບສຽງອ້ອມຂ້າງ. ແກ້ໄຂການບັນທຶກທີ່ບໍ່ດີໂດຍບໍ່ຕ້ອງບັນທຶກຄືນທັງ ໝົດ.

ພວກເຮົາຍັງບໍ່ມີສຽງ TTS ໃນພາສາຂອງທ່ານເທື່ອ. ຊ່ວຍພວກເຮົາເພີ່ມສຽງຂອງທ່ານ! ຂາຍ​ສຽງ​ຂອງທ່ານ

ສົ່ງ​ສຽງ​ໄປ​ຍັງ Inpaint

500 ຕົວອັກສອນຕໍ່ວິນາທີຂອງສຽງທີ່ປ່ຽນແທນ

ດຶງ ແລະ ປ່ອຍ​ໄຟ​ລ໌​ຢູ່​ທີ່ນີ້, ຫຼື ຄົ້ນຫາ

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

ໄຟລ໌.mp3

0 MB

ແຫຼ່ງສຽງ — ຖູເພື່ອຊອກຫາການຖ່າຍທີ່ຜິດ

0.00s / 0.00s

​ການ​កំណត់​ Inpaint

0 / 500 ​តួ​អក្សរ
ເວລາທີ່ໃຊ້ໃນການປະສົມຈຸດສປລິກ. 80ms ແມ່ນປ້ອນໄວ້ — ການຕັດທີ່ເໝາະສົມຮູ້ສຶກເປັນທຳມະຊາດ, ບໍ່ມີສຽງດັງສອງຄັ້ງ.
ລົງທະບຽນຟຣີ ເພື່ອໃຊ້ການແຕ້ມສຽງ
ກຳລັງ​ແຕ້ມ​ສຽງ...

ກຳລັງ​ຖ່າຍ​ແບບ​ສຽງ ແລະ ສ້າງ​ສຽງ​ແທນ...

ຕັດ​ເປັນ​ສ່ວນໆ → ສ້າງ​ແບບ​ຟອມ​ສຽງ​ອ້ອມ​ຂ້າງ → ເຊື່ອມ​ກັບ​ການ​ຫຼຸດ​ລົງ​ຊ້າໆ
ໃຊ້ເວລາ​ດົນ​ປານໃດ? ຜົນ​ຈະ​ປາກົດ​ໃນ​ລາຍ​ຊື່​ຜົນ​ການ​ສອບ​ເສັງ​ຂອງທ່ານ ប្រវត្តិ​ການ​ສ້າງ ເວລາ​ພ້ອມ
ສຽງ​ທີ່​ພ້ອມ​ໃຊ້

ກ່ອນ (ຕົ້ນສະບັບ)

ຫຼັງ (ຖືກແຕ້ມ)

ດາວໂຫລດ​ສຽງ Inpainted

ວິທີການ​ແຕ້ມ​ສຽງ

ການ​ແຕ້ມ​ເປັນ​ການ​ຕື່ມ​ເນື້ອໃນ​ທີ່​ມີ​ສຽງ​ເທົ່າ​ກັນ​ກັບ​ການ​ຕື່ມ​ເນື້ອໃນ​ຂອງ Photoshop. ພວກເຮົາ​ຖ່າຍ​ແບບ​ສຽງ​ຈາກ​ສຽງ​ທີ່​ອ້ອມ​ຮອບ​ການ​ເລືອກ​ຂອງ​ທ່ານ, ສັງເຄາະ​ສາຍ​ໃໝ່​ໃນ​ສຽງ​ນັ້ນ, ແລະ ຕິດ​ມັນ​ຄືນ​ມາ​ດ້ວຍ​ການ​ປ່ຽນ​ສີ​ຊ້ອນ​ກັນ​ສັ້ນໆ.

ຜົນໄດ້ຮັບທີ່ດີທີ່ສຸດ: ຄວນຈະໃຫ້ມີເວລາຢ່າງໜ້ອຍ3ວິນາທີ ກ່ອນທີ່ຈະປ່ຽນຈຸດ ເພື່ອວ່າ Cloner ຈະສາມາດນຳໃຊ້ໄດ້ດີ.

ຂໍ້​ແນະ​ນຳ​ສຳລັບ​ຜົນ​ທີ່​ດີ​ທີ່ສຸດ

  • ຮັກສາ​ຂອບເຂດ​ທີ່​ໄດ້​ລະບຸໄວ້ໃຫ້​ຄົບຖ້ວນ​ເທົ່າ​ທີ່​ເປັນ​ໄປໄດ້ - ມີ​ແຕ່​ການ​ຖ່າຍ​ທີ່​ບໍ່​ດີ
  • ຂໍ້ຄວາມ​ທີ່​ຈະ​ປ່ຽນ​ແທນ​ຄວນ​ຈະ​ມີ​ຄວາມ​ຍາວ​ເທົ່າ​ກັນ​ກັບ​ສິ່ງທີ່​ມັນ​ຈະ​ປ່ຽນ​ແທນ
  • ຕັ້ງພາສາ​ໃຫ້​ກົງ​ກັບ​ແຫຼ່ງ​ສຽງ​ເພື່ອ​ໃຫ້​ສຽງ​ເໝາະສົມ​ກັບ​ແຫຼ່ງ​ສຽງ​ທີ່​ດີ​ທີ່ສຸດ
  • 80ms crossfade ແມ່ນປົກກະຕິແລ້ວບໍ່ເຫັນ; ລົ້ມລົງໄປ 150ms ຖ້າທ່ານໄດ້ຍິນການຄລິກ
  • ສຳລັບການ​ແກ້ໄຂ​ທີ່​ຍາວ (>10 ວິນາທີ), ພິຈາລະນາ​ບັນທຶກ​ຄືນ​ອີກ​ເທື່ອ​ໜຶ່ງ​ແທນ

ວິທີການ​ໃຊ້ AI Audio Inpainting

ການ​ບີບ​ອັດ​ແບບ​ຜ່າຕັດ, ສຽງ​ທີ່​ເໝາະສົມ, ໂດຍບໍ່ມີ​ການ​ບັນທຶກ​ຄືນ​ອີກ

ຂັ້ນຕອນ​ທີ 1

ສົ່ງ​ຂຶ້ນ​ສູ່​ລະບົບ

ສົ່ງ​ສຽງ​ຂອງທ່ານ​ຂຶ້ນ​ໄປ ແລະ ໃຊ້​ຕົວ​ລ້າງ​ເພື່ອ​ເຮັດ​ໃຫ້​ມີ​ການ​ສັງເກດ​ເຖິງ​ຈຸດ​ເລີ່ມຕົ້ນ/ ຈຸດ​ຈົບ​ຂອງ​ສ່ວນ​ທີ່​ທ່ານ​ຕ້ອງການ​ປ່ຽນ​ແທນ. ພິມ​ຂໍ້ຄວາມ​ທີ່​ຈະ​ປ່ຽນ​ແທນ.

ຂັ້ນຕອນ​ທີ 2

ສຽງ​ແບບ​ຄລາສສິກ + ສັງເຄາະ

ພວກເຮົາ​ຖອດ​ອອກ​ມາ​ໄດ້​ເຖິງ 12 ວິນາທີ ຂອງ​ສຽງ​ທີ່​ໄດ້​ອ້າງ​ເຖິງ​ທີ່​ສະອາດ​ທີ່​ອ້ອມ​ຮອບ​ການ​ເລືອກ​ຂອງທ່ານ, ຖ່າຍ​ແບບ​ສຽງ​ຂອງ​ຜູ້​ເວົ້າ ແລະ ສັງເຄາະ​ສາຍ​ໃໝ່​ໃນ​ສຽງ​ນັ້ນ.

ຂັ້ນຕອນ​ທີ 3

​ច្របាច់​ກັນ​

ຖ່າຍ​ທອດ​ທີ່​ໄດ້​ປະສົມ​ສຽງ​ຈະ​ຖືກ​ຕິດ​ຕໍ່​ເຂົ້າ​ກັບ​ການ​ບັນທຶກ​ຕົ້ນ​ສະບັບ​ດ້ວຍ​ການ​ຫຼຸດ​ລົງ​ທີ່​ມີ​ແຮງ​ເທົ່າ​ກັນ​ຢູ່​ທີ່​ຈຸດ​ການ​ປັບ​ແຕ່ງ​ທັງ​ສອງ​ແຫ່ງ. ເຂດ​ແມ່ນ​ບໍ່​ສາມາດ​ຟັງ​ໄດ້.

ແຜນ​ການ​ແຕ້ມ​ສຽງ

ເລີ່ມຕົ້ນຟຣີ, ປັບປຸງເມື່ອທ່ານຕ້ອງການຫຼາຍຂຶ້ນ

ບໍ່ມີ
  • ເຖິງ 10 ນາທີ
  • ຂໍ້ຄວາມ​ທີ່​ຈະ​ປ່ຽນ​ແທນ​ດ້ວຍ​ຕົວ​ອັກສອນ 500
  • 4 ວິນາທີ ແຕ້ມ​ຕາມ​ຄໍາຮ້ອງຂໍ
  • 80ms crossfade splice
  • ຕົວ​ຫຼັງ​ຂອງ OpenVoice + CosyVoice2Name
ນິຍົມທີ່ສຸດ
ບັນຊີ​ຟຣີ
  • ເຖິງ 10 ນາທີ
  • ຂໍ້ຄວາມ​ທີ່​ຈະ​ປ່ຽນ​ແທນ​ 5,000 ຕົວອັກສອນ
  • ປ່ຽນ​ສີ​ໃຫ້​ສິ້ນ​ສຸດ​ໄດ້ (0- 250ms)
  • ແບບຟອມ​ສຽງ​ທີ່​ບໍ່​ໄດ້​ຮັບ​ການ​ບັງຄັບ
  • ສ້າງ​ປະຫວັດ + កែ​សម្រួល​ຄືນ
ລົງທະບຽນຟຣີ
ມືອາຊີບ
  • ເຖິງ 30 ນາທີ
  • ຂໍ້ຄວາມ​ທີ່​ຈະ​ປ່ຽນ​ແທນ​ 100,000 ຕົວອັກສອນ
  • ​ជួរ​ GPU ​ដែល​មាន​អាទិភាព
  • ການເຂົ້າໃຊ້ API (/v1/audio-inpaint/)
  • ການ​ແຕ້ມ​ຫຼາຍ​ຄັ້ງ (ຫຼາຍ​ຂອບເຂດ)
ຍົກລະດັບ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ການ​ແຕ້ມ​ສຽງ (ເອີ້ນ​ວ່າ​ການ​ຕື່ມ​ສຽງ ຫຼື ການ​ໂອ​ເວີ​ດ​ສຽງ) ອະນຸຍາດ​ໃຫ້​ທ່ານ​ປ່ຽນ​ສ່ວນ​ຂອງ​ການ​ບັນທຶກ​ສຽງ​ທີ່​ມີ​ຢູ່​ແລ້ວ​ດ້ວຍ​ການ​ເວົ້າ​ທີ່​ໄດ້​ຮັບ​ການ​ສັງເຄາະ​ຈາກ AI ທີ່​ກົງ​ກັບ​ສຽງ​ຕົ້ນ​ຕໍ. ມັນ​ແມ່ນ​ສຽງ​ທີ່​ເທົ່າ​ກັບ​ການ​ຕື່ມ​ເນື້ອ​ໃນ​ທີ່​ຮູ້​ຈັກ​ຂອງ Photoshop - ແຕ້ມ​ໃສ່​ສ່ວນ​ທີ່​ທ່ານ​ບໍ່​ຕ້ອງການ, ພິມ​ສິ່ງທີ່​ຄວນ​ຈະ​ຢູ່​ທີ່​ນັ້ນ ແລະ AI ຈະ​ສ້າງ​ການ​ປ່ຽນ​ແທນ​ທີ່​ບໍ່​ມີ​ເສັ້ນ​ຜ່າ​ກາງ.

ແທກ​ໄລຍະ​ເວລາ​ທີ່​ຈະ​ປ່ຽນ​ແທນ, ພິມ​ຂໍ້ຄວາມ​ໃໝ່​ໃນ​ການ​ສົນທະນາ, ແລະ​ຄລິກ​ໃສ່ ແຕ້ມ​ເຂົ້າ​ໄປ. AI ຂອງພວກເຮົາ​ຈະ​ກລອນ​ສຽງ​ຈາກ​ສຽງ​ທີ່​ອ້ອມ​ຮອບ​ການ​ເລືອກ​ຂອງທ່ານ, ສັງເຄາະ​ຂໍ້ຄວາມ​ໃໝ່​ໃນ​ສຽງ​ນັ້ນ, ແລະ​ປິດ​ມັນ​ຄືນ​ໄປ​ໃນ​ການ​ບັນທຶກ​ຂອງທ່ານ​ດ້ວຍ​ການ​ປ່ຽນ​ໄປ​ມາ​ແບບ​ສັ້ນໆ ເພື່ອ​ວ່າ​ການ​ແກ້ໄຂ​ຈະ​ບໍ່​ໄດ້​ຍິນ​ສຽງ​ອີກຕໍ່ໄປ.

ໃຊ້ມັນເມື່ອທ່ານມີຄໍາເວົ້າທີ່ຜິດ, ອອກສຽງຜິດ, ຊື່ທີ່ຜິດ, ຄໍາເວົ້າທີ່ຜິດ, ຫຼື ຂໍ້ຜິດພາດໃນຂໍ້ເທັດຈິງໃນກໍລະນີອື່ນ. ການບັນທຶກຄືນທັງ ໝົດ ບາງຄັ້ງກໍ່ນໍາສະເໜີສຽງທີ່ບໍ່ກົງກັນກັບສ່ວນທີ່ເຫຼືອຂອງໂຄງການ - ການແຕ້ມແກ້ໄຂພຽງແຕ່ສິ່ງທີ່ຕ້ອງການແກ້ໄຂໃນຂະນະທີ່ຮັກສາສຽງອື່ນໆທັງ ໝົດ ບໍ່ເສຍຫາຍ.

ຜູ້ໃຊ້ຟຣີສາມາດແຕ້ມໄຟລ໌ໄດ້ເຖິງ 10 ນາທີ. ຜູ້ຈອງສາມາດແຕ້ມໄຟລ໌ໄດ້ເຖິງ 30 ນາທີ. ຂໍ້ຄວາມທີ່ປ່ຽນແທນເອງແມ່ນມີຂອບເຂດ 500 ຕົວອັກສອນ ສຳ ລັບຜູ້ໃຊ້ຟຣີ, 5,000 ສຳ ລັບບັນຊີຟຣີແລະ 100,000 ສຳ ລັບແຜນທີ່ຈ່າຍ.

ໃກ້ຊິດຫຼາຍ. AI ໃຊ້ເຖິງ 12 ວິນາທີຂອງສຽງທີ່ອ້ອມຮອບການແກ້ໄຂເປັນຄໍາແນະນໍາສຽງ, ເຊິ່ງພຽງພໍ ສຳ ລັບແບບແບບໃດກໍ່ຕາມທີ່ສາມາດຖ່າຍທອດໄດ້ (OpenVoice, CosyVoice 2) ເພື່ອບັນທຶກສຽງຂອງຜູ້ເວົ້າ, ລະດັບສຽງ, ແລະ ແບບການເວົ້າ. ສຳ ລັບຜົນໄດ້ຮັບທີ່ດີທີ່ສຸດ, ໃຫ້ມີຢ່າງໜ້ອຍ3ວິນາທີຂອງສຽງທີ່ສະອາດກ່ອນທີ່ຈະແກ້ໄຂຈຸດ.

ເຮົາ​ໄດ້​ນຳ​ໃຊ້​ການ​ປ່ຽນ​ສີ​ແບບ​ຄົບ​ວົງຈອນ​ທີ່​ມີ​ແຮງ​ແຮງ​ເທົ່າ​ກັນ 80ms ຢູ່​ຈຸດ​ສປລິກ​ທັງ​ສອງ (ຫົວ→ປ່ຽນ​ແທນ ແລະ ປ່ຽນ​ແທນ→ປາຍ) ໂດຍ​ປັ​ບ​ໂປ້​. ເຈົ້າ​ສາມາດ​ປັບ​ຄວາມ​ໄວ​ນີ້​ໄດ້​ຈາກ 0ms (ຕັດ​ຢ່າງ​ຫຍຸ້ງຍາກ) ເຖິງ 250ms ໂດຍ​ຜ່ານ​ຕົວ​ເລື່ອນ​ການ​ປ່ຽນ​ສີ​ແບບ​ຄົບ​ວົງຈອນ. ການ​ປ່ຽນ​ສີ​ແບບ​ຄົບ​ວົງຈອນ​ທີ່​ຍາວ​ກວ່າ​ຈະ​ປົກ​ປິດ​ການ​ແກ້ໄຂ​ຢ່າງ​ລະອຽດ​ກວ່າ ແຕ່​ສາມາດ​ປະສົມ​ຄໍາ​ທີ່​ຕິດ​ກັນ​ຢູ່​ເຂດ​ແດນ​ໄດ້​ຢ່າງ​ຈະ​ແຈ້ງ.

ການແຕ້ມສຽງ ປະຕິບັດຕາມການປົກຄຸມພາສາດຽວກັນກັບການຖ່າຍທອດສຽງ. ພວກເຮົາເລືອກ OpenVoice ໂດຍອັດຕະໂນມັດ ສຳ ລັບພາສາສ່ວນຫຼາຍ ແລະ CosyVoice2 ສຳ ລັບພາສາຈີນ, ຍີ່ປຸ່ນ ແລະ ເກົາຫຼີ. ທ່ານສາມາດບິດເບືອນແບບໃນການຕັ້ງຄ່າຂັ້ນສູງໄດ້.

ທ່ານ​ຈະ​ຖືກ​ຄິດຄ່າ​ໃຊ້​ຈ່າຍ 500 ຕົວອັກສອນ ຕໍ່ວິນາທີ ຂອງ​ສຽງ​ທີ່​ໄດ້​ປ່ຽນ​ແທນ. ການ​ແກ້​ໄຂ​4ວິນາທີ ຄ່າ​ໃຊ້​ຈ່າຍ 2,000 ຕົວອັກສອນ. ຄ່າ​ໃຊ້​ຈ່າຍ​ແມ່ນ​ຂຶ້ນ​ກັບ​ວ່າ​ຂໍ້ຄວາມ​ທີ່​ໄດ້​ປ່ຽນ​ແທນ​ຈະ​ຍາວ​ເທົ່າ​ໃດ, ຍ້ອນ​ວ່າ​ການ​ປະສົມ​ຕົວ​ແບບ​ທີ່​ຢູ່​ເບື້ອງ​ຫຼັງ​ແມ່ນ​ຖືກ​ຄວບຄຸມ​ໂດຍ​ເວລາ​ດໍາເນີນ​ງານ​ຂອງ​ຄລິບ​ໃໝ່, ບໍ່ແມ່ນ​ຄວາມ​ຍາວ​ຂອງ​ຂໍ້ຄວາມ.

ຕາມເງື່ອນໄຂການໃຫ້ບໍລິການຂອງພວກເຮົາ, ທ່ານພຽງແຕ່ສາມາດແຕ້ມສຽງທີ່ທ່ານເປັນເຈົ້າຂອງຫຼືມີສິດອຳນາດທີ່ຈະແກ້ໄຂ. ສ້າງຄໍາເວົ້າທີ່ຜິດ, ເນື້ອໃນທີ່ຫຼອກລວງ, ຫຼືການສະແດງຕົວເປັນແມ່ນຖືກຫ້າມ. ພວກເຮົາສ້າງສຽງແລະບັນທຶກວຽກແຕ້ມສຽງທັງ ໝົດ ເພື່ອທົບທວນການໃຊ້ຄວາມຜິດ.

ການຕັດຄລິບຈະ​ເຮັດ​ໃຫ້​ມີ​ຊ່ອງ​ຫວ່າງ​ທີ່​ເຫັນ​ໄດ້​ຊັດ​ໃນ​ການ​ເຄື່ອນ​ໄຫວ​ຂອງ​ສຽງ ແລະ ສຽງ​ຫາຍໃຈ; ການ​ປ່ຽນ​ສີ​ສອງ​ຄັ້ງ​ຈະ​ເຮັດ​ໃຫ້​ສຽງ​ບໍ່​ເຂົ້າ​ກັນ​ໄດ້. ການ​ແຕ້ມ​ຈະ​ເຮັດ​ໃຫ້​ມີ​ຊ່ອງ​ຫວ່າງ​ທີ່​ເຫັນ​ໄດ້​ຊັດ​ກັບ​ສຽງ​ທີ່​ຢູ່​ອ້ອມ​ຂ້າງ, ດັ່ງ​ນັ້ນ ຜູ້​ຟັງ​ຈະ​ໄດ້​ຍິນ​ສຽງ​ສຽງ​ທີ່​ເປັນ​ທຳມະຊາດ​ຢ່າງ​ຕໍ່​ເນື່ອງ.

ຍິນດີ — POST to /v1/audio-inpaint/ with the audio file, start_sec, end_sec, and replacement_text. ຈຸດສຸດທ້າຍຈະສົ່ງຄືນ UUID ຂອງວຽກ; ສອບຖາມ /v1/speech/results/?uuid= ເພື່ອດາວໂຫລດສຽງທີ່ແຕ້ມໄວ້ເມື່ອພ້ອມ. ເບິ່ງເອກະສານ API ສຳລັບລາຍລະອຽດ.

ElevenLabs Speech-to-Speech ສ້າງຄືນໃໝ່ ສາຍສຽງທັງ ໝົດ ຈາກຕົ້ນຕໍໃນສຽງເປົ້າ ໝາຍ. ການພິມສຽງຂອງພວກເຮົາແມ່ນການຜ່າຕັດ: ມັນພຽງແຕ່ແກ້ໄຂຂອບເຂດທີ່ລະບຸໄວ້, ຮັກສາທຸກໆໄບດຂອງການບັນທຶກຕົ້ນສະບັບຂອງທ່ານບໍ່ໃຫ້ຖືກກະທົບ, ແລະ ກົງກັບຄລິບໃໝ່ກັບສຽງອ້ອມຂ້າງແທນທີ່ຈະເປັນຫໍສະໝຸດສຽງທີ່ແຍກຕ່າງຫາກ.
5.0/5 (1)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ແກ້ໄຂ​ສຽງ​ຂອງທ່ານ​ໃນ​ວິນາທີ

ປ່ຽນສ່ວນໃດສ່ວນໜຶ່ງຂອງການບັນທຶກໃດໆດ້ວຍສຽງທີ່ synthesized ໂດຍ AI ທີ່ກົງກັບສຽງຕົ້ນສະບັບ. ລົງທະບຽນຟຣີເພື່ອເລີ່ມຕົ້ນ.