ການ​ເວົ້າ​ເປັນ​ການ​ເວົ້າ

ປ່ຽນສຽງທີ່ເວົ້າ — ປ່ຽນສຽງ, ຄວາມຄິດ, ພາສາ ແລະ ແບບ while preserving the original content.

ພວກເຮົາຍັງບໍ່ມີສຽງ TTS ໃນພາສາຂອງທ່ານເທື່ອ. ຊ່ວຍພວກເຮົາເພີ່ມສຽງຂອງທ່ານ! ຂາຍ​ສຽງ​ຂອງທ່ານ

ແຫຼ່ງ​ສຽງ

ດຶງ ແລະ ປ່ອຍ​ໄຟ​ລ໌​ຢູ່​ທີ່ນີ້, ຫຼື ຄົ້ນຫາ

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— ຫຼືບັນທຶກສຽງຂອງທ່ານ —
00:00

ການ​កំណត់​ການ​ປ່ຽນ​ຮູບ

ດຶງ ແລະ ປ່ອຍ​ໄຟ​ລ໌​ຢູ່​ທີ່ນີ້, ຫຼື ຄົ້ນຫາ

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

ຜົນ

ສົ່ງ​ສຽງ​ເວົ້າ​ຂຶ້ນ​ໄປ, ເລືອກ​ການ​ປ່ຽນ​ຮູບ​ຂອງທ່ານ ແລະ ຄລິກ​ໃສ່ ປ່ຽນ​ຮູບ​ເພື່ອ​ເລີ່ມ​ຕົ້ນ

ປ່ຽນ​ການ​ເວົ້າ... ອາດຈະ​ໃຊ້ເວລາ​ດົນ​ບາງ​ຄັ້ງ.

ຕົ້ນສະບັບ

ປ່ຽນ​ຮູບ

ວິທີການ​ເຮັດວຽກ

1. ສົ່ງ​ຂໍ້ຄວາມ​ໄປ​ຍັງ​ເຄື່ອງ​ອ່ານ​ຂໍ້ຄວາມ

ບັນທຶກ ຫຼື ສົ່ງ​ສຽງ​ທີ່​ທ່ານ​ຕ້ອງການ​ປ່ຽນແປງ

ປ່ຽນ​ຮູບ

ເລືອກ​ການ​ປ່ຽນ​ສຽງ, ການ​ໂອນ​ແບບ, ຫຼື ການ​ປ່ຽນ​ພາສາ

3. AI ປ່ຽນແປງ

AI ປຸງແຕ່ງ​ສຽງ​ຈາກ​ຕົ້ນ​ເຖິງ​ທ້າຍ ໂດຍ​ຮັກສາ​ເນື້ອໃນ​ການ​ເວົ້າ

ດາວໂຫລດ

ຟັງ​ຜົນ ແລະ ດາວໂຫລດ​ສຽງ​ທີ່​ປ່ຽນ​ແປງ​ຂອງ​ທ່ານ

ກໍລະນີ​ໃຊ້

ເວົ້າ​ໄປ​ເວົ້າ​ເພື່ອ​ເນື້ອໃນ, ເຂົ້າເຖິງ​ໄດ້, ແລະ​ໂຄງການ​ສ້າງສັນ

ສຽງ​ສຽງ​ວິດີໂອ

ແປວີດີໂອເປັນພາສາອື່ນ ໃນຂະນະທີ່ຮັກສາຄຸນລັກສະນະສຽງຂອງຜູ້ເວົ້າຕົ້ນສະບັບໄວ້.

ການ​ປັບ​ແຕ່ງ​ອາລົມ

ປ່ຽນ​ສຽງ​ທີ່​ມີ​ອາລົມ​ຂອງ​ການ​ບັນທຶກ - ເຮັດໃຫ້​ການ​ເວົ້າ​ທີ່​ສະຫງົບ​ສຸກ​ໃຈ ຫຼື ເວົ້າ​ແບບ​ສະ​ເໝີ​ພາບ​ກັນ​ໃຫ້​ອົບອຸ່ນ ແລະ ​ເປັນ​ມິດ.

ຜົນ​ງານ​ສຽງ​

ປ່ຽນ​ການບັນທຶກສຽງ​ທີ່​ບໍ່​ດີ​ເປັນ​ການ​ເວົ້າ​ທີ່​ມີ​ສຽງ ແລະ ແບບ​ທີ່​ແຕກຕ່າງ​ກັນ

ປ່ຽນ​ຊື່​ສຽງ

ປົກປິດຕົວຕົນຂອງຜູ້ເວົ້າ ໃນຂະນະທີ່ຮັກສາຄໍາເວົ້າທຸກຄໍາ, ເພື່ອການແຈ້ງຂ່າວ ຫຼື ການປົກປ້ອງຄວາມເປັນສ່ວນຕົວ.

ຕົວແບບ​ການ​ເວົ້າ​ເປັນ​ການ​ເວົ້າName

OpenVoice

ປ່ຽນສຽງ​ຢ່າງ​ໄວ​ວາ​ດ້ວຍ​ການ​ຄວບຄຸມ​ແບບ​ທີ່​ມີ​ສ່ວນ​ປະສົມ​. ປ່ຽນ​ຕົວ​ຕົນ​ສຽງ, ​ຄວາມ​ໄວ ແລະ ​ອາລົມ​ໃນ​ວິນາທີ.

  • ການ​ປະມວນຜົນ​ໄວ
  • ການ​ໂອນ​ແບບ
  • ພາສາ​ຕ່າງກັນ

Chatterbox

ການ​ກັ່ນຕອງ​ສຽງ​ແບບ Zero-shot ດ້ວຍ​ການ​ຄວບຄຸມ​ອາລົມ​ທີ່​ລະອຽດ​ອ່ອນ​ຈາກ Resemble AI.

  • ຄວບຄຸມ​ອາລົມ
  • ການ​ກັ່ນຕອງ​ແບບ Zero-shot
  • ຄວາມ​ເຊື່ອ​ຖື​ສູງ

CosyVoice 2

ການ​ກັ່ນຕອງ​ສຽງ​ຜ່ານ​ພາສາ 8 ພາສາ​ພ້ອມ​ດ້ວຍ​ການ​ສະໜັບສະໜູນ​ການ​ຟັງ​ສຽງ​ແບບ​ທໍາມະຊາດ ແລະ ການ​ຖ່າຍ​ທອດ​ສຽງ.

  • ພາສາ
  • ການ​ກັ່ນຕອງ​ສຽງ
  • ການ​ຖ່າຍ​ທອດ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ສຽງເວົ້າ (STS) AI ປ່ຽນສຽງເວົ້າທີ່ບັນທຶກໄວ້ເປັນສຽງອອກມາທີ່ແຕກຕ່າງກັນ - ປ່ຽນສຽງ, ແບບ, ອາລົມ, ຫຼືພາສາໃນຂະນະທີ່ຮັກສາຄໍາຕົ້ນສະບັບແລະເວລາ. ມັນລວມເອົາການຮັບຮູ້ສຽງ, ການປຸງແຕ່ງ, ແລະການສັງເຄາະເຂົ້າໃນທໍ່ດຽວ.

ຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ ປ່ຽນ​ຂໍ້ຄວາມ​ທີ່​ຂຽນ​ມາ​ເປັນ​ສຽງ. ຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ ເອົາ​ສຽງ​ທີ່​ມີ​ຢູ່​ແລ້ວ​ເປັນ​ຂໍ້ມູນ​ເຂົ້າ ແລະ ປ່ຽນ​ມັນ​ເປັນ​ສຽງ​ໃໝ່​ໂດຍ​ກົງ - ຮັກສາ​ຈັງຫວະ​ທໍາມະຊາດ, ການຢຸດ, ການ​ເນັ້ນ ແລະ ​ອາລົມ​ຂອງ​ການ​ບັນທຶກ​ຕົ້ນສະບັບ ແທນ​ທີ່​ຈະ​ສ້າງ​ການ​ເວົ້າ​ຈາກ​ຂໍ້ຄວາມ​ທີ່​ສະອາດ.

ການນໍາໃຊ້ທົ່ວໄປປະກອບມີການດັດແກ້ວິດີໂອເປັນພາສາອື່ນ, ປ່ຽນສຽງຂອງຜູ້ເວົ້າໃນການບັນທຶກ, ປັບຄວາມຮູ້ສຶກຫຼືສຽງຂອງສຽງທີ່ມີຢູ່, ສ້າງ voiceovers ຈາກການບັນທຶກທີ່ຂີ້ຮ້າຍ, ແລະເຮັດໃຫ້ການບັນທຶກສຽງບໍ່ຮູ້ຊື່ໃນຂະນະທີ່ຮັກສາເນື້ອຫາ.

ແບບຟອມການປ່ຽນສຽງເຊັ່ນ OpenVoice ແລະ RVC ຈັດການການປ່ຽນສຽງ-ເປັນ-ສຽງ. ສຳລັບການເວົ້າຜ່ານພາສາ, CosyVoice2ແລະ GPT-SoVITS ສາມາດຖ່າຍທອດ ແລະ ສັງເຄາະຄືນໃໝ່ໃນພາສາອື່ນ. Chatterbox ຍັງສະໜັບສະໜູນການສັງເຄາະທີ່ອີງໃສ່ການອ້າງອີງສຽງ.

ຍອມຮັບ. ໂດຍການໃຊ້ແບບຟອມການຖ່າຍທອດສຽງ, ທ່ານສາມາດປ່ຽນການເວົ້າຂອງທ່ານເປັນພາສາອື່ນໄດ້ ໃນຂະນະທີ່ຮັກສາຄຸນລັກສະນະສຽງຂອງທ່ານເອງ. AI ຖອດຕົວຕົນສຽງຂອງທ່ານ ແລະ ສັງເຄາະສຽງຄືນໃໝ່ໃນພາສາຫຼືແບບເປົ້າ ໝາຍ.

ສາຍ​ສົ່ງ​ຈະ​ຖ່າຍ​ທອດ​ການ​ເວົ້າ​ຂອງທ່ານ​ກ່ອນ, ແປ​ຂໍ້ຄວາມ​ໄປ​ເປັນ​ພາສາ​ເປົ້າ​ໝາຍ, ຫຼັງຈາກນັ້ນ​ໃຊ້​ການ​ຖ່າຍທອດ​ສຽງ​ເພື່ອ​ປະສົມ​ຂໍ້ຄວາມ​ທີ່​ໄດ້​ແປ​ໄປ​ເປັນ​ສຽງ​ຕົ້ນ​ຕໍ​ຂອງທ່ານ. ແບບ​ແບບ​ເຊັ່ນ CosyVoice2ສະໜັບສະໜູນ 8 ພາສາ​ເພື່ອ​ປະສົມ​ພາສາ​ກັນ.

ສໍາລັບ​ຜົນ​ທີ່​ດີ​ທີ່​ສຸດ, ສົ່ງ​ສຽງ​ທີ່​ສະອາດ​ດ້ວຍ​ສຽງ​ລົບ​ທີ່​ໜ້ອຍ​ທີ່ສຸດ. WAV ຫຼື FLAC ທີ່ 16kHz ຫຼື​ສູງ​ກວ່າ​ເຮັດວຽກ​ໄດ້​ດີ​ທີ່​ສຸດ. MP3, OGG, M4A, ແລະ WEBM ກໍ​ຖືກ​ຮັບ​ຮອງ​ເອົາ​ເຊັ່ນ​ກັນ. ການ​ເວົ້າ​ທີ່​ຈະ​ແຈ້ງ​ຈະ​ຜະລິດ​ການ​ປ່ຽນ​ແປງ​ທີ່​ຈະ​ແຈ້ງ​ທີ່ສຸດ.

ໃກ້-ເວລາຈິງການປຸງແຕ່ງແມ່ນມີຜ່ານ API ຂອງພວກເຮົາໂດຍໃຊ້ແບບຢ່າງໄວເຊັ່ນ Kokoro ສຳ ລັບ synthesization ແລະ Faster Whisper ສຳ ລັບການຮັບຮູ້. Latency ຂຶ້ນກັບແບບຢ່າງແລະຄວາມຍາວສຽງ, ແຕ່ sub-3-second turnarounds ແມ່ນສາມາດບັນລຸໄດ້ສໍາລັບຄໍາເວົ້າສັ້ນ.

ແມ່ນແລ້ວ. ຕົວແບບເຊັ່ນ Chatterbox, Spark TTS, ແລະ IndexTTS-2 ສະໜັບສະໜູນການຄວບຄຸມອາລົມ ແລະ ແບບ. ທ່ານສາມາດປ່ຽນການເວົ້າທີ່ສະຫງົບລົງເປັນຄວາມຕື່ນເຕັ້ນ, ມີຄວາມໂສກເສົ້າເປັນຄວາມສຸກ, ຫຼື ບໍ່ມີຄວາມໝາຍເປັນເລື່ອງທີ່ ໜ້າ ຕື່ນຕາຕື່ນໃຈໃນຂະນະທີ່ຮັກສາຄໍາສັບດຽວກັນແລະຕົວຕົນຂອງຜູ້ເວົ້າ.

ການ​ເວົ້າ​ໄປ​ສູ່​ການ​ເວົ້າ​ລວມ​ເອົາ​ການ​ຮັບ​ຮູ້​ແລະ​ການ​ສັງເຄາະ​ຄະແນນ. ການ​ປ່ຽນ​ແປງ​ແບບ​ປົກກະຕິ​ 1 ນາທີ​ໃຊ້​ 3- 8 ຄະແນນ​ອີງ​ຕາມ​ແບບ​ທີ່​ໄດ້​ເລືອກ. ແບບ​ຟຣີ- ຊັ້ນ​ເຊັ່ນ Kokoro ສາມາດ​ໃຊ້​ໄດ້​ສຳລັບ​ຂັ້ນຕອນ​ການ​ສັງເຄາະ​ທີ່​ບໍ່ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ.

ຜູ້ໃຊ້ຟຣີສາມາດປະມວນຜົນສຽງເຖິງ 1 ນາທີ. ແຜນທີ່ຈ່າຍສະຫນັບສະຫນູນໄຟລ໌ເຖິງ 10 ນາທີ. ສໍາລັບການບັນທຶກຍາວກວ່າ, ແບ່ງສຽງເປັນສ່ວນຫຼືໃຊ້ API ຂອງພວກເຮົາສໍາລັບການປະມວນຜົນ batch ໂດຍບໍ່ມີການຈໍາກັດຄວາມຍາວ.

ໂອ້, ສຽງທີ່ອັບໂຫລດທັງໝົດຈະຖືກປະມວນຜົນຢູ່ເທິງເຊີເວີ GPU ທີ່ມີຄວາມປອດໄພຂອງພວກເຮົາ ແລະ ຈະຖືກລຶບອອກໂດຍອັດຕະໂນມັດພາຍໃນ 24 ຊົ່ວໂມງ. ພວກເຮົາບໍ່ເຄີຍໃຊ້ສຽງຂອງທ່ານເພື່ອຝຶກແບບ. ການໂອນຂໍ້ມູນທັງ ໝົດ ໃຊ້ການເຊື່ອມຕໍ່ທີ່ເຂົ້າລະຫັດ ແລະ ການສື່ສານລະຫວ່າງເຊີເວີກັບເຊີເວີແມ່ນຖືກຢັ້ງຢືນ.
5.0/5 (1)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ປ່ຽນ​ການ​ເວົ້າ​ໃດໆ​ດ້ວຍ AI

ປ່ຽນສຽງ, ຄວາມຮູ້ສຶກ, ພາສາ, ແລະ ແບບ. ລົງທະບຽນຟຣີແລະໄດ້ຮັບ 50 ເຄດິດເພື່ອເລີ່ມຕົ້ນ.