VITS

Baker (Chinese)

ບໍ່ມີ ຈີນName Neutral VITS

{ຊື່} ແມ່ນສຽງຂອງ {ເພດ} AI ທີ່ມີແຮງ​ງານ​ໂດຍ​ແບບ​ແບບ​ຂໍ້ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ {ແບບ}. ສຽງ {ລະດັບ} ນີ້​ເວົ້າ {ພາສາ} ແລະ ສົ່ງ​ການ​ປະສົມ​ສຽງ​ທີ່ມີ​ຄຸນ​ນະພາ​ບ {ຄຸນນະພາບ}. ດ້ວຍຄວາມໄວໃນການສ້າງ ໃກ້​ຈະ​ທັນທີ ແລະ ອັດຕາການຕີລາຄາຄຸນນະພາບຂອງ 3/5, Baker (Chinese) ແມ່ນເຫມາະສົມກັບ general-purpose text-to-speech with natural prosody. ເຄື່ອງຈັກ VITS ແມ່ນພັດທະນາໂດຍ Jaehyeon Kim et al. under the MIT license, ເຮັດໃຫ້ມັນປອດໄພສຳລັບການໃຊ້ໃນການຄ້າ. ຄວາມສາມາດຫຼັກລວມມີ: {ຄຸນສົມບັດ}.

ຍັງບໍ່ມີ​ການ​ຈັດອັນດັບ

VITSຂໍ້ມູນ​ແບບ

ແບບ VITS
ຜູ້​ພັດທະນາ Jaehyeon Kim et al.
ຄຸນນະພາບ
ຄວາມ​ໄວ ​រហ័ស
ໃບອະນຸຍາດ MIT
​ກັ່ນຕອງ ບໍ່ມີ
ສັດ ບໍ່ມີ​ຕົວ​ອັກສອນ
​ប៉ារ៉ាម៉ែត្រ 25M
ສະຖາປັດຕະຍະກໍາ VAE + Normalizing Flows + GAN
ຂໍ້ມູນ​ການ​ຝຶກ 585 ​ម៉ោង
ປີ 2021

ກໍລະນີໃຊ້ທີ່ດີທີ່ສຸດສໍາລັບ Baker (Chinese)

ແນະນຳ​ໃຫ້ໃຊ້​ແອັບພລິເຄຊັນ​ທີ່​ອີງ​ໃສ່​ຄຸນລັກສະນະ​ຂອງ​ສຽງ​ນີ້

ອ່ານ​ປື້ມ​ສຽງ ແລະ ເວົ້າ

ໃຊ້ {ຊື່} ເພື່ອ​ເວົ້າ​ເນື້ອໃນ​ແບບ​ຍາວໆ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳມະຊາດ ແລະ ການ​ສະແດງ​ອອກ.

ສຽງ​ວີດີໂອ

ເພີ່ມການເວົ້າທີ່ຊ່ຽວຊານໃຫ້ກັບວິດີໂອ YouTube, ການໂຄສະນາ, ແລະເນື້ອຫາສື່ສັງຄົມ.

ຄວາມສາມາດ​ໃນ​ການ​ເຂົ້າເຖິງ

ການສ້າງສຽງຢ່າງໄວວາເຮັດໃຫ້ສຽງນີ້ ເໝາະສຳລັບແອັບພລິເຄຊັນທີ່ໃຊ້ໄດ້ທັນທີ, ເຄື່ອງມືອ່ານໜ້າຈໍ ແລະ ເຄື່ອງມືທີ່ງ່າຍຕໍ່ການເຂົ້າເຖິງ.

ການ​ຮຽນຮູ້​ທາງ​ອີເລັກໂຕຣນິກ ແລະ ການ​ຝຶກ​ອົບຮົມ

ສ້າງວັດຖຸອຸປະກອນການຝຶກອົບຮົມທີ່ຫນ້າສົນໃຈ, ຫຼັກສູດ, ແລະເນື້ອໃນການສຶກສາທີ່ມີການເລົ່າເລື່ອງ AI ທີ່ຊັດເຈນ.

ຫຼາຍ VITS ສຽງ

ສຽງ​ອື່ນໆ​ຈາກ​ໂມເດວ TTS ດຽວກັນ

Default

ພາສາ​ອັງກິດName Neutral

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VITS (ການ​ຄິດ​ໄລ່​ຄວາມ​ແຕກຕ່າງ​ດ້ວຍ​ການ​ຮຽນ​ຮູ້​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ເພື່ອ​ການ​ແປ​ຂໍ້​ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ຈາກ​ຕົ້ນ​ເຖິງ​ທ້າຍ) ແມ່ນ​ວິທີການ​ TTS ແບບ​ຄຽງ​ຄູ່​ກັນ​ລະຫວ່າງ​ຕົ້ນ​ເຖິງ​ທ້າຍ​ທີ່​ຜະລິດ​ສຽງ​ທີ່​ມີ​ສຽງ​ທໍາມະຊາດ​ຫຼາຍ​ຂຶ້ນ​ກວ່າ​ແບບ​ແບບ​ສອງ​ຂັ້ນ​ທີ່​ມີ​ຢູ່​ໃນ​ປັດຈຸບັນ. ມັນ​ໃຊ້​ການຄິດໄລ່​ຄວາມ​ແຕກຕ່າງ​ທີ່​ເພີ່ມ​ຂຶ້ນ​ດ້ວຍ​ການ​ປ່ຽນ​ແປງ​ຂອງ​ການ​ໄຫຼ ແລະ ຂະບວນການ​ຝຶກ​ອົບຮົມ​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ກັນ, ເຮັດໃຫ້​ການ​ປັບ​ປຸງ​ທີ່​ມີ​ຄວາມ​ໝາຍ​ໃນ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ເປັນ​ທໍາ​ມະ​ຊາດ​ຫຼາຍ​ຂຶ້ນ.

VITS ໄດ້ຖືກພັດທະນາໂດຍ Jaehyeon Kim et al. ແລະ ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດ MIT, ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ສຽງທີ່ສ້າງຂຶ້ນມາເພື່ອການຂາຍ.

VITS ສະຫນັບສະຫນູນ4ພາສາ: ພາສາອັງກິດ, ຈີນ, ຍີ່ປຸ່ນ, ເກົາຫຼີ.

VITS ແມ່ນຢູ່ໃນລະດັບຟຣີ — ຟຣີ — ບໍ່ມີເຄຣດິດທີ່ຕ້ອງການ. ທ່ານສາມາດເບິ່ງສຽງ VITS ໃດໆໂດຍບໍ່ເສຍຄ່າກ່ອນທີ່ຈະສ້າງສຽງເຕັມ.

VITS ມີ​ຄວາມ​ໄວ​ໃນການ​ສ້າງ​ທີ່​ໄວ​ຫຼາຍ. ມັນ​ແລ່ນ​ໃນ​ເວລາ​ທີ່​ໃກ້​ຄຽງ​ກັບ​ເວລາ​ຈິງ, ເຮັດໃຫ້​ມັນ​ເໝາະສົມ​ກັບ​ການ​ຖ່າຍ​ທອດ ແລະ ​ການ​ປະສານ​ງານ​ກັບ​ໂປແກຼມ​ຕ່າງໆ.

VITS ໄດ້ຮັບຄະແນນ 3/5 ສຳ ລັບຄຸນນະພາບສຽງໃນ TTS.ai. ມັນສະ ໜອງ ສຽງທີ່ມີຄຸນນະພາບດີທີ່ ເໝາະ ສົມກັບແອັບພລິເຄຊັນສ່ວນຫຼາຍ.

ບໍ່, VITS ໃຊ້ສຽງທີ່ຕັ້ງໄວ້ແລ້ວ. ສຳລັບການຖ່າຍທອດສຽງ, ພະຍາຍາມແບບແບບເຊັ່ນ CosyVoice 2, GPT-SoVITS, ຫຼື Chatterbox.

ຍອມຮັບ, VITS ຖືກແນະນຳໃຫ້ໃຊ້ສຳລັບການແປຂໍ້ຄວາມເປັນຄຳເວົ້າທີ່ມີສຽງທຳມະຊາດ. ຄວາມສາມາດໃນການສັງເຄາະສຽງທຳມະຊາດ ແລະ ຜົນໄດ້ຮັບທີ່ໄວເຮັດໃຫ້ມັນເປັນທາງເລືອກທີ່ດີສຳລັບກໍລະນີນີ້.

ໃບອະນຸຍາດ VITS ແມ່ນຢູ່ພາຍໃຕ້ MIT, ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ. ສຽງທີ່ຜະລິດໂດຍ VITS ສາມາດໃຊ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະ ໂຄງການການຄ້າອື່ນໆ.

ຍິນດີ, ສຽງທັງໝົດໃນ TTS.ai ໃຊ້ແບບຟອມ Open Source ທີ່ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ (MIT, Apache 2.0). ສຽງທີ່ຜະລິດອອກມາແມ່ນຂອງທ່ານທີ່ຈະໃຊ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະແອັບພລິເຄຊັນການຄ້າອື່ນໆ.

ສົ່ງຄໍາຮ້ອງຂໍ POST ໄປທີ່ /api/v1/tts/ ດ້ວຍການຕັ້ງຊື່ແບບແລະລະຫັດສຽງ. ເບິ່ງ ໜ້າ ເອກະສານ API ຂອງພວກເຮົາ ສຳ ລັບຕົວຢ່າງຂອງໂປແກຼມໃນ Python, JavaScript, Go, ແລະ cURL.

ຍອມຮັບ, ກົດປຸ່ມຫຼິ້ນໃນ ໜ້າ ນີ້ ເພື່ອຟັງຕົວຢ່າງ. ທ່ານຍັງສາມາດພິມຂໍ້ຄວາມທີ່ຕັ້ງເອງໃນ ໜ້າ ຂໍ້ຄວາມເປັນສຽງ ແລະ ສ້າງການເບິ່ງກ່ອນຟັງຟຣີດ້ວຍສຽງໃດກໍ່ໄດ້.

ພະຍາຍາມ Baker (Chinese) ປັດຈຸບັນ

ພິມ​ຂໍ້ຄວາມ​ໃດໆ ແລະ​ຟັງ​ມັນ​ເວົ້າ​ໂດຍ Baker (Chinese). ຟຣີ​ທີ່ຈະ​ໃຊ້ ບໍ່​ຕ້ອງ​ການ​ໃຫ້​ຄະແນນ.