Baker (Chinese)

ບໍ່ມີ ຈີນName Neutral

VITS

{ຊື່} ແມ່ນສຽງຂອງ {ເພດ} AI ທີ່ມີແຮງງານໂດຍແບບແບບຂໍ້ຄວາມເປັນຄຳເວົ້າ {ແບບ}. ສຽງ {ລະດັບ} ນີ້ເວົ້າ {ພາສາ} ແລະ ສົ່ງການປະສົມສຽງທີ່ມີຄຸນນະພາບ {ຄຸນນະພາບ}. ດ້ວຍຄວາມໄວໃນການສ້າງ ໃກ້ຈະທັນທີ ແລະ ອັດຕາການຕີລາຄາຄຸນນະພາບຂອງ 3/5, Baker (Chinese) ແມ່ນເຫມາະສົມກັບ general-purpose text-to-speech with natural prosody. ເຄື່ອງຈັກ VITS ແມ່ນພັດທະນາໂດຍ Jaehyeon Kim et al. under the MIT license, ເຮັດໃຫ້ມັນປອດໄພສຳລັບການໃຊ້ໃນການຄ້າ. ຄວາມສາມາດຫຼັກລວມມີ: {ຄຸນສົມບັດ}.

ຍັງບໍ່ມີການຈັດອັນດັບ

ພະຍາຍາມສຽງນີ້ ទាំងអស់ VITS ສຽງ

ຂໍ້ມູນແບບ

ແບບ	VITS
ຜູ້ພັດທະນາ	Jaehyeon Kim et al.
ຄຸນນະພາບ
ຄວາມໄວ	រហ័ស
ໃບອະນຸຍາດ	MIT
ກັ່ນຕອງ	ບໍ່ມີ
ສັດ	ບໍ່ມີຕົວອັກສອນ
ប៉ារ៉ាម៉ែត្រ	25M
ສະຖາປັດຕະຍະກໍາ	VAE + Normalizing Flows + GAN
ຂໍ້ມູນການຝຶກ	585 ម៉ោង
ປີ	2021

ກໍລະນີໃຊ້ທີ່ດີທີ່ສຸດສໍາລັບ Baker (Chinese)

ແນະນຳໃຫ້ໃຊ້ແອັບພລິເຄຊັນທີ່ອີງໃສ່ຄຸນລັກສະນະຂອງສຽງນີ້

ອ່ານປື້ມສຽງ ແລະ ເວົ້າ

ໃຊ້ {ຊື່} ເພື່ອເວົ້າເນື້ອໃນແບບຍາວໆດ້ວຍການເວົ້າແບບທຳມະຊາດ ແລະ ການສະແດງອອກ.

ສຽງວີດີໂອ

ເພີ່ມການເວົ້າທີ່ຊ່ຽວຊານໃຫ້ກັບວິດີໂອ YouTube, ການໂຄສະນາ, ແລະເນື້ອຫາສື່ສັງຄົມ.

ຄວາມສາມາດໃນການເຂົ້າເຖິງ

ການສ້າງສຽງຢ່າງໄວວາເຮັດໃຫ້ສຽງນີ້ ເໝາະສຳລັບແອັບພລິເຄຊັນທີ່ໃຊ້ໄດ້ທັນທີ, ເຄື່ອງມືອ່ານໜ້າຈໍ ແລະ ເຄື່ອງມືທີ່ງ່າຍຕໍ່ການເຂົ້າເຖິງ.

ການຮຽນຮູ້ທາງອີເລັກໂຕຣນິກ ແລະ ການຝຶກອົບຮົມ

ສ້າງວັດຖຸອຸປະກອນການຝຶກອົບຮົມທີ່ຫນ້າສົນໃຈ, ຫຼັກສູດ, ແລະເນື້ອໃນການສຶກສາທີ່ມີການເລົ່າເລື່ອງ AI ທີ່ຊັດເຈນ.

ຫຼາຍ VITS ສຽງ

ສຽງອື່ນໆຈາກໂມເດວ TTS ດຽວກັນ

Default

ພາສາອັງກິດName Neutral

ເບິ່ງທັງໝົດ VITS ສຽງ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VITS (ການຄິດໄລ່ຄວາມແຕກຕ່າງດ້ວຍການຮຽນຮູ້ທີ່ມີການຕໍ່ສູ້ເພື່ອການແປຂໍ້ຄວາມເປັນຄຳເວົ້າຈາກຕົ້ນເຖິງທ້າຍ) ແມ່ນວິທີການ TTS ແບບຄຽງຄູ່ກັນລະຫວ່າງຕົ້ນເຖິງທ້າຍທີ່ຜະລິດສຽງທີ່ມີສຽງທໍາມະຊາດຫຼາຍຂຶ້ນກວ່າແບບແບບສອງຂັ້ນທີ່ມີຢູ່ໃນປັດຈຸບັນ. ມັນໃຊ້ການຄິດໄລ່ຄວາມແຕກຕ່າງທີ່ເພີ່ມຂຶ້ນດ້ວຍການປ່ຽນແປງຂອງການໄຫຼ ແລະ ຂະບວນການຝຶກອົບຮົມທີ່ມີການຕໍ່ສູ້ກັນ, ເຮັດໃຫ້ການປັບປຸງທີ່ມີຄວາມໝາຍໃນການເວົ້າທີ່ມີຄວາມເປັນທໍາມະຊາດຫຼາຍຂຶ້ນ.

VITS ໄດ້ຖືກພັດທະນາໂດຍ Jaehyeon Kim et al. ແລະ ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດ MIT, ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ສຽງທີ່ສ້າງຂຶ້ນມາເພື່ອການຂາຍ.

VITS ສະຫນັບສະຫນູນ4ພາສາ: ພາສາອັງກິດ, ຈີນ, ຍີ່ປຸ່ນ, ເກົາຫຼີ.

VITS ແມ່ນຢູ່ໃນລະດັບຟຣີ — ຟຣີ — ບໍ່ມີເຄຣດິດທີ່ຕ້ອງການ. ທ່ານສາມາດເບິ່ງສຽງ VITS ໃດໆໂດຍບໍ່ເສຍຄ່າກ່ອນທີ່ຈະສ້າງສຽງເຕັມ.

VITS ມີຄວາມໄວໃນການສ້າງທີ່ໄວຫຼາຍ. ມັນແລ່ນໃນເວລາທີ່ໃກ້ຄຽງກັບເວລາຈິງ, ເຮັດໃຫ້ມັນເໝາະສົມກັບການຖ່າຍທອດ ແລະ ການປະສານງານກັບໂປແກຼມຕ່າງໆ.

VITS ໄດ້ຮັບຄະແນນ 3/5 ສຳ ລັບຄຸນນະພາບສຽງໃນ TTS.ai. ມັນສະ ໜອງ ສຽງທີ່ມີຄຸນນະພາບດີທີ່ ເໝາະ ສົມກັບແອັບພລິເຄຊັນສ່ວນຫຼາຍ.

ບໍ່, VITS ໃຊ້ສຽງທີ່ຕັ້ງໄວ້ແລ້ວ. ສຳລັບການຖ່າຍທອດສຽງ, ພະຍາຍາມແບບແບບເຊັ່ນ CosyVoice 2, GPT-SoVITS, ຫຼື Chatterbox.

ຍອມຮັບ, VITS ຖືກແນະນຳໃຫ້ໃຊ້ສຳລັບການແປຂໍ້ຄວາມເປັນຄຳເວົ້າທີ່ມີສຽງທຳມະຊາດ. ຄວາມສາມາດໃນການສັງເຄາະສຽງທຳມະຊາດ ແລະ ຜົນໄດ້ຮັບທີ່ໄວເຮັດໃຫ້ມັນເປັນທາງເລືອກທີ່ດີສຳລັບກໍລະນີນີ້.

ໃບອະນຸຍາດ VITS ແມ່ນຢູ່ພາຍໃຕ້ MIT, ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ. ສຽງທີ່ຜະລິດໂດຍ VITS ສາມາດໃຊ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະ ໂຄງການການຄ້າອື່ນໆ.

ຍິນດີ, ສຽງທັງໝົດໃນ TTS.ai ໃຊ້ແບບຟອມ Open Source ທີ່ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ (MIT, Apache 2.0). ສຽງທີ່ຜະລິດອອກມາແມ່ນຂອງທ່ານທີ່ຈະໃຊ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະແອັບພລິເຄຊັນການຄ້າອື່ນໆ.

ສົ່ງຄໍາຮ້ອງຂໍ POST ໄປທີ່ /api/v1/tts/ ດ້ວຍການຕັ້ງຊື່ແບບແລະລະຫັດສຽງ. ເບິ່ງ ໜ້າ ເອກະສານ API ຂອງພວກເຮົາ ສຳ ລັບຕົວຢ່າງຂອງໂປແກຼມໃນ Python, JavaScript, Go, ແລະ cURL.

ຍອມຮັບ, ກົດປຸ່ມຫຼິ້ນໃນ ໜ້າ ນີ້ ເພື່ອຟັງຕົວຢ່າງ. ທ່ານຍັງສາມາດພິມຂໍ້ຄວາມທີ່ຕັ້ງເອງໃນ ໜ້າ ຂໍ້ຄວາມເປັນສຽງ ແລະ ສ້າງການເບິ່ງກ່ອນຟັງຟຣີດ້ວຍສຽງໃດກໍ່ໄດ້.

ພະຍາຍາມ Baker (Chinese) ປັດຈຸບັນ

ພິມຂໍ້ຄວາມໃດໆ ແລະຟັງມັນເວົ້າໂດຍ Baker (Chinese). ຟຣີທີ່ຈະໃຊ້ ບໍ່ຕ້ອງການໃຫ້ຄະແນນ.

ສ້າງການເວົ້າ ລົງທະບຽນຟຣີ

Baker (Chinese)

ຂໍ້ມູນ​ແບບ

ກໍລະນີໃຊ້ທີ່ດີທີ່ສຸດສໍາລັບ Baker (Chinese)

ອ່ານ​ປື້ມ​ສຽງ ແລະ ເວົ້າ

ສຽງ​ວີດີໂອ

ຄວາມສາມາດ​ໃນ​ການ​ເຂົ້າເຖິງ

ການ​ຮຽນຮູ້​ທາງ​ອີເລັກໂຕຣນິກ ແລະ ການ​ຝຶກ​ອົບຮົມ

ຫຼາຍ VITS ສຽງ

Default

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VITS TTS ແມ່ນຫຍັງ?

ໃຜພັດທະນາ VITS?

VITS ສະໜັບສະໜູນພາສາໃດ?

ຄ່າໃຊ້ຈ່າຍໃນການໃຊ້ສຽງ VITS ແມ່ນເທົ່າໃດ?

VITS ສ້າງສຽງໄດ້ໄວປານໃດ?

ຄຸນນະພາບສຽງຂອງ VITS ແມ່ນຫຍັງ?

ຂ້ອຍສາມາດ​ເຮັດ​ໃຫ້​ສຽງ​ຄືກັນ​ກັບ VITS ໄດ້​ບໍ?

VITS ເຫມາະສົມສໍາລັບຂໍ້ຄວາມ-ເປັນ-ການເວົ້າທີ່ມີຈຸດປະສົງທົ່ວໄປກັບ prosodia ທໍາມະຊາດບໍ?

ຂ້ອຍສາມາດໃຊ້ສຽງ VITS ໃນການຂາຍໄດ້ບໍ?

ຂ້ອຍສາມາດໃຊ້ສຽງນີ້ ສຳ ລັບໂຄງການການຄ້າໄດ້ບໍ?

ຂ້ອຍຈະໃຊ້ສຽງນີ້ຜ່ານ API ໄດ້ແນວໃດ?

ຂ້ອຍ​ສາມາດ​ເບິ່ງ​ສຽງ​ກ່ອນ​ທີ່​ຈະ​ສ້າງ​ມັນ​ໄດ້​ບໍ?