VibeVoice

Speaker 2 (Chinese)

ມາດຕະຖານ ຈີນName Neutral VibeVoice

{ຊື່} ແມ່ນສຽງຂອງ {ເພດ} AI ທີ່ມີແຮງ​ງານ​ໂດຍ​ແບບ​ແບບ​ຂໍ້ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ {ແບບ}. ສຽງ {ລະດັບ} ນີ້​ເວົ້າ {ພາສາ} ແລະ ສົ່ງ​ການ​ປະສົມ​ສຽງ​ທີ່ມີ​ຄຸນ​ນະພາ​ບ {ຄຸນນະພາບ}. ດ້ວຍຄວາມໄວໃນການສ້າງ ໃກ້​ຈະ​ທັນທີ ແລະ ອັດຕາການຕີລາຄາຄຸນນະພາບຂອງ 5/5, Speaker 2 (Chinese) ແມ່ນເຫມາະສົມກັບ podcasts, dialogues, long-form narration, multi-speaker content. ເຄື່ອງຈັກ VibeVoice ແມ່ນພັດທະນາໂດຍ Microsoft under the MIT license, ເຮັດໃຫ້ມັນປອດໄພສຳລັບການໃຊ້ໃນການຄ້າ. ຄວາມສາມາດຫຼັກລວມມີ: {ຄຸນສົມບັດ}.

ຍັງບໍ່ມີ​ການ​ຈັດອັນດັບ

VibeVoiceຂໍ້ມູນ​ແບບ

ແບບ VibeVoice
ຜູ້​ພັດທະນາ Microsoft
ຄຸນນະພາບ
ຄວາມ​ໄວ ​រហ័ស
ໃບອະນຸຍາດ MIT
​ກັ່ນຕອງ ບໍ່ມີ
ສັດ ມາດຕະຖານ (2x ຕົວອັກສອນ)
​ប៉ារ៉ាម៉ែត្រ 1.5B
ສະຖາປັດຕະຍະກໍາ LLM + DAC
ຂໍ້ມູນ​ການ​ຝຶກ 100000 ​ម៉ោង
ປີ 2025

ກໍລະນີໃຊ້ທີ່ດີທີ່ສຸດສໍາລັບ Speaker 2 (Chinese)

ແນະນຳ​ໃຫ້ໃຊ້​ແອັບພລິເຄຊັນ​ທີ່​ອີງ​ໃສ່​ຄຸນລັກສະນະ​ຂອງ​ສຽງ​ນີ້

ອ່ານ​ປື້ມ​ສຽງ ແລະ ເວົ້າ

ໃຊ້ {ຊື່} ເພື່ອ​ເວົ້າ​ເນື້ອໃນ​ແບບ​ຍາວໆ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳມະຊາດ ແລະ ການ​ສະແດງ​ອອກ.

ສຽງ​ວີດີໂອ

ເພີ່ມການເວົ້າທີ່ຊ່ຽວຊານໃຫ້ກັບວິດີໂອ YouTube, ການໂຄສະນາ, ແລະເນື້ອຫາສື່ສັງຄົມ.

ຄວາມສາມາດ​ໃນ​ການ​ເຂົ້າເຖິງ

ການສ້າງສຽງຢ່າງໄວວາເຮັດໃຫ້ສຽງນີ້ ເໝາະສຳລັບແອັບພລິເຄຊັນທີ່ໃຊ້ໄດ້ທັນທີ, ເຄື່ອງມືອ່ານໜ້າຈໍ ແລະ ເຄື່ອງມືທີ່ງ່າຍຕໍ່ການເຂົ້າເຖິງ.

ເພງ​ໂປດ​ແກຣມ ແລະ ບັນທຶກ​ສຽງ

ຜົນຜະລິດທີ່ມີຄຸນນະພາບຂອງສະຕູດິໂອທີ່ ເໝາະ ສົມກັບ podcasts, ວິທະຍຸ, ແລະ ການອອກອາກາດທີ່ຊ່ຽວຊານ.

ຫຼາຍ VibeVoice ສຽງ

ສຽງ​ອື່ນໆ​ຈາກ​ໂມເດວ TTS ດຽວກັນ

Speaker 1

ພາສາ​ອັງກິດName Neutral

Speaker 1 (Chinese)

ຈີນName Neutral

Speaker 2

ພາສາ​ອັງກິດName Neutral

Speaker 3

ພາສາ​ອັງກິດName Neutral

Speaker 4

ພາສາ​ອັງກິດName Neutral

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

VibeVoice ໂດຍ Microsoft ມີສອງຕົວເລືອກ: ແບບ 1.5B ສຳ ລັບເນື້ອຫາແບບຍາວ (ເຖິງ 90 ນາທີ, 4ຜູ້ກ່າວ) ແລະແບບ Realtime 0.5B ສຳ ລັບການຖ່າຍທອດສົດດ້ວຍ ~ 200ms ສຽງລົບກວນຄັ້ງ ທຳ ອິດ. ຕົວເລືອກ 1.5B ດີເລີດໃນ podcasts ແລະ audiobooks ທີ່ມີສຽງທີ່ສອດຄ່ອງກັບຜູ້ເວົ້າໃນໄລຍະໄລຍະຍາວ. ຂໍ້ສັງເກດ: Microsoft ໄດ້ເອົາລະຫັດ TTS ອອກຈາກບ່ອນເກັບມ້ຽນແລະສ້າງສຽງລວມມີການຍົກເວັ້ນຄວາມຮັບຜິດຊອບຂອງ AI ທີ່ສາມາດຟັງໄດ້.

VibeVoice ໄດ້ຖືກພັດທະນາໂດຍ Microsoft ແລະ ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດ MIT (ຄວາມຕັ້ງໃຈໃນການຄົ້ນຄວ້າເທົ່ານັ້ນ), ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ການຕະຫຼາດຂອງສຽງທີ່ຜະລິດອອກມາ.

VibeVoice ສະໜັບສະໜູນ 1 ພາສາ: ພາສາອັງກິດ.

VibeVoice ແມ່ນຢູ່ໃນລະດັບ Premium —4ເຄດິດຕໍ່ 1,000 ຕົວອັກສອນ. ທ່ານສາມາດເບິ່ງສຽງ VibeVoice ໃດໆໂດຍບໍ່ເສຍຄ່າກ່ອນທີ່ຈະສ້າງສຽງເຕັມ.

VibeVoice ມີ​ຄວາມ​ໄວ​ໃນການ​ສ້າງ​ສຽງ​ທີ່​ພຽງພໍ. ການ​ສ້າງ​ສຽງ​ໂດຍ​ປົກກະຕິ​ຈະ​ໃຊ້ເວລາ​ບໍ່​ເທົ່າ​ໃດ​ວິນາທີ ຂຶ້ນ​ກັບ​ຄວາມ​ຍາວ​ຂອງ​ຂໍ້ຄວາມ.

VibeVoice ໄດ້ຮັບຄະແນນ 5/5 ສຳລັບຄຸນນະພາບສຽງໃນ TTS.ai. ມັນສະໜອງການເວົ້າທີ່ຄ້າຍຄືກັບຄົນ, ລະດັບສະຕູດິໂອ.

ບໍ່, VibeVoice ໃຊ້​ສຽງ​ທີ່​ມີ​ໄວ້​ແລ້ວ​ເປັນ​ກຸ່ມ​ດຽວ. ສຳລັບ​ການ​ກັ່ນຕອງ​ສຽງ, ພະຍາຍາມ​ແບບ​ແບບ​ເຊັ່ນ CosyVoice 2, GPT-SoVITS, ຫຼື Chatterbox.

ຍິນດີ, VibeVoice ແມ່ນແນະນໍາຢ່າງຈະແຈ້ງສໍາລັບ podcasts, ຫນັງສືສຽງ, ເນື້ອໃນ multi- speaker ແບບຟອມຍາວ. ຫຼາຍ- speaker ຂອງ, ເຖິງ 90 ນາທີ, ຄວາມສາມາດໃນການສ້າງ podcast ເຮັດໃຫ້ມັນເປັນທາງເລືອກທີ່ດີເລີດສໍາລັບກໍລະນີການນໍາໃຊ້ນີ້.

ໃບອະນຸຍາດ VibeVoice ແມ່ນຢູ່ພາຍໃຕ້ MIT (ຄວາມຕັ້ງໃຈໃນການຄົ້ນຄວ້າເທົ່ານັ້ນ), ເຊິ່ງອະນຸຍາດໃຫ້ໃຊ້ໃນທາງທຸລະກິດ. ສຽງທີ່ຜະລິດໂດຍສຽງ VibeVoice ສາມາດໃຊ້ໄດ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະ ໂຄງການທາງທຸລະກິດອື່ນໆ.

ຍິນດີ, ສຽງທັງໝົດໃນ TTS.ai ໃຊ້ແບບຟອມ Open Source ທີ່ອະນຸຍາດໃຫ້ໃຊ້ໃນການຄ້າ (MIT, Apache 2.0). ສຽງທີ່ຜະລິດອອກມາແມ່ນຂອງທ່ານທີ່ຈະໃຊ້ໃນວິດີໂອ, ເພງ, ແອັບພລິເຄຊັນ, ເກມ, ແລະແອັບພລິເຄຊັນການຄ້າອື່ນໆ.

ສົ່ງຄໍາຮ້ອງຂໍ POST ໄປທີ່ /api/v1/tts/ ດ້ວຍການຕັ້ງຊື່ແບບແລະລະຫັດສຽງ. ເບິ່ງ ໜ້າ ເອກະສານ API ຂອງພວກເຮົາ ສຳ ລັບຕົວຢ່າງຂອງໂປແກຼມໃນ Python, JavaScript, Go, ແລະ cURL.

ຍອມຮັບ, ກົດປຸ່ມຫຼິ້ນໃນ ໜ້າ ນີ້ ເພື່ອຟັງຕົວຢ່າງ. ທ່ານຍັງສາມາດພິມຂໍ້ຄວາມທີ່ຕັ້ງເອງໃນ ໜ້າ ຂໍ້ຄວາມເປັນສຽງ ແລະ ສ້າງການເບິ່ງກ່ອນຟັງຟຣີດ້ວຍສຽງໃດກໍ່ໄດ້.

ພະຍາຍາມ Speaker 2 (Chinese) ປັດຈຸບັນ

ພິມ​ຂໍ້ຄວາມ​ໃດໆ ແລະ​ຟັງ​ມັນ​ເວົ້າ​ໂດຍ Speaker 2 (Chinese). ຟຣີ​ທີ່ຈະ​ໃຊ້.