Report Bug / Feature Request

TTS Arena — ຕາຕະລາງການນໍາພາແບບຟອມສຽງ AI

ປຽບທຽບແບບຈໍາລອງ AI text-to-speech head-to-head. ຟັງຂໍ້ຄວາມດຽວກັນເວົ້າໂດຍແບບຈໍາລອງທີ່ແຕກຕ່າງກັນ, ລົງຄະແນນສຽງສໍາລັບສຽງທໍາມະຊາດຫຼາຍທີ່ສຸດ, ແລະເບິ່ງວິທີການ 20+ ແບບຈໍາລອງ TTS ຈັດອັນດັບໃນ leaderboard ຊຸມຊົນ-ຂັບເຄື່ອນຂອງພວກເຮົາ.

ຈັດ​ອັນດັບ​ແບບ ຄະແນນສຽງຂອງຊຸມຊົນ ຕົວ​ຊີ້​ວັດ ການ​ທົດສອບ A/B ຕາຕະລາງ​ຈັດອັນດັບ

ຄຸນສົມບັດ TTS Arena

ວິທີທີ່ຍຸຕິທໍາ, ຖືກນໍາພາໂດຍຊຸມຊົນເພື່ອວິເຄາະແບບຟອມສຽງ AI

ມາດຕະຖານ​ຢ່າງ​ເປັນ​ທາງການ

ມາດຕະຖານການວິເຄາະການວັດແທກລວມທັງ MOS (ຄະແນນຄວາມຄິດເຫັນສະເລ່ຍ), ອັດຕາຄວາມຜິດພາດຂອງຕົວອັກສອນ, ສຽງຄ້າຍຄືກັນ, ແລະປັດໃຈເວລາຈິງໃນທຸກໆ 20+ ແບບ.

ຈັດອັນດັບ​ຊຸມຊົນ

ການຈັດອັນດັບ ແລະ ການທົບທວນຄືນຈາກຜູ້ໃຊ້ TTS ຕົວຈິງ. ເບິ່ງແບບໃດທີ່ເຮັດວຽກໄດ້ດີທີ່ສຸດ ສຳ ລັບກໍລະນີການໃຊ້ງານສະເພາະທີ່ອີງໃສ່ການທົບທວນຄືນຂອງຊຸມຊົນ.

ການ​ປຽບທຽບ​ຂ້າງ​ຕໍ່​ຂ້າງ

ສ້າງ​ຂໍ້ຄວາມ​ທີ່​ຄື​ກັນ​ກັບ​ແບບ​ແບບ​ສອງ​ແບບ ແລະ ​ປຽບທຽບ​ຄຸນ​ນະ​ພາບ​ສຽງ, ​ຄວາມ​ເປັນ​ທຳ ແລະ ​ຄວາມ​ໄວ​ໂດຍ​ກົງ​ໃນ​ຕົວ​ທ່ອງ​ເວັບ​ຂອງທ່ານ.

20+ ແບບຈໍາລອງຈັດອັນດັບ

ທຸກໆແບບໃນ TTS.ai ແມ່ນຖືກ benchmarked ແລະຈັດອັນດັບ. ຕົວກັ່ນຕອງໂດຍຄວາມໄວ, ຄຸນນະພາບ, ການສະຫນັບສະຫນູນພາສາ, ຄຸນສົມບັດ, ແລະໃບອະນຸຍາດເພື່ອຊອກຫາແບບທີ່ເຫມາະສົມຂອງທ່ານ.

ຕົວຊີ້ວັດ​ລະອຽດ

ຄົ້ນຫາຄວາມໄວຂອງແຕ່ລະແບບ: ຄວາມຊ້າ, ຄວາມໄວໃນການສົ່ງຜ່ານ, ການໃຊ້ VRAM, ພາສາທີ່ຮອງຮັບ, ຄຸນນະພາບການຖ່າຍທອດ, ແລະ ຄະແນນລະດັບຄວາມຮູ້ສຶກ.

ເປີດ​ໃຊ້​ຟຣີ

ຄົ້ນຫາ leaderboard, ທຽບໃສ່ແບບ, ແລະລົງຄະແນນສຽງກ່ຽວກັບຄຸນນະພາບ - ທັງຫມົດທີ່ຟຣີ. ບໍ່ມີບັນຊີທີ່ຈໍາເປັນເພື່ອຄົ້ນຫາການຈັດອັນດັບແລະ benchmarks.

ແບບໃນ​ສະໂມສອນ

ທັງຫມົດ 20+ ແບບແຂ່ງຂັນຫົວ-ຫາ-ຫົວສໍາລັບການຈັດອັນດັບສູງສຸດ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ດີທີ່ສຸດ ສຳ ລັບ: ແບບຟອມຟຣີທີ່ມີການຈັດອັນດັບສູງທີ່ສຸດ - ອັດຕາສ່ວນຄວາມໄວ-ເຖິງ-ຄຸນນະພາບດີທີ່ສຸດໃນຕາຕະລາງຜູ້ນໍາ

ພະຍາຍາມ Kokoro

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ການ​ກັ່ນຕອງ​ສຽງ

ດີທີ່ສຸດ ສຳ ລັບ: ແບບຟອມ​ການ​ກັ່ນຕອງ​ສຽງ​ທີ່ມີ​ຄຸນສົມບັດ​ການ​ຄວບຄຸມ​ອາລົມ​ສູງ​ສຸດ

ພະຍາຍາມ Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ການ​ກັ່ນຕອງ​ສຽງ

ດີທີ່ສຸດ ສຳ ລັບ: ແບບຈໍາລອງຫຼາຍພາສາ​ທີ່​ດີ​ທີ່​ສຸດ​ດ້ວຍ​ຄະແນນ​ຄວາມ​ເປັນ​ທຳ​ມະ​ຊາດ​ຂອງ​ມະນຸດ

ພະຍາຍາມ CosyVoice 2

StyleTTS 2StyleTTS 2

Premium

Human-level text-to-speech through style diffusion and adversarial training.

Medium 5/5

ດີທີ່ສຸດ ສຳ ລັບ: ຄະແນນ MOS ລຳໂພງ​ດຽວ​ທີ່​ສູງ​ທີ່​ສຸດ​ໃນ​ບັນດາ​ແບບ Open Source ທັງໝົດ

ພະຍາຍາມ StyleTTS 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ດີທີ່ສຸດ ສຳ ລັບ: ແບບຈໍາລອງການເວົ້າທີ່ນໍາໜ້າສໍາລັບການສ້າງຄໍາເວົ້າທໍາມະຊາດ

ພະຍາຍາມ Sesame CSM

ວິທີການ TTS Arena ເຮັດວຽກ

ລົງຄະແນນສຽງກ່ຽວກັບຄຸນນະພາບສຽງ ແລະ ຊ່ວຍຈັດອັນດັບແບບ AI ທີ່ດີທີ່ສຸດ

1

ຄົ້ນຫາ​ຕາຕະລາງ​ອັນດັບ

ເບິ່ງທັງຫມົດ 20+ ແບບຈໍາລອງຈັດອັນດັບໂດຍຄຸນນະພາບ, ຄວາມໄວ, ແລະຄຸນລັກສະນະ. ຕົວກັ່ນຕອງໂດຍຊັ້ນ (ຟຣີ, ມາດຕະຖານ, premium) ຫຼືຄວາມສາມາດສະເພາະ.

2

ປຽບທຽບແບບຕົວແບບໃກ້ໆກັນ

ເລືອກ​ແບບ​ສອງ​ແບບ ແລະ ສ້າງ​ຂໍ້​ຄວາມ​ທີ່​ຄື​ກັນ​ກັບ​ທັງ​ສອງ​ແບບ. ຟັງ​ຜົນ​ອອກ​ມາ ແລະ ປຽບທຽບ​ຄວາມ​ເປັນ​ທຳ​ມະ​ຊາດ, ຄວາມ​ຊັດເຈນ ແລະ ການ​ສະແດງ​ອາລົມ.

3

ຄະແນນ​ສຽງ​ກ່ຽວກັບ​ຄຸນ​ນະ​ພາບ

ຫຼັງ​ຈາກ​ປຽບທຽບ​ແລ້ວ, ໃຫ້​ລົງ​ຄະ​ແນນ​ສຽງ​ສຳລັບ​ແບບ​ທີ່​ມີ​ສຽງ​ດີ​ກວ່າ. ການ​ລົງ​ຄະ​ແນນ​ສຽງ​ຂອງທ່ານ ຈະ​ປະກອບສ່ວນ​ເຂົ້າ​ໃນ​ການ​ຈັດ​ອັນ​ດັບ​ຂອງ​ຊຸມ​ຊົນ ແລະ ຊ່ວຍ​ຜູ້​ໃຊ້​ອື່ນໆ​ເລືອກ​ເອົາ.

4

ຊອກຫາ​ແບບ​ທີ່​ເໝາະສົມ​ກັບ​ທ່ານ

ນໍາໃຊ້ຂໍ້ມູນ leaderboard ແລະ ຄະແນນຊຸມຊົນເພື່ອເລືອກແບບທີ່ດີທີ່ສຸດສໍາລັບກໍລະນີການນໍາໃຊ້ສະເພາະຂອງທ່ານ, ງົບປະມານ, ແລະ ຄວາມຕ້ອງການຄຸນນະພາບ.

TTS Arena ແມ່ນຫຍັງ?

ວິທີການທີ່ນຳພາໂດຍຊຸມຊົນເພື່ອຈັດອັນດັບແບບຟອມສຽງ AI

ການ​ປຽບທຽບ A/B ແບບ​ບິດເບືອນ

ສະໜາມສະແດງຂໍ້ຄວາມດຽວກັນທີ່ເວົ້າໂດຍສອງແບບທີ່ເລືອກແບບຊະຊາຍ. ທ່ານຟັງຕົວຢ່າງທັງສອງໂດຍບໍ່ຮູ້ຈັກວ່າແບບໃດທີ່ສ້າງພວກມັນ, ຈາກນັ້ນລົງຄະແນນສຽງ ສຳ ລັບອັນ ໜຶ່ງ ທີ່ຟັງຄືກັບ ທຳ ມະຊາດກວ່າ. ການທົດສອບແບບບັງເອີນນີ້ ກຳຈັດຄວາມຜິດພາດຂອງຍີ່ຫໍ້ແລະບັງຄັບໃຫ້ມີການຕັດສິນໂດຍອີງໃສ່ຄຸນນະພາບສຽງເທົ່ານັ້ນ.

  • ຂໍ້ຄວາມ​ຄືກັນ, ແບບ​ທີ່​ບໍ່​ມີ​ຊື່​ສອງ​ແບບ
  • ຊື່ຂອງແບບທີ່ເປີດເຜີຍຫຼັງຈາກການລົງຄະແນນສຽງ
  • ຄູ່​ຊະ​ນະ​ໃໝ່​ທຸກ​ຮອບ
  • ບໍ່ມີ​ຄວາມ​ຜິດພາດ​ຂອງ​ຍີ່ຫໍ້ - ຄຸນນະພາບ​ສຽງ​ທີ່​ສະອາດ

ລະບົບ​ຈັດ​ອັນ​ດັບ Elo

ແບບແມ່ນຖືກຈັດອັນດັບໂດຍໃຊ້ລະບົບຈັດອັນດັບ Elo, ຄືກັນກັບ algorithm ທີ່ໃຊ້ໃນການຈັດອັນດັບຜູ້ຫຼິ້ນກ໊ອກ. ການຊະນະຕໍ່ຕ້ານແບບທີ່ມີຄະແນນສູງກວ່າຈະໄດ້ຮັບຄະແນນຫຼາຍກ່ວາການຊະນະຕໍ່ຕ້ານແບບທີ່ມີຄະແນນຕ່ຳກວ່າ. ຜ່ານການລົງຄະແນນສຽງຫຼາຍພັນ, ນີ້ແມ່ນຜະລິດການຈັດອັນດັບທີ່ເຊື່ອຖືໄດ້ເຊິ່ງສະແດງໃຫ້ເຫັນຄວາມມັກຂອງຊຸມຊົນທີ່ແທ້ຈິງ.

  • ລະຫັດ​ຈັດອັນດັບ​ອີງ​ໃສ່ Elo
  • ການ​ຈັດ​ອັນດັບ​ປັບ​ຕົວ​ກັບ​ຄະແນນ​ສຽງ​ແຕ່ລະ​ຄັ້ງ
  • ໄລຍະ​ເວລາ​ເຊື່ອ​ຖື​ທາງ​ສະຖິຕິ
  • ຈັດອັນດັບ​ຈະ​ໝັ້ນຄົງ​ຕາມ​ເວລາ

ການ​ເບິ່ງ​ແບບ​ກ່ອນ​ການ​ປຽບທຽບ​ແບບ

ວິທີການຂອງພວກເຮົາ 20 + ແບບຈໍາລອງທຽບເທົ່າ across key dimensions

ແບບ ສັດ ຄຸນນະພາບ ຄວາມ​ໄວ ພາສາ ​ກັ່ນຕອງ
Kokoro ຟຣີ 4.5/5 ​រហ័ស 8
Bark ມາດຕະຖານ 4.0/5 ກາງ 13
CosyVoice2 ມາດຕະຖານ 4.5/5 ກາງ 6
Tortoise TTS ລາຄາ​ຖືກ 4.8/5 ​ຊ້າ 1
Chatterbox ລາຄາ​ຖືກ 4.7/5 ກາງ 1
StyleTTS 2 ລາຄາ​ຖືກ 4.7/5 ​រហ័ស 1

ມາດຖານ​ການ​ຕີລາຄາ

ສິ່ງທີ່ເຮັດໃຫ້ແບບ TTS ຂຶ້ນອັນດັບສູງຂຶ້ນໃນເວທີ

ທໍາມະຊາດ

ມັນ​ມີ​ສຽງ​ຄື​ກັບ​ຄົນ​ຈິງ​ບໍ? ການ​ເວົ້າ​ແບບ​ທຳ​ມະ​ຊາດ, ​ຈັງຫວະ, ແລະ ແບບ​ຟອມ​ການ​ເວົ້າ​ທີ່​ເໝາະສົມ​ກັບ​ການ​ເວົ້າ​ຂອງ​ມະນຸດ. ບໍ່ມີ​ເຄື່ອງ​ຈັກ ຫຼື ການ​ຢຸດ​ຊົ່ວ​ຄາວ​ທີ່​ບໍ່​ເປັນ​ທຳ​ມະ​ຊາດ.

ສະແດງ​ອອກ

ສຽງສົ່ງຄວາມຮູ້ສຶກທີ່ເໝາະສົມແລະເນັ້ນຫນັກບໍ? ຕົວແບບທີ່ດີຈັດການກັບຄໍາຖາມ, ການຮ້ອງໄຫ້, ແລະສະພາບແວດລ້ອມຂອງອາລົມໂດຍທໍາມະຊາດ.

ຄວາມ​ຖືກຕ້ອງ

ເວົ້າ​ຄຳ​ທຸກ​ຄຳ​ໄດ້​ບໍ່? ຈັດການ​ຄຳ​ທີ່​ບໍ່​ປົກກະຕິ, ຕົວເລກ, ຫຍໍ້, ແລະ ຊື່​ຕ່າງປະ​ເທດ​ໂດຍ​ບໍ່​ມີ​ຂໍ້ຜິດພາດ ຫຼື ສຽງ​ທີ່​ບໍ່​ເປັນ​ຈິງ.

ຊ່ວຍຈັດອັນດັບສຽງ AI ທີ່ດີທີ່ສຸດ

ການລົງຄະແນນສຽງຂອງທ່ານມີອິດທິພົນຕໍ່ຕາຕະລາງອັນດັບໂດຍກົງ. ການປຽບທຽບທຸກຢ່າງຊ່ວຍຊຸມຊົນໃນການຊອກຫາແບບທີ່ດີທີ່ສຸດ.

ເຂົ້າ​ສູ່​ເວທີ TTS

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ຄໍາຖາມທົ່ວໄປກ່ຽວກັບ TTS Arena ແລະ ການຈັດອັນດັບແບບ

The TTS Arena ເປັນ leaderboard ແລະເຄື່ອງມືປຽບທຽບສໍາລັບ AI ແບບຈໍາລອງຂໍ້ຄວາມ-ເປັນ-ຄໍາເວົ້າ. ມັນຈັດອັນດັບ 20+ ແບບຈໍາລອງອີງໃສ່ benchmarks ທາງການແລະຄະແນນສຽງຂອງຊຸມຊົນ, ຊ່ວຍຜູ້ໃຊ້ຊອກຫາແບບຈໍາລອງທີ່ດີທີ່ສຸດສໍາລັບຄວາມຕ້ອງການຂອງເຂົາເຈົ້າຜ່ານການວິເຄາະມາດຕະຖານແລະ side-by-side ການປຽບທຽບ.

ຕົວແບບແມ່ນຖືກຕີລາຄາໂດຍອີງໃສ່ຕົວຊີ້ວັດຫຼາຍຢ່າງ: MOS (Mean Opinion Score) ສຳ ລັບຄຸນນະພາບຂອງບຸກຄົນ, ອັດຕາຄວາມຜິດພາດຂອງຕົວອັກສອນ ສຳ ລັບຄວາມຖືກຕ້ອງຂອງການອອກສຽງ, ຕົວຊີ້ວັດເວລາຈິງ ສຳ ລັບຄວາມໄວ, ການໃຊ້ VRAM ສຳ ລັບປະສິດຕິພາບ, ແລະ ການລົງຄະແນນສຽງຂອງຊຸມຊົນ ສຳ ລັບຄວາມມັກໃນໂລກຈິງ. ຄະແນນແມ່ນຖືກວັດແທກເພື່ອຜະລິດການຈັດອັນດັບລວມ.

MOS ແມ່ນມາດຕະຖານວັດແທກເພື່ອຕີລາຄາຄຸນນະພາບຂອງສຽງ. ຜູ້ຟັງຄົນຈັດການຕົວຢ່າງຂອງສຽງໃນລະດັບ 1-5 ສຳ ລັບທໍາມະຊາດ. ຄະແນນທີ່ສູງກວ່າ 4.0 ແມ່ນຖືວ່າໃກ້ກັບຄຸນນະພາບຂອງມະນຸດ. ແບບທີ່ດີທີ່ສຸດຂອງພວກເຮົາບັນລຸຄະແນນ MOS ຂອງ 4.2-4.5, ແຂ່ງຂັນກັບການບັນທຶກສຽງທໍາມະຊາດຂອງມະນຸດ.

ການຈັດອັນດັບແມ່ນຂຶ້ນກັບເງື່ອນໄຂ. Kokoro ນໍາພາໃນອັດຕາສ່ວນຄວາມໄວ-ຄຸນນະພາບ. StyleTTS2ບັນລຸ MOS ທີ່ມີຜູ້ເວົ້າຄົນດຽວສູງທີ່ສຸດ. Chatterbox ນໍາພາການຈັດອັນດັບການກັ່ນຕອງສຽງ. CosyVoice2ນໍາພາຄຸນນະພາບຫຼາຍພາສາ. ກວດເບິ່ງຕາຕະລາງອັນດັບສໍາລັບການຈັດອັນດັບປະຈຸບັນໃນແຕ່ລະປະເພດ.

ແມ່ນແລ້ວ. ຟັງການປຽບທຽບໃກ້ຄຽງແລະລົງຄະແນນສຽງສໍາລັບແບບທີ່ສຽງດີກວ່າ. ການລົງຄະແນນສຽງແມ່ນຟຣີແລະບໍ່ຈໍາເປັນຕ້ອງມີບັນຊີ. ການລົງຄະແນນສຽງຂອງຊຸມຊົນມີອິດທິພົນໂດຍກົງຕໍ່ການຈັດອັນດັບແລະຊ່ວຍເຮັດໃຫ້ມີແບບທີ່ດີທີ່ສຸດສໍາລັບກໍລະນີການໃຊ້ທີ່ແຕກຕ່າງກັນ.

ມາດຕະຖານທາງການແມ່ນໄດ້ປັບປຸງເມື່ອມີແບບໃຫມ່ຖືກເພີ່ມຫຼືແບບທີ່ມີຢູ່ແລ້ວໄດ້ຮັບການປັບປຸງທີ່ສໍາຄັນ. ການຈັດອັນດັບຊຸມຊົນໄດ້ປັບປຸງໃນເວລາຈິງໃນເວລາທີ່ການລົງຄະແນນສຽງມາໃນ. ພວກເຮົາທົບທວນຄືນທຸກແບບທຸກເດືອນເພື່ອຮັບປະກັນການທຽບເທົ່າທີ່ສອດຄ່ອງແລະຍຸຕິທໍາ.

ອັດຕາ​ຂໍ້ຜິດພາດ​ຕົວອັກສອນ (CER) ວັດແທກ​ຄວາມ​ຖືກຕ້ອງ​ຂອງ​ການ​ອອກສຽງ​ໂດຍ​ການ​ແປ​ຄຳ​ເວົ້າ​ທີ່​ໄດ້​ສ້າງ​ຂຶ້ນ​ມາ ແລະ​ປຽບທຽບ​ມັນ​ກັບ​ຂໍ້ຄວາມ​ທີ່​ໄດ້​ເຂົ້າ​ມາ. CER ທີ່​ຕ່ຳ​ກວ່າ ໝາຍ​ຄວາມ​ວ່າ ຕົວແບບ​ອອກສຽງ​ຄຳ​ເວົ້າ​ໄດ້​ຢ່າງ​ຖືກຕ້ອງ​ກວ່າ. ຕົວແບບ​ເຊັ່ນ Kokoro ແລະ Sesame CSM ບັນລຸ​ຄະແນນ CER ທີ່​ດີ​ເລີດ.

ບັນທຶກ​ຕົວຢ່າງ​ຂໍ້ຄວາມ, ເລືອກ​ຕົວແບບ​ສອງ​ຕົວ, ແລະ​ຄລິກ​ໃສ່​ສ້າງ. ຕົວແບບ​ທັງ​ສອງ​ຈະ​ຜະລິດ​ສຽງ​ຈາກ​ຂໍ້ຄວາມ​ດຽວ​ກັນ. ຟັງ​ຜົນ​ອອກ​ມາ​ທັງ​ສອງ​ຢ່າງ ແລະ​ຕັດສິນ​ວ່າ​ສຽງ​ອັນ​ໃດ​ມີ​ສຽງ​ທີ່​ເປັນ​ທຳ​ມະ​ຊາດ​ກວ່າ, ແຈ້ງ​ກວ່າ, ແລະ​ມີ​ຄວາມ​ໝາຍ​ຫຼາຍ​ກວ່າ. ຫຼັງຈາກ​ນັ້ນ, ທ່ານ​ສາມາດ​ລົງຄະແນນ​ສຽງ​ສຳລັບ​ຕົວແບບ​ທີ່​ທ່ານ​ມັກ.

ແມ່ນແລ້ວ. ພວກເຮົາປ່ອຍອອກມາວິທີການ benchmark ຂອງພວກເຮົາ, ຄໍາຖາມການທົດສອບ, ແລະມາດຕະຖານການວິເຄາະ. ທຸກໆແບບໄດ້ຖືກທົດສອບພາຍໃຕ້ເງື່ອນໄຂທີ່ຄ້າຍຄືກັນໃນຮາດແວ GPU ດຽວກັນ. ສະມາຊິກຊຸມຊົນສາມາດຜະລິດຜົນໄດ້ຮັບໂດຍໃຊ້ຊຸດການທົດສອບທີ່ປ່ອຍອອກມາຂອງພວກເຮົາແລະຄະແນນ rubrics.

ສະຫນາມສຸມໃສ່ 20+ ແບບ open-source ທີ່ຈັດຂຶ້ນໃນ TTS.ai. ພວກເຮົາບໍ່ໂດຍກົງ benchmark ການບໍລິການການຄ້າເຊັ່ນ ElevenLabs ຫຼື Google TTS, ແຕ່ຄະແນນ MOS ແລະຕົວຊີ້ວັດຂອງພວກເຮົາແມ່ນສາມາດທຽບເທົ່າກັບ benchmarks ເຜີຍແຜ່ຈາກການບໍລິການເຫຼົ່ານີ້.

ພິຈາລະນາ​ຄວາມ​ສຳຄັນ​ຂອງ​ທ່ານ: ຄວາມ​ໄວ (ຄວາມ​ຕ້ອງການ​ເວລາ​ຈິງ versus ການ​ປະມວນຜົນ​ແຖວ), ຄຸນນະພາບ (ຄະແນນ MOS), ການ​ສະໜັບສະໜູນ​ພາສາ, ຄຸນສົມບັດ​ພິເສດ (ການ​ກັ່ນຕອງ​ສຽງ, ການ​ຄວບຄຸມ​ອາລົມ, ຂໍ້​ຄວາມ​ສົນທະນາ), ເງື່ອນໄຂ​ໃບອະນຸຍາດ, ແລະ ງົບປະມານ (ຟຣີ versus ລະດັບ​ປະຢັດ). ຕົວກັ່ນຕອງ​ພື້ນ​ທີ່​ຊ່ວຍ​ໃຫ້​ເລືອກ​ທີ່​ກວ້າງ​ຂວາງ​ໂດຍ​ມາດຖານ​ເຫຼົ່ານີ້.

Kokoro (ຟຣີ) ບັນລຸໄດ້ 5/5 ຄະແນນຄຸນນະພາບ, ກົງກັບຫຼາຍແບບ premium. ຜົນປະໂຫຍດຕົ້ນຕໍຂອງແບບ premium ແມ່ນຄຸນລັກສະນະພິເສດເຊັ່ນ: ການກັ່ນຕອງສຽງ (Chatterbox), ແບບແຜ່ກະຈາຍ (StyleTTS 2), ແລະ ການສົນທະນາ (Sesame CSM) ແທນທີ່ຈະເປັນຄຸນນະພາບສຽງ raw.
5.0/5 (1)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ລົງຄະແນນສຽງໃນ TTS Arena

ຟັງສຽງຂອງ AI, ລົງຄະແນນສຽງສໍາລັບທີ່ດີທີ່ສຸດ, ແລະຄົ້ນຫາ leaderboard ຊຸມຊົນ-ຂັບເຄື່ອນຂອງ 20+ ແບບ.