TTS ເວລາຈິງ

ສົ່ງຂໍ້ຄວາມ-ເປັນ-ຄຳເວົ້າຜ່ານການລໍຖ້າສຽງຄັ້ງທຳອິດທີ່ມີໄລຍະເວລາສັ້ນໆ. ສ້າງຂຶ້ນເພື່ອຜູ້ສື່ສານສຽງ ແລະ ໂປແກຼມທີ່ໃຊ້ໄດ້ຈິງ.

ລົງທະບຽນຟຣີ

ພວກເຮົາຍັງບໍ່ມີສຽງ TTS ໃນພາສາຂອງທ່ານເທື່ອ. ຊ່ວຍພວກເຮົາເພີ່ມສຽງຂອງທ່ານ! ຂາຍສຽງຂອງທ່ານ

អត្ថបទ

ສົ່ງຕໍ່

0/5,000 តួអក្សរ ~0.3s អូឌីយ៉ូដំបូង

ການຕັ້ງຄ່າສຽງ

ແບບ ແບບທີ່ຮອງຮັບການຖ່າຍທອດສົດເທົ່ານັ້ນ.

ສຽງ

ຄວາມໄວ 1.0x

ເວລາລໍຖ້າສົດ

—

ກົດໃສ່ສົດ ເພື່ອວັດຄວາມລໍຖ້າສຽງຄັ້ງທຳອິດ

ຜົນອອກມາ

ສຽງຈະຖືກຫຼີ້ນຢູ່ທີ່ນີ້ ໃນຂະນະທີ່ມັນຖືກສົ່ງເຂົ້າມາ.

ວິທີການ Stream TTS ເຮັດວຽກ

1. ສົ່ງຂໍ້ຄວາມ

ສົ່ງຂໍ້ຄວາມໄປຫາ /v1/tts/stream/ ຄືກັບຄໍາຮ້ອງຂໍເຫດການທີ່ສົ່ງໂດຍເຄື່ອງບໍລິການ.

2. ແບບຈໍາລອງສ້າງ

Kokoro ແບ່ງຂໍ້ຄວາມອອກເປັນສ່ວນໆ ແລະ ສ້າງຕົວຢ່າງສຽງຕາມຕົວຢ່າງທີ່ GPU.

3. ຖ່າຍທອດຊ່ອງສົດ

ຂໍ້ຄວາມທີ່ໄດ້ຮັບການເຂົ້າລະຫັດແບບ Base64 ຈະມາເຖິງຜ່ານ SSE ແລະ ເລີ່ມການຫຼິ້ນທັນທີ.

4. ຟັງສົດ

ຜູ້ໃຊ້ໄດ້ຍິນການເລີ່ມຕົ້ນຂອງຄໍາສັບໃນພາຍໃຕ້ວິນາທີ, ເຖິງແມ່ນວ່າຈະຢູ່ໃນການເຂົ້າລະຫັດຍາວ.

ກໍລະນີໃຊ້

ບ່ອນທີ່ຄວາມລໍຖ້າພາຍໃຕ້ວິນາທີເປີດປະສົບການໃໝ່.

ຕົວແທນສຽງ

ຕົວແປການສົນທະນາທີ່ຕອບໂຕ້ໄວເທົ່າກັບມະນຸດ.

ສຽງດັງ

ແປ ແລະ ແປສຽງສົດໃນເວລາຈິງໂດຍບໍ່ຕ້ອງຢຸດຊົ່ວຄາວການເກັບໄວ້ໃນສະໝອງ.

ເກມName

ຂໍ້ຄວາມທີ່ບໍ່ມີຕົວອັກສອນທີ່ຖືກສະແດງກ່ອນໜ້ານີ້

ຄວາມສາມາດໃນການເຂົ້າເຖິງ

ເຄື່ອງມືອ່ານໜ້າຈໍ ແລະ ເຄື່ອງມືຊ່ວຍເຫຼືອທີ່ເລີ່ມເວົ້າເມື່ອຜູ້ໃຊ້ຄລິກໃສ່ມັນ.

ແຜນ TTS ເວລາຈິງ

ເລີ່ມຕົ້ນຟຣີ, ປັບປຸງເມື່ອທ່ານຕ້ອງການຫຼາຍຂຶ້ນ

ບໍ່ມີ

Kokoro ສົ່ງຕໍ່ (ແບບຟອມຟຣີ)
500 តួអក្សរຕໍ່ການສ້າງ
10 ສາຍຟຣີ / ວັນຕໍ່ຜູ້ໃຊ້ທີ່ບໍ່ລະບຸຊື່
ສຽງກ່ອນໜ້າທີ່ຊົ່ວຊົ່ວໂມງ
ສົ່ງຜ່ານ SSE ຜ່ານ HTTPS

ນິຍົມທີ່ສຸດ

ບັນຊີຟຣີ

15,000 ຕົວອັກສອນເມື່ອລົງທະບຽນ
5,000 ຕົວອັກສອນຕໍ່ສົດ
ກຸນແຈ API ສຳລັບການເຂົ້າໃຊ້ໂປຣແກມ
ប្រវត្តិການສ້າງ
ບໍ່ມີຂີດຈຳກັດການຖ່າຍທອດຕໍ່ມື້

ລົງທະບຽນຟຣີ

ມືອາຊີບ

MOSS- TTS- Realtime (ເມື່ອມີຊີວິດ)
100,000 ຕົວອັກສອນຕໍ່ສົດ
ជួរ GPU ដែលមានអាទិភាព
ຕົວແທນສຽງ + ການລວມເຂົ້າ Twilio
ຈໍາກັດອັດຕາສູງ

ຍົກລະດັບ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າໃນເວລາຈິງ ສົ່ງສຽງທີ່ສ້າງຂຶ້ນມາ, ແທນທີ່ຈະລໍຖ້າໃຫ້ຄຳສັບທັງ ໝົດ ສໍາເລັດ. ຕົວຢ່າງສຽງຄັ້ງທໍາອິດມາຮອດໃນພາຍໃຕ້ວິນາທີຫນຶ່ງ, ເຮັດໃຫ້ມັນ ເໝາະ ສົມກັບຕົວແທນສຽງ, ການດັດແກ້ສຽງ, ແລະ ຄໍາຮ້ອງສະຫມັກທີ່ມີການໂຕ້ຕອບທີ່ຄວາມຊັກຊ້າແມ່ນມີຄວາມສໍາຄັນ.

TTS ປົກກະຕິຈະສ້າງໄຟລ໌ສຽງເຕັມກ່ອນທີ່ຈະສົ່ງຄືນສິ່ງໃດສິ່ງໜຶ່ງ — ທ່ານຕ້ອງລໍຖ້າ, ຫຼັງຈາກນັ້ນທ່ານຈະໄດ້ຍິນຄຳສັບທັງໝົດໃນຄັ້ງດຽວກັນ. TTS ເວລາຈິງໃຊ້ເຫດການສົ່ງໂດຍເຄື່ອງບໍລິການ (SSE) ເພື່ອສົ່ງສຽງສັ້ນໆຕາມທີ່ຕົວແບບຜະລິດພວກມັນອອກມາ. ຜູ້ໃຊ້ຈະໄດ້ຍິນການເລີ່ມຕົ້ນຂອງຄຳສັບເກືອບທັນທີ, ເຖິງແມ່ນຈະມີການເຂົ້າຂໍ້ມູນທີ່ຍາວກໍຕາມ.

Kokoro ແມ່ນ backend ແບບປິດບັງ — ມັນຜະລິດສຽງໄດ້ໄວກວ່າເວລາຈິງປະມານ 100x ກວ່າໃນ GPU ແບບທັນສະໄໝ. ພວກເຮົາໄດ້ລວມເອົາ MOSS-TTS-Realtime ເປັນທາງເລືອກທີ່ມີຄຸນນະພາບສູງຂຶ້ນ; ຜູ້ໃຊ້ຈະສາມາດເລືອກຕາມການຮ້ອງຂໍເມື່ອມັນຖືກສົ່ງອອກແລ້ວ.

ເວລາລໍຖ້າສຽງຄັ້ງທຳອິດທີ່ປົກກະຕິໃນ Kokoro ແມ່ນ 300-800ms ຜ່ານການເຊື່ອມຕໍ່ສາທາລະນະ. ການໄປມາຫາສູ່ຂອງເຄືອຂ່າຍແມ່ນຄອບຄອງຫຼັງຈາກນັ້ນ. ຫນ້າສະແດງເວລາທີ່ວັດແທກໂດຍກົງເຖິງສຽງຄັ້ງທຳອິດໃນ UI ສະນັ້ນທ່ານສາມາດເຫັນໄດ້ວ່າແຕ່ລະຄໍາຮ້ອງຂໍໃຊ້ເວລາດົນປານໃດ.

ຕົວແທນສຽງທີ່ຕອບໂຕ້ໃນການສົນທະນາ, ການດັດແກ້ສຽງເພື່ອການຖ່າຍທອດສົດ, ເກມ NPCs ແບບໂຕ້ຕອບ, ການອ່ານທີ່ເຂົ້າເຖິງໄດ້ເຊິ່ງເລີ່ມເວົ້າໃນຕອນທີ່ຜູ້ໃຊ້ຄລິກ, ແລະ ທຸກໆແອັບພລິເຄຊັນທີ່ລໍຖ້າສອງຫຼືສາມວິນາທີ ສຳ ລັບສຽງຈະຮູ້ສຶກຊ້າ.

ຍິນດີຕ້ອນຮັບ. POST to https://api.tts.ai/v1/tts/stream/ with the same body as the regular /v1/tts/ endpoint. The response is an SSE stream of base64-encoded WAV chunks. The free tier supports 10 generations per day per anonymous user; authenticated users get the full per-account character allowance.

Kokoro ໃຊ້ສຽງທີ່ຝຶກມາກ່ອນ ແລະ ບໍ່ເຮັດການກັ່ນຕອງ. MOSS-TTS-Realtime (ເມື່ອລວມເຂົ້າກັນ) ສະໜັບສະໜູນການກັ່ນຕອງສຽງແບບ zero-shot ຈາກການອ້າງອີງ3ວິນາທີ. ສຳ ລັບກັ່ນຕອງສຽງເຕັມໃນມື້ນີ້, ໃຊ້ ໜ້າ / text-to-speech / ປົກກະຕິກັບ Chatterbox ຫຼື GPT-SoVITS - ພວກເຂົາບໍ່ສາມາດຖ່າຍທອດໄດ້ແຕ່ຜະລິດສຽງທີ່ປັບແຕ່ງໄດ້.

ຄ່າໃຊ້ຈ່າຍຂອງຕົວອັກສອນຄືກັນກັບຈຸດສຸດທ້າຍ TTS ປົກກະຕິ. Kokoro ແມ່ນຟຣີ-ທຽມ (ຄ່າໃຊ້ຈ່າຍ 1x). MOSS-TTS-Realtime ຈະແລ່ນຢູ່ທີ່ທຽມມາດຕະຖານ (ຄ່າໃຊ້ຈ່າຍ 2x) ເມື່ອເປີດໃຊ້. ລະຫັດຜ່ານການຖ່າຍທອດບໍ່ໄດ້ເພີ່ມຄ່າໃຊ້ຈ່າຍເພີ່ມໃດໆ.

ຍິນດີຕ້ອນຮັບ - ຄູ່ຂອງຈຸດສຸດທ້າຍການຖ່າຍທອດສົດກັບສຽງ Twilio webhook ເພື່ອສະຫນອງສຽງສົດເຂົ້າໄປໃນການໂທ. ເວທີຕົວແທນສຽງຂອງພວກເຮົາໄດ້ເຮັດສິ່ງນີ້ສໍາລັບ IVR ແລະໂທອອກ. ສຸດທ້າຍເຖິງສຸດທ້າຍ latency ກ່ຽວກັບໂທລະສັບແມ່ນປົກກະຕິແລ້ວ 1-2 ວິນາທີລວມທັງ STT ແລະ LLM ການຕອບສະຫນອງ.

ຖ້າເຄືອຂ່າຍຂອງທ່ານລົ້ມລົງໃນການສົ່ງຕໍ່, ຕົວຫຼິ້ນສົດຈະຂ້າມໄປໜ້າ ແທນທີ່ຈະຢຸດ. ສຳລັບកម្មវិធីທີ່ບໍ່ສາມາດທົນຄວາມຫວ່າງໄດ້, ຫຼຸດລົງໄປຫາຈຸດສຸດທ້າຍທີ່ບໍ່ສົດປົກກະຕິ ຫຼື ເກັບສຽງໄວ້ 500ms ກ່ອນທີ່ຈະເລີ່ມການຫຼິ້ນ.

5.0/5 (1)

ສົ່ງສຽງອອກມາທັນທີName

ຟຣີສໍາລັບ 10 ຄັ້ງທໍາອິດຂອງມື້. ລົງທະບຽນເພື່ອເປີດຕົວອັກສອນທີ່ອະນຸຍາດເຕັມແລະ API ເຂົ້າເຖິງ.

ລົງທະບຽນຟຣີ ເບິ່ງລາຄາ

TTS ເວລາ​ຈິງ

អត្ថបទ

ການ​ຕັ້ງຄ່າ​ສຽງ

ເວລາ​ລໍຖ້າ​ສົດ

ຜົນ​ອອກ​ມາ

ວິທີການ Stream TTS ເຮັດວຽກ

1. ສົ່ງຂໍ້ຄວາມ

2. ແບບຈໍາລອງສ້າງ

3. ຖ່າຍ​ທອດ​ຊ່ອງ​ສົດ

4. ຟັງ​ສົດ

ກໍລະນີ​ໃຊ້

ຕົວແທນ​ສຽງ

ສຽງ​ດັງ​

ເກມName

ຄວາມສາມາດ​ໃນ​ການ​ເຂົ້າເຖິງ

ແຜນ TTS ເວລາຈິງ

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

TTS ແບບເວລາຈິງແມ່ນຫຍັງ?

TTS ແບບຈິງເວລາແຕກຕ່າງຈາກ TTS ແບບປົກກະຕິແນວໃດ?

ແບບໃດທີ່​ໃຊ້​ງານ​ໜ້າ​ເວລາ​ຈິງ?

ເວລາລໍຖ້າສຽງຄັ້ງທຳອິດໄວເທົ່າໃດ?

ຂ້ອຍສາມາດສ້າງຫຍັງໄດ້ກັບ TTS ແບບຈິງ?

ມີ API ສໍາລັບ TTS ໃນເວລາຈິງບໍ?

ມັນ​ສະໜັບສະໜູນ​ການ​ກັ່ນຕອງ​ສຽງ​ບໍ?

ຄ່າໃຊ້ຈ່າຍຂອງ TTS ໃນເວລາຈິງແມ່ນເທົ່າໃດ?

ຂ້ອຍສາມາດໃຊ້ມັນໄດ້ໃນໂທລະສັບ?

ບາງຄັ້ງສຽງຈະຖືກຕັດອອກກາງຄໍາ?

ສົ່ງ​ສຽງ​ອອກ​ມາ​ທັນ​ທີName