ກ່ຽວກັບ
20+ ແບບ, 100+ ສຽງ, ທັງຫມົດໃນຫນຶ່ງບ່ອນ.
ສ້າງໂດຍ
TTS.ai ຖືກສ້າງຂຶ້ນໂດຍ John Nader (nadermx), TTS.ai ແມ່ນສ່ວນຫນຶ່ງຂອງພາລະກິດເພື່ອເຮັດໃຫ້ເຕັກໂນໂລຊີສຽງ AI ທີ່ດີທີ່ສຸດເຂົ້າເຖິງທຸກໆຄົນ - ບໍ່ມີຜູ້ຂາຍລັອກໃນ, ບໍ່ມີຂໍ້ມູນເກັບກໍາ, ພຽງແຕ່ເຕັກໂນໂລຊີສຽງທີ່ມີປະສິດທິພາບໃນລາຄາທີ່ຍຸຕິທໍາ.
ພາລະກິດຂອງພວກເຮົາ
TTS.ai ຖືກສ້າງຂຶ້ນໂດຍອີງໃສ່ຄວາມເຊື່ອທີ່ງ່າຍດາຍ: ເຕັກໂນໂລຊີສຽງ AI ທີ່ດີທີ່ສຸດຄວນຈະສາມາດເຂົ້າເຖິງໄດ້ ສຳ ລັບທຸກຄົນ. ໃນຂະນະທີ່ການບໍລິການທີ່ມີລິຂະສິດເກັບຄ່າໃຊ້ຈ່າຍສູງ ສຳ ລັບຂໍ້ຄວາມ-ເປັນ-ຄຳເວົ້າພື້ນຖານ, ຊຸມຊົນ Open Source ໄດ້ສ້າງແບບ ຈຳ ລອງທີ່ທຽບເທົ່າຫຼືເກີນກວ່າຄຸນະພາບທາງການຄ້າ.
ພວກເຮົານໍາເອົາແບບຈໍາລອງສຽງ AI ທີ່ມີແຫຼ່ງເປີດທີ່ດີທີ່ສຸດມາສູ່ເວທີດຽວ, ງ່າຍຕໍ່ການໃຊ້ງານ. ບໍ່ມີຜູ້ຂາຍລັອກໃນ. ບໍ່ມີການເກັບກໍາຂໍ້ມູນ. ພຽງແຕ່ເຕັກໂນໂລຢີສຽງທີ່ມີປະສິດທິພາບໃນລາຄາທີ່ເໝາະສົມ.
ສິ່ງທີ່ພວກເຮົາສະເຫນີ
ຂໍ້ຄວາມເປັນການເວົ້າName
20+ ແບບລວມມີ Kokoro, Chatterbox, Bark, ແລະອື່ນໆ. ຈາກການສັງເຄາະເບົາໄວໄປຫາຜົນຜະລິດທີ່ມີຄຸນນະພາບຂອງສະຕູດິໂອ.
ແປຄຳເວົ້າເປັນຂໍ້ຄວາມName
Powered by Whisper, Faster-Whisper, ແລະ SenseVoice. ແປສຽງໃນ 100 + ພາສາທີ່ມີ timestamps ແລະຜູ້ເວົ້າການກວດພົບ.
ການກັ່ນຕອງສຽງ
ຄລີນສຽງໃດໆຈາກຕົວຢ່າງ5ວິນາທີ. Chatterbox, GPT-SoVITS, CosyVoice 2, ແລະອື່ນໆ. ສ້າງສຽງທີ່ປັບແຕ່ງເອງ ສຳ ລັບໂຄງການຂອງທ່ານ.
ການປະມວນຜົນສຽງ
ຍົກລະດັບສຽງ, ເອົາອອກສຽງ, ແບ່ງແຍກ stems, ເອົາອອກ echo/reverb, ກວດພົບປຸ່ມ/BPM, ແລະ ປ່ຽນຮູບແບບ. ທຸກຢ່າງໂດຍ AI.
ການສົນທະນາດ້ວຍສຽງ
ການສົນທະນາສຽງໃນເວລາຈິງດ້ວຍ AI. ເລືອກແບບແລະສຽງຂອງທ່ານເພື່ອປະສົບການການສົນທະນາແບບໂຕ້ຕອບ.
កម្មវិធីພັດທະນາ
REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. Python SDK, ຕົວຢ່າງໂປຣແກຣມ, ແລະ ເອກະສານທີ່ກວ້າງຂວາງ. ສ້າງຄຸນສົມບັດສຽງເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານ.
ແຫຼ່ງເປີດກ່ອນ
ທຸກໆແບບໃນ TTS.ai ແມ່ນ Open Source, ໄດ້ຮັບອະນຸຍາດພາຍໃຕ້ MIT ຫຼື Apache 2.0. ພວກເຮົາເຊື່ອໃນຄວາມໂປ່ງໃສແລະນະວັດຕະກໍາທີ່ຂັບເຄື່ອນໂດຍຊຸມຊົນ.
ພວກເຮົາເຮັດ
ນໍ້າໜັກແບບຈຳລອງທັງໝົດຖືກດາວໂຫລດຈາກບ່ອນເກັບຂໍ້ມູນທາງການຂອງພວກມັນ. ພວກເຮົາບໍ່ເພີ່ມການປ່ຽນແປງທີ່ບໍ່ມີສິດ.
ພື້ນຖານໂຄງລ່າງ
TTS.ai ແລ່ນຢູ່ໃນເຊີບເວີ GPU ທີ່ອຸທິດຕົນດ້ວຍ NVIDIA Tesla P40 GPUs (96GB VRAM ລວມ). ພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາໄດ້ຖືກອອກແບບ ສຳ ລັບ latency ຕ່ ຳ ແລະ ຄວາມໄວສູງ:
- GPU clusters ສຳລັບການຄິດໄລ່ - ບໍ່ມີຊັບພະຍາກອນທີ່ແບ່ງປັນ
- ການແບ່ງປັນ GPU ແບບດັ້ງເດີມອີງຕາມຄວາມຕ້ອງການຂອງໂມເດັມ VRAM
- ລະບົບຄວາມສໍາຄັນ 5- queue ສຳ ລັບຄວາມສາມາດໃນການສົ່ງອອກທີ່ດີທີ່ສຸດ
- ຕົວແບບທີ່ໄດ້ເກັບໄວ້ກ່ອນໃນ VRAM ສຳລັບການຄິດໄລ່ທັນທີ
- CDN-backed ການສົ່ງສຽງເພື່ອດາວໂຫລດໄວ
ຄວາມເປັນສ່ວນຕົວ ແລະ ຄວາມປອດໄພ
- ບໍ່ມີການຝຶກອົບຮົມຂໍ້ມູນ: ພວກເຮົາບໍ່ເຄີຍໃຊ້ສຽງ ຫຼື ຂໍ້ຄວາມຂອງທ່ານເພື່ອຝຶກຕົວແບບ
- ການລຶບស្វ័យប្រវត្តិ: ສຽງທີ່ໄດ້ສ້າງຈະຖືກລຶບອອກໂດຍອັດຕະໂນມັດ ຫຼັງຈາກ 24 ຊົ່ວໂມງ
- ການເຂົ້າລະຫັດ & # 160; ៖ ຂໍ້ມູນທັງໝົດຖືກເຂົ້າລະຫັດເມື່ອສົ່ງ (TLS 1. 2+) ແລະ ເມື່ອບໍ່ໃຊ້
- ບໍ່ມີການຕິດຕາມ: ພວກເຮົາເຮັດ
- ປະຕິບັດຕາມ GDPR: ຮ້ອງຂໍໃຫ້ລຶບຂໍ້ມູນຂອງທ່ານເມື່ອໃດກໍໄດ້