About TTS.ai
24+ ແບບ, 100+ ສຽງ, ທັງຫມົດໃນຫນຶ່ງບ່ອນ.
ພາລະກິດຂອງພວກເຮົາ
TTS.ai was built on a simple belief: the best AI voice technology should be accessible to everyone. While proprietary services charge premium prices for basic text-to-speech, the open-source community has created models that match or exceed commercial quality.
ພວກເຮົານໍາເອົາແບບຈໍາລອງ AI ສຽງ Open-Source ທີ່ດີທີ່ສຸດເຂົ້າສູ່ເວທີດຽວ, ງ່າຍຕໍ່ການໃຊ້ງານ. ບໍ່ມີຜູ້ສະຫນອງ lock-in. ບໍ່ມີການເກັບກໍາຂໍ້ມູນ. ພຽງແຕ່ເຕັກໂນໂລຊີສຽງທີ່ມີປະສິດທິພາບໃນລາຄາທີ່ຍຸຕິທໍາ.
ສິ່ງທີ່ພວກເຮົາສະເຫນີ
ຂໍ້ຄວາມເປັນການເວົ້າName
24+ ແບບລວມມີ Kokoro, Chatterbox, Bark, ແລະອື່ນໆ. ຈາກການສັງເຄາະເບົາໄວເຖິງຜົນຜະລິດທີ່ມີຄຸນນະພາບຂອງສະຕູດິໂອ.
ການເວົ້າເປັນຂໍ້ຄວາມName
Powered by Whisper, Faster-Whisper, and SenseVoice. Transcribe audio in 100+ languages with timestamps and speaker detection.
ການກັ່ນຕອງສຽງ
ຄລີນສຽງໃດໆຈາກຕົວຢ່າງ5ວິນາທີ. Chatterbox, GPT-SoVITS, CosyVoice 2, ແລະອື່ນໆ. ສ້າງສຽງທີ່ປັບແຕ່ງເອງ ສຳ ລັບໂຄງການຂອງທ່ານ.
ການປະມວນຜົນສຽງ
ຍົກລະດັບສຽງ, ເອົາອອກສຽງ, ແບ່ງແຍກ stems, ເອົາອອກ echo/reverb, ກວດພົບປຸ່ມ/BPM, ແລະ ປ່ຽນຮູບແບບ. ທຸກຢ່າງໂດຍ AI.
ການສົນທະນາດ້ວຍສຽງ
ການສົນທະນາສຽງໃນເວລາຈິງດ້ວຍ AI. ເລືອກແບບແລະສຽງຂອງທ່ານເພື່ອປະສົບການການສົນທະນາແບບໂຕ້ຕອບ.
ຜູ້ພັດທະນາ API
REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. Python SDK, ຕົວຢ່າງໂປຣແກຣມ, ແລະ ເອກະສານທີ່ກວ້າງຂວາງ. ສ້າງຄຸນສົມບັດສຽງເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານ.
ແຫຼ່ງເປີດກ່ອນ
ທຸກໆແບບໃນ TTS.ai ແມ່ນ Open Source, ໄດ້ຮັບອະນຸຍາດພາຍໃຕ້ MIT ຫຼື Apache 2.0. ພວກເຮົາເຊື່ອໃນຄວາມໂປ່ງໃສແລະນະວັດຕະກໍາທີ່ຂັບເຄື່ອນໂດຍຊຸມຊົນ.
ພວກເຮົາເຮັດ
ນໍ້າໜັກແບບຈຳລອງທັງໝົດຖືກດາວໂຫລດຈາກບ່ອນເກັບຂໍ້ມູນທາງການຂອງພວກມັນ. ພວກເຮົາບໍ່ເພີ່ມການປ່ຽນແປງທີ່ບໍ່ມີສິດ.
ພື້ນຖານໂຄງລ່າງ
TTS.ai ແລ່ນຢູ່ໃນເຊີບເວີ GPU ທີ່ອຸທິດຕົນດ້ວຍ NVIDIA Tesla P40 GPUs (96GB VRAM ລວມ). ພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາໄດ້ຖືກອອກແບບ ສຳ ລັບ latency ຕ່ ຳ ແລະ ຄວາມໄວສູງ:
- GPU clusters ສຳລັບການຄິດໄລ່ - ບໍ່ມີຊັບພະຍາກອນທີ່ແບ່ງປັນ
- ການແບ່ງປັນ GPU ແບບດັ້ງເດີມອີງຕາມຄວາມຕ້ອງການຂອງໂມເດັມ VRAM
- ລະບົບ 5- queue ບຸລິມະສິດ ສຳ ລັບຄວາມໄວທີ່ ເໝາະ ສົມ
- ຕົວແບບທີ່ໄດ້ເກັບໄວ້ກ່ອນໃນ VRAM ສຳລັບການຄິດໄລ່ທັນທີ
- CDN-backed ການສົ່ງສຽງເພື່ອດາວໂຫລດໄວ
ຄວາມເປັນສ່ວນຕົວ ແລະ ຄວາມປອດໄພ
- ບໍ່ມີການຝຶກອົບຮົມຂໍ້ມູນ: ພວກເຮົາບໍ່ເຄີຍໃຊ້ສຽງ ຫຼື ຂໍ້ຄວາມຂອງທ່ານເພື່ອຝຶກຕົວແບບ
- ການລຶບອັດຕະໂນມັດ: ສຽງທີ່ສ້າງຂຶ້ນຈະຖືກລຶບໂດຍອັດຕະໂນມັດຫຼັງຈາກ 24 ຊົ່ວໂມງ
- ການເຂົ້າລະຫັດ: ຂໍ້ມູນທັງໝົດແມ່ນຖືກເຂົ້າລະຫັດໃນການຂົນສົ່ງ (TLS 1.2+) ແລະເມື່ອບໍ່ໃຊ້ງານ
- ບໍ່ມີການຕິດຕາມ: ພວກເຮົາບໍ່
- GDPR compliant: ຮ້ອງຂໍຂໍ້ມູນຂອງທ່ານຫຼືລຶບເວລາໃດກໍ່ໄດ້