ກ່ຽວ​ກັບ

20+ ແບບ, 100+ ສຽງ, ທັງຫມົດໃນຫນຶ່ງບ່ອນ.

ສ້າງ​ໂດຍ

TTS.ai ຖືກສ້າງຂຶ້ນໂດຍ John Nader (nadermx), TTS.ai ແມ່ນສ່ວນຫນຶ່ງຂອງພາລະກິດເພື່ອເຮັດໃຫ້ເຕັກໂນໂລຊີສຽງ AI ທີ່ດີທີ່ສຸດເຂົ້າເຖິງທຸກໆຄົນ - ບໍ່ມີຜູ້ຂາຍລັອກໃນ, ບໍ່ມີຂໍ້ມູນເກັບກໍາ, ພຽງແຕ່ເຕັກໂນໂລຊີສຽງທີ່ມີປະສິດທິພາບໃນລາຄາທີ່ຍຸຕິທໍາ.

ພາລະກິດຂອງພວກເຮົາ

TTS.ai ຖືກສ້າງຂຶ້ນໂດຍອີງໃສ່ຄວາມເຊື່ອທີ່ງ່າຍດາຍ: ເຕັກໂນໂລຊີສຽງ AI ທີ່ດີທີ່ສຸດຄວນຈະສາມາດເຂົ້າເຖິງໄດ້ ສຳ ລັບທຸກຄົນ. ໃນຂະນະທີ່ການບໍລິການທີ່ມີລິຂະສິດເກັບຄ່າໃຊ້ຈ່າຍສູງ ສຳ ລັບຂໍ້ຄວາມ-ເປັນ-ຄຳເວົ້າພື້ນຖານ, ຊຸມຊົນ Open Source ໄດ້ສ້າງແບບ ຈຳ ລອງທີ່ທຽບເທົ່າຫຼືເກີນກວ່າຄຸນະພາບທາງການຄ້າ.

ພວກເຮົານໍາເອົາແບບຈໍາລອງສຽງ AI ທີ່ມີແຫຼ່ງເປີດທີ່ດີທີ່ສຸດມາສູ່ເວທີດຽວ, ງ່າຍຕໍ່ການໃຊ້ງານ. ບໍ່ມີຜູ້ຂາຍລັອກໃນ. ບໍ່ມີການເກັບກໍາຂໍ້ມູນ. ພຽງແຕ່ເຕັກໂນໂລຢີສຽງທີ່ມີປະສິດທິພາບໃນລາຄາທີ່ເໝາະສົມ.

ສິ່ງທີ່ພວກເຮົາສະເຫນີ

ຂໍ້ຄວາມ​ເປັນ​ການ​ເວົ້າName

20+ ແບບລວມມີ Kokoro, Chatterbox, Bark, ແລະອື່ນໆ. ຈາກການສັງເຄາະເບົາໄວໄປຫາຜົນຜະລິດທີ່ມີຄຸນນະພາບຂອງສະຕູດິໂອ.

ແປ​ຄຳ​ເວົ້າ​ເປັນ​ຂໍ້​ຄວາມName

Powered by Whisper, Faster-Whisper, ແລະ SenseVoice. ແປສຽງໃນ 100 + ພາສາທີ່ມີ timestamps ແລະຜູ້ເວົ້າການກວດພົບ.

ການ​ກັ່ນຕອງ​ສຽງ

ຄລີນສຽງໃດໆຈາກຕົວຢ່າງ5ວິນາທີ. Chatterbox, GPT-SoVITS, CosyVoice 2, ແລະອື່ນໆ. ສ້າງສຽງທີ່ປັບແຕ່ງເອງ ສຳ ລັບໂຄງການຂອງທ່ານ.

ການ​ປະມວນຜົນ​ສຽງ

ຍົກລະດັບສຽງ, ເອົາອອກສຽງ, ແບ່ງແຍກ stems, ເອົາອອກ echo/reverb, ກວດພົບປຸ່ມ/BPM, ແລະ ປ່ຽນຮູບແບບ. ທຸກຢ່າງໂດຍ AI.

ການ​ສົນທະນາ​ດ້ວຍ​ສຽງ

ການສົນທະນາສຽງໃນເວລາຈິງດ້ວຍ AI. ເລືອກແບບແລະສຽງຂອງທ່ານເພື່ອປະສົບການການສົນທະນາແບບໂຕ້ຕອບ.

កម្មវិធី​ພັດທະນາ

REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. Python SDK, ຕົວຢ່າງໂປຣແກຣມ, ແລະ ເອກະສານທີ່ກວ້າງຂວາງ. ສ້າງຄຸນສົມບັດສຽງເຂົ້າໃນແອັບພລິເຄຊັນຂອງທ່ານ.

ແຫຼ່ງ​ເປີດ​ກ່ອນ

ທຸກໆແບບໃນ TTS.ai ແມ່ນ Open Source, ໄດ້ຮັບອະນຸຍາດພາຍໃຕ້ MIT ຫຼື Apache 2.0. ພວກເຮົາເຊື່ອໃນຄວາມໂປ່ງໃສແລະນະວັດຕະກໍາທີ່ຂັບເຄື່ອນໂດຍຊຸມຊົນ.

ພວກເຮົາເຮັດ

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
ແລະ​ອີກ...

ນໍ້າໜັກແບບຈຳລອງທັງໝົດຖືກດາວໂຫລດຈາກບ່ອນເກັບຂໍ້ມູນທາງການຂອງພວກມັນ. ພວກເຮົາບໍ່ເພີ່ມການປ່ຽນແປງທີ່ບໍ່ມີສິດ.

ພື້ນຖານ​ໂຄງລ່າງ

TTS.ai ແລ່ນຢູ່ໃນເຊີບເວີ GPU ທີ່ອຸທິດຕົນດ້ວຍ NVIDIA Tesla P40 GPUs (96GB VRAM ລວມ). ພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາໄດ້ຖືກອອກແບບ ສຳ ລັບ latency ຕ່ ຳ ແລະ ຄວາມໄວສູງ:

  • GPU clusters ສຳລັບ​ການ​ຄິດໄລ່ - ບໍ່ມີ​ຊັບພະຍາກອນ​ທີ່​ແບ່ງປັນ
  • ການ​ແບ່ງປັນ GPU ແບບດັ້ງເດີມ​ອີງ​ຕາມ​ຄວາມຕ້ອງການ​ຂອງ​ໂມເດັມ VRAM
  • ລະບົບຄວາມສໍາຄັນ 5- queue ສຳ ລັບຄວາມສາມາດໃນການສົ່ງອອກທີ່ດີທີ່ສຸດ
  • ຕົວແບບ​ທີ່​ໄດ້​ເກັບ​ໄວ້​ກ່ອນ​ໃນ VRAM ສຳ​ລັບ​ການ​ຄິດໄລ່​ທັນທີ
  • CDN-backed ການ​ສົ່ງ​ສຽງ​ເພື່ອ​ດາວໂຫລດ​ໄວ

ຄວາມເປັນສ່ວນຕົວ ແລະ ຄວາມປອດໄພ

  • ບໍ່ມີ​ການ​ຝຶກ​ອົບຮົມ​ຂໍ້ມູນ: ພວກເຮົາ​ບໍ່​ເຄີຍ​ໃຊ້​ສຽງ ຫຼື ຂໍ້ຄວາມ​ຂອງ​ທ່ານ​ເພື່ອ​ຝຶກ​ຕົວແບບ
  • ການ​ລຶບ​ស្វ័យ​ប្រវត្តិ: ສຽງ​ທີ່​ໄດ້​ສ້າງ​ຈະ​ຖືກ​ລຶບ​ອອກ​ໂດຍ​ອັດຕະໂນມັດ ຫຼັງຈາກ 24 ຊົ່ວໂມງ
  • ການເຂົ້າລະຫັດ & # 160; ៖ ຂໍ້ມູນ​ທັງ​ໝົດ​ຖືກ​ເຂົ້າລະຫັດ​ເມື່ອ​ສົ່ງ (TLS 1. 2+) ແລະ ເມື່ອ​ບໍ່​ໃຊ້
  • ບໍ່ມີ​ການ​ຕິດຕາມ: ພວກເຮົາເຮັດ
  • ປະຕິບັດຕາມ GDPR: ຮ້ອງຂໍ​ໃຫ້​ລຶບ​ຂໍ້ມູນ​ຂອງ​ທ່ານ​ເມື່ອ​ໃດ​ກໍ​ໄດ້

ຄໍາຖາມເລື້ອຍໆກ່ຽວກັບ TTS.ai

TTS.ai ໄດ້ຖືກສ້າງຂຶ້ນໂດຍ John Nader (nadermx), ຜູ້ພັດທະນາທີ່ເປັນເອກະລາດທີ່ມີຄວາມກະຕືລືລົ້ນກ່ຽວກັບວິທີການເຮັດໃຫ້ເຕັກໂນໂລຊີສຽງ AI ສາມາດເຂົ້າເຖິງໄດ້ທຸກໆຄົນ. ພວກເຮົາຮັກສາແລະໃຫ້ບໍລິການແບບຟອມ Open Source ທີ່ດີທີ່ສຸດຈາກຊຸມຊົນແທນທີ່ຈະຝຶກອົບຮົມທີ່ເປັນເຈົ້າຂອງ.

ພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາແລ່ນຢູ່ໃນເຊີບເວີທີ່ອຸທິດຕົນທີ່ມີ NVIDIA Tesla P40 GPUs ສະຫນອງ 96GB ຂອງ VRAM. ເວບໄຊທ໌ frontend ແລະ GPU inference ເຊີບເວີແມ່ນຖືກຈັດຢູ່ໃນສູນຂໍ້ມູນທີ່ປອດໄພທີ່ມີການເຊື່ອມຕໍ່ latency ຕ່ໍາ.

ພວກເຮົາຫຼຸດຜ່ອນການເກັບຮັກສາຂໍ້ມູນ. ການເຂົ້າລະຫັດຂໍ້ຄວາມແມ່ນຖືກປະມວນຜົນໃນເວລາຈິງແລະບໍ່ຖືກເກັບໄວ້ຢ່າງຖາວອນ. ໄຟລ໌ສຽງທັງ ໝົດ ທີ່ອັບໂຫລດແລະສ້າງແມ່ນຖືກລຶບອອກໂດຍອັດຕະໂນມັດພາຍໃນ 24 ຊົ່ວໂມງ. ພວກເຮົາບໍ່ເຄີຍໃຊ້ຂໍ້ມູນຂອງທ່ານເພື່ອຝຶກແບບ AI.

TTS.ai ໃຫ້ບໍລິການຊຸມຊົນທີ່ເຕີບໃຫຍ່ຂອງນັກພັດທະນາ, ຜູ້ສ້າງເນື້ອຫາ, ແລະທຸລະກິດທົ່ວໂລກ. ເວທີຂອງພວກເຮົາຈັດການກັບຄໍາຮ້ອງສະຫມັກການຜະລິດສຽງຫຼາຍພັນຄົນໃນແຕ່ລະວັນຜ່ານ 20+ ແບບ AI.

ພວກເຮົາພະຍາຍາມເພື່ອຄວາມສາມາດໃຊ້ງານສູງດ້ວຍພື້ນຖານໂຄງລ່າງ GPU ທີ່ອຸທິດຕົນແລະລະບົບຄວາມສໍາຄັນຂອງ 5-queue. ໃນຂະນະທີ່ພວກເຮົາບໍ່ສະ ເໜີ SLA ຢ່າງເປັນທາງການ ສຳ ລັບຜູ້ໃຊ້ທີ່ບໍ່ມີຄ່າໃຊ້ຈ່າຍ, ແຜນທີ່ຈ່າຍແມ່ນໄດ້ຮັບຜົນປະໂຫຍດຈາກການປຸງແຕ່ງຄວາມສໍາຄັນແລະຄວາມ ໜ້າ ເຊື່ອຖືສູງ.

ຍິນດີຕ້ອນຮັບ. ທຸກໆແບບໃນ TTS.ai ແມ່ນ Open Source, ໃບອະນຸຍາດພາຍໃຕ້ MIT ຫຼື Apache 2.0. ພວກເຮົາສະໜັບສະໜູນຢ່າງຕັ້ງໜ້າຊຸມຊົນສຽງ AI Open Source ແລະປະກອບສ່ວນໃນການປັບແຕ່ງແລະລວມເຂົ້າກັບລະບົບນິເວດ.

ແຜນງານຂອງພວກເຮົາປະກອບມີການເພີ່ມແບບໃຫມ່ state-of-the-art ໃນເວລາທີ່ພວກເຂົາໄດ້ຖືກປ່ອຍອອກມາ, ຂະຫຍາຍການສະຫນັບສະຫນູນພາສາ, ປັບປຸງຄວາມສາມາດສົນທະນາສຽງເວລາຈິງ, ແລະສ້າງເຄື່ອງມືການປຸງແຕ່ງສຽງຫຼາຍ.

TTS.ai ແມ່ນຖືກສ້າງຂຶ້ນແລະຮັກສາໂດຍຜູ້ພັດທະນາຄົນດຽວ, ສະນັ້ນບໍ່ມີຕໍາແໜ່ງເປີດ. ຢ່າງໃດກໍຕາມ, ການປະກອບສ່ວນ Open Source ແມ່ນຍິນດີຕ້ອນຮັບເປັນປົກກະຕິ - ເຂົ້າເຖິງຜ່ານຫນ້າຕິດຕໍ່ຫຼື GitHub.

ມີ, ພວກເຮົາຍິນດີຕ້ອນຮັບຄູ່ຮ່ວມງານກັບນັກພັດທະນາ, ທຸລະກິດ, ແລະອົງການຈັດຕັ້ງທີ່ຊອກຫາເພື່ອເຊື່ອມໂຍງສຽງ AI ເຂົ້າໃນຜະລິດຕະພັນຂອງເຂົາເຈົ້າ. ຕິດຕໍ່ພວກເຮົາເພື່ອປຶກສາຫາລືການເຊື່ອມໂຍງ API, ອັດຕາສ່ວນລາຄາ, ຫຼືການຈັດຕັ້ງປະຕິບັດແບບຈໍາລອງຕາມຄວາມຕ້ອງການ.

ພວກເຮົາຈັດການທົບທວນຄືນຄວາມປອດໄພປົກກະຕິຂອງພື້ນຖານໂຄງລ່າງຂອງພວກເຮົາ. ຂໍ້ມູນທັງຫມົດແມ່ນຖືກເຂົ້າລະຫັດໃນການເດີນທາງກັບ TLS 1.2+, ລະຫັດຜ່ານແມ່ນ hashed ກັບ algorithms ມາດຕະຖານອຸດສາຫະກໍາ, ແລະ API ລະຫັດຜ່ານໃຊ້ຫນຶ່ງທາງ hashing. ເຂົ້າໃຊ້ເຊີບເວີແມ່ນຈໍາກັດໃຫ້ພະນັກງານທີ່ມີສິດຜ່ານລະຫັດຜ່ານ SSH.

TTS.ai ແມ່ນ compliant GDPR ແລະປະຕິບັດຕາມຫຼັກການຫຼຸດຜ່ອນຂໍ້ມູນ. ພວກເຮົາບໍ່ເກັບຮັກສາຂໍ້ມູນສຽງສ່ວນຕົວນອກ 24 ຊົ່ວໂມງ, ບໍ່ໃຊ້ຂໍ້ມູນລູກຄ້າສໍາລັບການຝຶກອົບຮົມ, ແລະສະຫນອງການເຂົ້າເຖິງຂໍ້ມູນເຕັມ, ການແກ້ໄຂ, ແລະສິດການລົບລ້າງຕາມຄໍາຮ້ອງຂໍ.

ພວກເຮົາຕິດຕາມກວດກາສະພາບແວດລ້ອມສຽງ AI ແບບເປີດແຫຼ່ງຢ່າງຕໍ່ເນື່ອງແລະເພີ່ມແບບຈໍາລອງໃຫມ່ເມື່ອພວກເຂົາສາມາດເຂົ້າເຖິງໄດ້ແລະພິສູດຄຸນະພາບຂອງພວກເຂົາ. ການອັບເດດແບບຈໍາລອງໃຫຍ່ໂດຍທົ່ວໄປແມ່ນເກີດຂື້ນທຸກໆເດືອນ, ດ້ວຍການເພີ່ມປະສິດທິພາບນ້ອຍໆທີ່ນໍາໃຊ້ຢ່າງຕໍ່ເນື່ອງ.

ຄໍາຖາມ? ຄໍາເຫັນ? ພວກເຮົາ

ຕິດຕໍ່​ພວກເຮົາ ເອກະສານ API