AI ແບບ​ຟຣີ ຂໍ້ຄວາມ​ເປັນ​ການ​ເວົ້າName

33+ ແບບ open-source, 273+ ສຽງ, 33+ ພາສາ. ບໍ່ມີ​ບັນຊີ​ທີ່​ຕ້ອງການ.

18K+
ຜູ້​បង្កើត
71K+
​ລຸ້ນ
33+
ຕົວແບບ AI
273+
ສຽງ
0/500 ​តួ​អក្សរ · ລົງທະບຽນສໍາລັບ 5,000 ຕໍ່ຄົນ → ຟຣີ
ຮັກ TTS.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ທຸກສິ່ງທຸກຢ່າງທີ່​ທ່ານ​ຕ້ອງການ​ສຳລັບ​ສຽງ AI

ເຄື່ອງມື 30+ ທີ່ມີພະລັງຈາກແບບ ຈຳ ລອງ AI ແຫຼ່ງເປີດ

33+ ແບບຟອມ​ສຽງ AI

ການ​ເກັບ​ກໍາ​ແບບ​ຟອມ TTS ແບບ​ເປີດ​ແຫຼ່ງ​ທີ່​ກວ້າງຂວາງ​ທີ່ສຸດ​ໃນ​ເວບໄຊທ໌​ດຽວ

KokoroKokoro ບໍ່ມີ

Kokoro ແມ່ນ 82 ລ້ານຕົວແບບການແປພາສາຈາກຂໍ້ຄວາມເປັນສຽງທີ່ຕີໄດ້ດີກວ່າລະດັບນໍ້າໜັກຂອງມັນ. ເຖິງວ່າຈະມີຂະ ໜາດ ນ້ອຍ, ມັນກໍ່ຜະລິດການເວົ້າທີ່ ໜ້າ ສົນໃຈແລະສະແດງອອກ. Kokoro ສະຫນັບສະຫນູນຫຼາຍພາສາລວມທັງພາສາອັງກິດ, ຍີ່ປຸ່ນ, ຈີນ, ແລະເກົາຫຼີດ້ວຍສຽງສະແດງອອກທີ່ຫຼາກຫຼາຍ. ມັນແລ່ນໄວຫຼາຍ — ສ້າງສຽງເກືອບ 100x ໄວກວ່າເວລາຈິງໃນ GPU.

ດີທີ່ສຸດ ສຳ ລັບ: TTS ທີ່ມີຄຸນນະພາບສູງດ້ວຍຄວາມຊ້າສຸດ, កម្មវិធី​ດາວໂຫລດ

ທົດລອງຟຣີ

PiperPiper ບໍ່ມີ

Piper ແມ່ນເຄື່ອງຈັກການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ເບົາບາງທີ່ພັດທະນາໂດຍ Rhasspy ເຊິ່ງໃຊ້ VITS ແລະ larynx architectures. ມັນແລ່ນທັງ ໝົດ ເທິງ CPU, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບອຸປະກອນ Edge, ອັດຕະໂນມັດໃນເຮືອນ, ແລະ ຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການ TTS ນອກອິນເຕີເນັດ. ດ້ວຍສຽງຫຼາຍກວ່າ 100 ຜ່ານ 30 + ພາສາ, Piper ສົ່ງຄໍາເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດໃນຄວາມໄວທີ່ແທ້ຈິງເຖິງແມ່ນວ່າຢູ່ໃນ Raspberry Pi 4.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ເບິ່ງ​ກ່ອນ​ໄວ, ການ​ເຂົ້າ​ເຖິງ​ງ່າຍ, ແລະ​ໂປແກຼມ​ທີ່​ຖືກ​ຝັງ​ໄວ້

ທົດລອງຟຣີ

VITSVITS ບໍ່ມີ

VITS (ການ​ຄິດ​ໄລ່​ຄວາມ​ແຕກຕ່າງ​ດ້ວຍ​ການ​ຮຽນ​ຮູ້​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ເພື່ອ​ການ​ແປ​ຂໍ້​ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ຈາກ​ຕົ້ນ​ເຖິງ​ທ້າຍ) ແມ່ນ​ວິທີການ​ TTS ແບບ​ຄຽງ​ຄູ່​ກັນ​ລະຫວ່າງ​ຕົ້ນ​ເຖິງ​ທ້າຍ​ທີ່​ຜະລິດ​ສຽງ​ທີ່​ມີ​ສຽງ​ທໍາມະຊາດ​ຫຼາຍ​ຂຶ້ນ​ກວ່າ​ແບບ​ແບບ​ສອງ​ຂັ້ນ​ທີ່​ມີ​ຢູ່​ໃນ​ປັດຈຸບັນ. ມັນ​ໃຊ້​ການຄິດໄລ່​ຄວາມ​ແຕກຕ່າງ​ທີ່​ເພີ່ມ​ຂຶ້ນ​ດ້ວຍ​ການ​ປ່ຽນ​ແປງ​ຂອງ​ການ​ໄຫຼ ແລະ ຂະບວນການ​ຝຶກ​ອົບຮົມ​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ກັນ, ເຮັດໃຫ້​ການ​ປັບ​ປຸງ​ທີ່​ມີ​ຄວາມ​ໝາຍ​ໃນ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ເປັນ​ທໍາ​ມະ​ຊາດ​ຫຼາຍ​ຂຶ້ນ.

ດີທີ່ສຸດ ສຳ ລັບ: ຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ​ແບບ​ທົ່ວໄປ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳມະຊາດ

ທົດລອງຟຣີ

MeloTTSMeloTTS ບໍ່ມີ

MeloTTS ໂດຍ MyShell.ai ແມ່ນຫ້ອງສະໝຸດ TTS ຫຼາຍພາສາທີ່ສະຫນັບສະຫນູນພາສາອັງກິດ (ອາເມລິກາ, ບຣາຊິນ, ອິນເດຍ, ອົດສະຕາລີ), ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ. ມັນໄວຫຼາຍ, ຂະບວນການຂໍ້ຄວາມທີ່ໃກ້ກັບຄວາມໄວເວລາຈິງໃນ CPU ດຽວ. MeloTTS ແມ່ນອອກແບບສໍາລັບການໃຊ້ງານການຜະລິດແລະສະຫນັບສະຫນູນທັງ CPU ແລະ GPU ຜົນການຄິດໄລ່.

ດີທີ່ສຸດ ສຳ ລັບ: ໂປແກຼມ​ຜະລິດ​ທີ່​ຕ້ອງການ TTS ໄວ, ຫຼາຍ​ພາສາ

ທົດລອງຟຣີ

Kani TTS 2Kani TTS 2 ບໍ່ມີ

Kani-TTS-2 ໂດຍ NineNineSix ແມ່ນແບບ ຈຳ ລອງຕົວຊີ້ວັດ 400M ທີ່ມີຄວາມເບົາບາງທີ່ສ້າງຂຶ້ນໂດຍໃຊ້ Liquid AI LFM2 backbone ດ້ວຍ NVIDIA NanoCodec. ມັນແລ່ນໃນພຽງແຕ່ 3GB VRAM ແລະຜະລິດ ~ 10 ວິນາທີຂອງການເວົ້າໃນ ~2 ວິນາທີໃນ A100 (RTF 0.2). ການປ່ອຍສາທາລະນະປະຈຸບັນສົ່ງເຄື່ອງກວດສອບພາສາອັງກິດ `kani-tts-2-en` ແລະບໍ່ເປີດເຜີຍຮູຮັບສຽງທີ່ ຈຳ ເປັນ ສຳ ລັບການກັ່ນຕອງສຽງ - ໃຊ້ Chatterbox / IndexTTS2 / F5-TTS ສຳ ລັບການກັ່ນຕອງ, ຫຼື Kokoro / MeloTTS ສຳ ລັບພາສາທີ່ບໍ່ເປັນພາສາອັງກິດ.

ດີທີ່ສຸດ ສຳ ລັບ: ສ້າງພາສາອັງກິດໄວຂຶ້ນ ເທິງຮາດແວ VRAM ຕ່ຳ, ເບິ່ງກ່ອນໄວ

ທົດລອງຟຣີ

OuteTTSOuteTTS ບໍ່ມີ

OuteTTS ຂະຫຍາຍຕົວແບບພາສາໃຫຍ່ທີ່ມີຄວາມສາມາດໃນການແປພາສາໃນຂະນະດຽວກັນຮັກສາໂຄງສ້າງຕົ້ນສະບັບ. ມັນສະຫນັບສະຫນູນ backends ຫຼາຍຢ່າງລວມທັງ llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ແລະເຖິງແມ່ນວ່າການຄາດຄະເນຂອງຕົວທ່ອງເວັບຜ່ານ Transformers.js. ຄຸນສົມບັດການກັ່ນຕອງສຽງຜ່ານໂປຼໄຟລ໌ຜູ້ເວົ້າທີ່ເກັບໄວ້ເປັນ JSON.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ຈັດ​ຕັ້ງ​ໃຊ້ Edge, TTS ທີ່ມີ​ພື້ນຖານ​ໃນ​ຕົວ​ທ່ອງ​ເວັບ, ສະພາບແວດລ້ອມ​ທີ່​ມີ​ຊັບພະຍາກອນ​ຕ່ຳ

ທົດລອງຟຣີ

Pocket TTSPocket TTS ບໍ່ມີ

Pocket TTS ໂດຍ Kyutai (ຜູ້ສ້າງ Moshi) ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ມີຂະໜາດນ້ອຍ 100M ທີ່ມີນໍ້າໜັກເບົາກວ່າ. ມັນສາມາດໃຊ້ງານໄດ້ຢ່າງມີປະສິດຕິພາບໃນ CPU, ສະຫນັບສະຫນູນການກັ່ນຕອງສຽງແບບ zero-shot ຈາກຕົວຢ່າງສຽງດຽວ, ແລະຜະລິດສຽງເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດ. ຂະໜາດຂອງແບບຟອມທີ່ນ້ອຍເຮັດໃຫ້ມັນ ເໝາະ ສົມກັບການຕິດຕັ້ງດ້ານນອກແລະສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ໍາ.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ຈັດ​ຕັ້ງ​ໃຊ້​ເບົາ, ສະພາບແວດລ້ອມ CPU-only, ການ​ກັ່ນຕອງ​ສຽງ​ຢ່າງ​ໄວ

ທົດລອງຟຣີ

Kitten TTSKitten TTS ບໍ່ມີ

Kitten TTS ໂດຍ KittenML ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມທີ່ເບົາທີ່ສຸດທີ່ສ້າງຂຶ້ນໂດຍ ONNX. ດ້ວຍຕົວເລືອກຈາກ 15M ເຖິງ 80M (25-80 MB ໃນຮາດດິດ), ມັນສະ ໜອງ ການສັງເຄາະສຽງທີ່ມີຄຸນນະພາບສູງໃນ CPU ໂດຍບໍ່ຕ້ອງໃຊ້ GPU. ຄຸນລັກສະນະ 8 ສຽງພາຍໃນ, ໄວໃນການເວົ້າທີ່ປັບໄດ້, ແລະ ການປຸງແຕ່ງຂໍ້ຄວາມກ່ອນ ສຳ ລັບຕົວເລກ, ເງິນຕາແລະ ໜ່ວຍ. ດີເລີດ ສຳ ລັບການ ນຳ ໃຊ້ດ້ານ ໜ້າ ແລະ កម្មវិធីທີ່ມີ latency ຕ່ ຳ.

ດີທີ່ສຸດ ສຳ ລັບ: TTS ງ່າຍ ແລະ ໄວ, ຈັດການ​ໃຊ້​ງານ​ດ້ານ​ໜ້າ, ​ໂປແກຼມ​ທີ່​ໃຊ້​ເວລາ​ລໍຖ້າ​ຕ່ຳ

ທົດລອງຟຣີ

Ming-Omni TTSMing-Omni TTS ບໍ່ມີ

Ming-omni-tts-0.5B ໂດຍ inclusionAI ແມ່ນແບບຈໍາລອງການເວົ້າ omni-modal ຂະຫນາດນ້ອຍທີ່ສ້າງຂຶ້ນໃນ BailingMM ແຂງ backbone ທີ່ມີ Patch-by-Patch ສຽງ decoder ກົງກັນຂ້າມ. ສະຫນອງການອອກສຽງ 44.1kHz (ໃກ້ກັບຄຸນນະພາບ CD), ສະຫນັບສະຫນູນການຖ່າຍທອດສຽງສິ້ນສຸດລົງຈາກ 3+ ຄໍາຮ້ອງສະຫມັກຄັ້ງທໍາອິດ, ແລະປະກອບມີ built-in ຮູ້ສຶກ / ພາສາ / BGM ຄວບຄຸມຜ່ານຄໍາແນະນໍາ JSON. ມີຄວາມຫມັ້ນຄົງທີ່ດີ - 0.83% WER ກ່ຽວກັບການ benchmarks ຈີນ.

ດີທີ່ສຸດ ສຳ ລັບ: ພາສາ​ສອງ​ພາສາ​ທີ່​ມີ​ຄວາມ​ເຊື່ອ​ຖື​ສູງ, ສຽງ​ທີ່​ຄວບຄຸມ​ດ້ວຍ​ອາລົມ, ເນື້ອໃນ​ຂອງ​ປື້ມ​ສຽງ​ພາສາ​ຈີນ

ທົດລອງຟຣີ

MOSS-TTS NanoMOSS-TTS Nano ບໍ່ມີ

MOSS-TTS-Nano-100M ແມ່ນ OpenMOSS ທີ່ມີຂະ ໜາດ ນ້ອຍ 100M-parameter ຂອງຄອບຄົວ MOSS-TTS, ແບ່ງປັນສະຖາປັດຕະຍະ ກຳ ປ່ຽນແປງຄວາມຊ້າ. ການຄ້າຄຸນນະພາບສູງສຸດຂອງແບບ 8B ສຳ ລັບ ~ 80x ນ້ອຍກວ່າແລະຫຼຸດລົງຢ່າງຫຼວງຫຼາຍຕໍ່ VRAM ຕາມການຮ້ອງຂໍ, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບການຕິດຕັ້ງແບບຟຣີແລະລະດັບສູງ. ຄືກັນກັບ 20 ພາສາ.

ດີທີ່ສຸດ ສຳ ລັບ: TTS ແບບຟຣີ, ຜະລິດຜົນງານທີ່ມີປະລິມານສູງ, ໃຊ້ງານແບບໂຕ້ຕອບທີ່ມີຄວາມຊ້າ

ທົດລອງຟຣີ

BarkBark ມາດຕະຖານ

ແບບຈໍາລອງ​ຂໍ້ຄວາມ​ເປັນ​ສຽງ​ທີ່​ອີງ​ໃສ່​ການ​ປ່ຽນ​ແປງ​ທີ່​ສ້າງ​ການ​ເວົ້າ, ດົນຕີ ແລະ ຜົນ​ສະທ້ອນ​ສຽງ​ທີ່​ເປັນ​ຈິງ.

ຜູ້​ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

Bark SmallBark Small ມາດຕະຖານ

ເວີຊັນເບົາກວ່າຂອງ Bark ດ້ວຍ​ການ​ຄິດໄລ່​ໄວກວ່າ ແລະ ຫຼຸດ​ການ​ໃຊ້​ຄວາມ​ຈຳ​ລົງ

ຜູ້​ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

CosyVoice 2CosyVoice 2 ມາດຕະຖານ

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ຜູ້​ພັດທະນາ: Alibaba (Tongyi Lab) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Dia TTSDia TTS ມາດຕະຖານ

ແບບຟອມ​ການ​ສ້າງ​ການ​ສົນທະນາ​ຂອງ​ຜູ້​ເວົ້າ​ຫຼາຍ​ຄົນ​ທີ່​ສ້າງ​ການ​ສົນທະນາ​ແບບ​ທຳມະຊາດ​ລະຫວ່າງ​ຜູ້​ເວົ້າ​

ຜູ້​ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Parler TTSParler TTS ມາດຕະຖານ

ອະທິບາຍສຽງທີ່ທ່ານຕ້ອງການໃນພາສາທໍາມະຊາດ ແລະ Parler ຈະສ້າງການເວົ້າທີ່ກົງກັນ.

ຜູ້​ພັດທະນາ: Hugging Face · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

IndexTTS-2IndexTTS-2 ມາດຕະຖານ

Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.

ຜູ້​ພັດທະນາ: Index Team · ໃບອະນຸຍາດ: Bilibili Model License

ທົດລອງໃຊ້

Spark TTSSpark TTS ມາດຕະຖານ

ການ​ກັ່ນຕອງ​ສຽງ TTS ດ້ວຍ​ອາລົມ​ທີ່​ສາມາດ​ຄວບຄຸມ​ໄດ້ ແລະ ແບບ​ເວົ້າ​ຜ່ານ​ການ​ແຈ້ງ​ເຕືອນ.

ຜູ້​ພັດທະນາ: SparkAudio · ໃບອະນຸຍາດ: CC BY-NC-SA 4.0

ທົດລອງໃຊ້

GPT-SoVITSGPT-SoVITS ມາດຕະຖານ

ສຽງ​ທີ່​ໄດ້​ຮັບ​ການ​ກັ່ນຕອງ​ສຽງ​ TTS ທີ່​ເຮັດ​ໃຫ້​ສຽງ​ໃດໆ​ມີ​ສຽງ​ຄື​ກັນ​ກັບ​ສຽງ​ທີ່​ໄດ້​ຮັບ​ຈາກ​ສຽງ​5ວິນາທີ​ເທົ່ານັ້ນ.

ຜູ້​ພັດທະນາ: RVC-Boss · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

OrpheusOrpheus ມາດຕະຖານ

ແບບຈໍາລອງ TTS ລະດັບມະນຸດທີ່ຮຽນຮູ້ຈາກຂໍ້ມູນການເວົ້າ 100K ຊົ່ວໂມງ.

ຜູ້​ພັດທະນາ: Canopy Labs · ໃບອະນຸຍາດ: Llama 3.2 Community

ທົດລອງໃຊ້

Qwen3 TTSQwen3 TTS ມາດຕະຖານ

Alibaba's multilingual TTS with preset voices and voice design from text.

ຜູ້​ພັດທະນາ: Alibaba (Qwen) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

VieNeu-TTS-v2VieNeu-TTS-v2 ມາດຕະຖານ

ພາສາຫວຽດ + ພາສາອັງກິດ ປ່ຽນລະຫັດ TTS ດ້ວຍສຽງ7ສຽງ ແລະ ສຽງທີ່ບໍ່ມີສຽງ. CPU-only, ບໍ່ຕ້ອງການ GPU.

ຜູ້​ພັດທະນາ: Phạm Nguyễn Ngọc Bảo · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Chatterbox TurboChatterbox Turbo ມາດຕະຖານ

Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.

ຜູ້​ພັດທະນາ: Resemble AI · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

VoxCPMVoxCPM ມາດຕະຖານ

Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.

ຜູ້​ພັດທະນາ: OpenBMB · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

VibeVoiceVibeVoice ມາດຕະຖານ

ແບບຟອມ Microsoft ສຳ ລັບເນື້ອໃນແບບຟອມຍາວທີ່ມີຜູ້ເວົ້າຫຼາຍຄົນເຊັ່ນ Podcasts ແລະ Audiobooks.

ຜູ້​ພັດທະນາ: Microsoft · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

CosyVoice3CosyVoice3 ມາດຕະຖານ

TTS ຫຼາຍພາສາລຸ້ນຕໍ່ໄປທີ່ມີ bi-streaming, ການຄວບຄຸມອາລົມ, ແລະ ການກັ່ນຕອງສຽງແບບ zero-shot.

ຜູ້​ພັດທະນາ: Alibaba (FunAudioLLM) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

NAMAA Saudi TTSNAMAA Saudi TTS ມາດຕະຖານ

ພາສາ​ອາຣັບ​ຊາອຸດີ​ທີ່​ເປີດ​ໃຊ້​ໄດ້​ຄັ້ງ​ທຳ​ອິດ​ທີ່​ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ແບບ Chatterbox.

ຜູ້​ພັດທະນາ: NAMAA Space · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

Darwin TTSDarwin TTS ມາດຕະຖານ

ຕົວແປ Qwen3- TTS ແບບ cross- mode ທີ່ມີນໍ້າໜັກ FFN ຖືກປະສົມຈາກແບບຟອມພາສາ Qwen3- 1. 7B ເພື່ອການ​ກັ່ນຕອງ​ພາສາ​ຫຼາຍພາສາ​ທີ່​ຊັດເຈນ​ກວ່າ.

ຜູ້​ພັດທະນາ: FINAL-Bench · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

MOSS-TTSDMOSS-TTSD ມາດຕະຖານ

ແບບຟອມການສົນທະນາແບບຕໍ່ເນື່ອງຂອງຫຼາຍຄົນ - ສ້າງການສົນທະນາແບບ podcast ທີ່ມີຜູ້ເວົ້າເຖິງ5ຄົນແລະ 60 ນາທີຂອງສຽງທີ່ເປັນເອກະພາບ.

ຜູ້​ພັດທະນາ: OpenMOSS · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

ChatterboxChatterbox ລາຄາ​ຖືກ

ເຕັກໂນໂລຊີ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ບໍ່​ມີ​ສຽງ​ກັບ​ການ​ຄວບຄຸມ​ອາລົມ​ຈາກ Resemble AI.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

Tortoise TTSTortoise TTS ລາຄາ​ຖືກ

ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ​ຫຼາຍ​ສຽງ​ທີ່​ສຸມ​ໃສ່​ຄຸນ​ນະ​ພາບ​ດ້ວຍ​ໂຄງ​ສ້າງ​ໂຄງ​ສ້າງ​ທີ່​ກັບ​ຄືນ​ໄປ​ບ່ອນ​ເອງ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

StyleTTS 2StyleTTS 2 ລາຄາ​ຖືກ

ຂໍ້ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ໃນ​ລະດັບ​ມະນຸດ​ຜ່ານ​ການ​ແຜ່​ກະຈາຍ​ແບບ​ແລະ​ການ​ຝຶກ​ອົບຮົມ​ທີ່​ມີ​ການ​ຕໍ່ສູ້​ກັນ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

OpenVoiceOpenVoice ລາຄາ​ຖືກ

ສຽງ​ແບບ​ຄລີນ​ທັນທີ​ດ້ວຍ​ການ​ຄວບຄຸມ​ທີ່​ລະອຽດ​ອ່ອນ​ກວ່າ​ແບບ, ​ອາລົມ, ແລະ​ສຽງ​ອ່ອນ​.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

Sesame CSMSesame CSM ລາຄາ​ຖືກ

ແບບຟອມການເວົ້າແບບສົນທະນາທີ່ສ້າງການສົນທະນາແບບ ທຳ ມະຊາດດ້ວຍເວລາທີ່ເໝາະສົມແລະອາລົມ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ພາສາ: en, zh, ja, ko, fr, de, it, es

ក្លូន​ສຽງ

IndexTTS-2IndexTTS-2

Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.

ພາສາ: en, zh

ក្លូន​ສຽງ

Spark TTSSpark TTS

ການ​ກັ່ນຕອງ​ສຽງ TTS ດ້ວຍ​ອາລົມ​ທີ່​ສາມາດ​ຄວບຄຸມ​ໄດ້ ແລະ ແບບ​ເວົ້າ​ຜ່ານ​ການ​ແຈ້ງ​ເຕືອນ.

ພາສາ: en, zh

ក្លូន​ສຽງ

GPT-SoVITSGPT-SoVITS

ສຽງ​ທີ່​ໄດ້​ຮັບ​ການ​ກັ່ນຕອງ​ສຽງ​ TTS ທີ່​ເຮັດ​ໃຫ້​ສຽງ​ໃດໆ​ມີ​ສຽງ​ຄື​ກັນ​ກັບ​ສຽງ​ທີ່​ໄດ້​ຮັບ​ຈາກ​ສຽງ​5ວິນາທີ​ເທົ່ານັ້ນ.

ພາສາ: en, zh, ja, ko

ក្លូន​ສຽງ

ChatterboxChatterbox

ເຕັກໂນໂລຊີ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ບໍ່​ມີ​ສຽງ​ກັບ​ການ​ຄວບຄຸມ​ອາລົມ​ຈາກ Resemble AI.

ພາສາ: en

ក្លូន​ສຽງ

Tortoise TTSTortoise TTS

ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ​ຫຼາຍ​ສຽງ​ທີ່​ສຸມ​ໃສ່​ຄຸນ​ນະ​ພາບ​ດ້ວຍ​ໂຄງ​ສ້າງ​ໂຄງ​ສ້າງ​ທີ່​ກັບ​ຄືນ​ໄປ​ບ່ອນ​ເອງ.

ພາສາ: en

ក្លូន​ສຽງ

OpenVoiceOpenVoice

ສຽງ​ແບບ​ຄລີນ​ທັນທີ​ດ້ວຍ​ການ​ຄວບຄຸມ​ທີ່​ລະອຽດ​ອ່ອນ​ກວ່າ​ແບບ, ​ອາລົມ, ແລະ​ສຽງ​ອ່ອນ​.

ພາສາ: en, zh, ja, ko, fr, es

ក្លូន​ສຽງ

VieNeu-TTS-v2VieNeu-TTS-v2

ພາສາຫວຽດ + ພາສາອັງກິດ ປ່ຽນລະຫັດ TTS ດ້ວຍສຽງ7ສຽງ ແລະ ສຽງທີ່ບໍ່ມີສຽງ. CPU-only, ບໍ່ຕ້ອງການ GPU.

ພາສາ: vi, en

ក្លូន​ສຽງ

Chatterbox TurboChatterbox Turbo

Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.

ພາສາ: en

ក្លូន​ສຽງ

VoxCPMVoxCPM

Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.

ພາສາ: en, zh

ក្លូន​ສຽງ

OuteTTSOuteTTS

LLM-based TTS ທີ່ແລ່ນຢູ່ໃນ CPU, GPU, ຫຼື ເວບໄຊທ໌ຜ່ານ llama.cpp ແລະ Transformers.js.

ພາສາ: en

ក្លូន​ສຽງ

Pocket TTSPocket TTS

ແບບຈໍາລອງ​ຕົວ​ເລກ​ເບົາ 100M ໂດຍ Kyutai ທີ່ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ຈາກ​ຕົວຢ່າງ​ດຽວ.

ພາສາ: en, fr

ក្លូន​ສຽງ

CosyVoice3CosyVoice3

TTS ຫຼາຍພາສາລຸ້ນຕໍ່ໄປທີ່ມີ bi-streaming, ການຄວບຄຸມອາລົມ, ແລະ ການກັ່ນຕອງສຽງແບບ zero-shot.

ພາສາ: en, zh, ja, ko, de, es, fr, it, ru

ក្លូន​ສຽງ

NAMAA Saudi TTSNAMAA Saudi TTS

ພາສາ​ອາຣັບ​ຊາອຸດີ​ທີ່​ເປີດ​ໃຊ້​ໄດ້​ຄັ້ງ​ທຳ​ອິດ​ທີ່​ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ແບບ Chatterbox.

ພາສາ: ar

ក្លូន​ສຽງ

Darwin TTSDarwin TTS

ຕົວແປ Qwen3- TTS ແບບ cross- mode ທີ່ມີນໍ້າໜັກ FFN ຖືກປະສົມຈາກແບບຟອມພາສາ Qwen3- 1. 7B ເພື່ອການ​ກັ່ນຕອງ​ພາສາ​ຫຼາຍພາສາ​ທີ່​ຊັດເຈນ​ກວ່າ.

ພາສາ: en, ko, ja, zh

ក្លូន​ສຽງ

MOSS-TTSDMOSS-TTSD

ແບບຟອມການສົນທະນາແບບຕໍ່ເນື່ອງຂອງຫຼາຍຄົນ - ສ້າງການສົນທະນາແບບ podcast ທີ່ມີຜູ້ເວົ້າເຖິງ5ຄົນແລະ 60 ນາທີຂອງສຽງທີ່ເປັນເອກະພາບ.

ພາສາ: en, zh

ក្លូន​ສຽງ

Ming-Omni TTSMing-Omni TTS

ແບບຈໍາລອງການເວົ້າແບບ omni-modal 0.5B ຈາກ inclusionAI ທີ່ມີຜົນຜະລິດ 44.1kHz ທີ່ມີຄຸນນະພາບສູງແລະການກັ່ນຕອງສຽງແບບ zero-shot.

ພາສາ: en, zh

ក្លូន​ສຽງ

MOSS-TTS NanoMOSS-TTS Nano

100M MOSS-TTS ນ້ອຍໆ - ສະຖາປັດຕະຍະກໍາດຽວກັນ, 80x ນ້ອຍກວ່າ, ເວລາລໍຖ້າຟຣີ.

ພາສາ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

ក្លូន​ສຽງ

API ສຳລັບ​ຜູ້​ພັດທະນາ​ກ່ອນ

REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. ຈຸດສຸດທ້າຍ ໜຶ່ງ, ແບບ 22+ ແບບ. ການສະ ໜັບ ສະ ໜູນ ການຖ່າຍທອດສົດ ສຳ ລັບແອັບພລິເຄຊັນເວລາຈິງ.

  • ຮູບແບບ​ທີ່​ເຂົ້າ​ກັນ​ໄດ້​ກັບ OpenAI
  • ຖ່າຍທອດ TTS ສຳລັບ​ແອັບພລິເຄຊັນ​ເວລາ​ຈິງ
  • ການ​ປະມວນຜົນ​ຫຼາຍ​ຄັ້ງ​ສຳລັບ​ວຽກ​ທີ່​ໃຫຍ່
  • ການແຈ້ງເຕືອນ Webhook
ເບິ່ງ​ເອກະສານ API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ລາຄາ​ທີ່​ສະ​ອາດ ແລະ ງ່າຍດາຍ

ເລີ່ມຕົ້ນຟຣີ. ຂະ ໜາດ ຕາມທີ່ທ່ານເຕີບໃຫຍ່.

ຟຣີ

$0

15,000 ຕົວອັກສອນ + 5,000/ມື້

  • 7 ແບບຟອມຟຣີລວມທັງ Kokoro
  • 5,000 ຕົວອັກສອນຕໍ່ການ​ສ້າງ
  • ລວມ​ການ​ເຂົ້າ​ເຖິງ API
ລົງທະບຽນຟຣີ

ຕົວ​ເລີ່ມ

$9/ເດືອນ

500 ຄະແນນ/ເດືອນ

  • ທັງໝົດ 22+ ແບບ
  • 100,000 ອັກສອນຕໍ່ການ​ສ້າງ
  • ການ​ກັ່ນຕອງ​ສຽງ
ເລີ່ມຕົ້ນ
ນິຍົມທີ່ສຸດ

ມືອາຊີບ

$29/ເດືອນ

2,000,000 ຕົວອັກສອນ/ເດືອນ

  • ທຸກຢ່າງໃນ Starter
  • ການ​ເຂົ້າ​ເຖິງ API
  • ການ​ປະມວນຜົນ​ບູລິມະສິດ
ໄດ້ຮັບ​ມື​ອາຊີບ

ທຸລະກິດ

$99/ເດືອນ

10,000,000 ຕົວອັກສອນ/ເດືອນ

  • ທຸກຢ່າງໃນ Pro
  • API ຫຼາຍ
  • ជួរ​អាទិភាព
​ຮັບ​ທຸລະກິດ

ເບິ່ງແຜນທັງຫມົດລວມທັງແຊັດ →

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

TTS.ai ແມ່ນເວທີສຽງ AI ທີ່ກວ້າງຂວາງທີ່ສຸດ, ສະຫນອງ 22+ ແບບຟອມຂໍ້ຄວາມ-ເປັນ-ຄໍາເວົ້າ, ການກັ່ນຕອງສຽງ, ຄໍາເວົ້າ-ເປັນ-ຂໍ້ຄວາມ, ແລະ ເຄື່ອງມືສຽງ. ທຸກໆແບບຟອມແມ່ນ Open Source ໂດຍບໍ່ມີການຂາຍ lock-in.

TTS.ai ສະຫນອງຟຣີຂໍ້ຄວາມ-to-ຄໍາເວົ້າກັບ Kokoro, Piper, VITS, ແລະ MeloTTS ແບບ. ບໍ່ມີບັນຊີທີ່ຕ້ອງການ. ລົງທະບຽນເພື່ອໄດ້ຮັບ 15 ສິນເຊື່ອຟຣີແລະເຂົ້າເຖິງທຸກໆແບບ. ແຜນທີ່ຈ່າຍເລີ່ມຕົ້ນທີ່ $9 / ເດືອນ.

ສຳລັບ​ຄວາມ​ໄວ, ໃຊ້ Kokoro ຫຼື Piper. ສຳລັບ​ຄຸນ​ນະ​ພາບ, ພະຍາຍາມ CosyVoice2ຫຼື StyleTTS 2. ສຳລັບ​ການ​ກັ່ນຕອງ​ສຽງ, ໃຊ້ Chatterbox ຫຼື GPT- SoVITS. ສຳລັບ​ການ​ສົນທະນາ, ໃຊ້ Dia TTS. ທົດລອງ​ໃຊ້​ແບບ​ຫຼາຍໆແບບ​ໃນ​ຂໍ້ຄວາມ​ດຽວ​ກັນ​ເພື່ອ​ທຽບ​ທຽບ.

ຍິນດີຕ້ອນຮັບ. OpenAI-ເຂົ້າກັນໄດ້ REST API ສຳ ລັບ TTS, STT, ການກັ່ນຕອງສຽງ, ແລະເຄື່ອງມືສຽງ. ລວມຢູ່ໃນແຜນທຸກຢ່າງລວມທັງຟຣີ, ດ້ວຍ ຈຳ ກັດອັດຕາທີ່ປັບແຕ່ງໂດຍຊັ້ນ (ຟຣີ: 10 req / min, Lite: 20, Starter: 30, Pro: 60, ທຸລະກິດ: 300). ເບິ່ງເອກະສານທີ່ tts.ai/api/.

ຄຸນ​ນະ​ພາບ​ສຽງ​ແມ່ນ​ແຕກ​ຕ່າງ​ກັນ​ຕາມ​ໂມ​ເດ​ລ. ໂມ​ເດ​ລ​ທີ່​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ​ສູງ​ເຊັ່ນ CosyVoice 2, StyleTTS 2, ແລະ Chatterbox ຜະລິດ​ການ​ເວົ້າ​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ໃກ້​ຄຽງ​ກັບ​ການ​ເວົ້າ​ຂອງ​ມະນຸດ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳ​ມະ​ຊາດ ແລະ ຄວາມ​ຮູ້ສຶກ. ໂມ​ເດ​ລ​ທີ່​ບໍ່​ເສຍ​ຄ່າ​ເຊັ່ນ Kokoro ສະຫນອງ​ຄຸນ​ນະ​ພາບ​ທີ່​ດີ​ເລີດ​ສຳລັບ​ການ​ໃຊ້​ງານ​ຫຼາຍ​ທີ່ສຸດ.

TTS.ai ສະຫນັບສະຫນູນ 30+ ພາສາໃນຮາກຖານຂອງຕົວແບບຂອງມັນ. ພາສາອັງກິດມີຕົວແບບທີ່ກວ້າງທີ່ສຸດ, ແຕ່ຕົວແບບເຊັ່ນ CosyVoice2ປົກຄຸມຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ; GPT-SoVITS ຈັດການຈີນ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ແລະພາສາອັງກິດ; ແລະ MeloTTS ສະຫນັບສະຫນູນພາສາອັງກິດ, ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ.

ຍອມຮັບ. ທຸກໆ​ການ​ປະມວນຜົນ​ແມ່ນ​ເຮັດ​ຢູ່​ເທິງ​ເຊີບເວີ GPU ຂອງພວກເຮົາ. ພວກເຮົາ​ບໍ່​ເກັບ​ຂໍ້ຄວາມ​ທີ່​ເຂົ້າ​ມາ​ຂອງ​ທ່ານ ຫຼື ສຽງ​ທີ່​ໄດ້​ສ້າງ​ຂຶ້ນ​ຫຼັງຈາກ​ສົ່ງ​ອອກ​ໄປ. ຕົວຢ່າງ​ສຽງ​ທີ່​ໄດ້​ອັບ​ໂຫລດ​ໄວ້​ເພື່ອ​ການ​ກລອນ​ຈະ​ຖືກ​ໃຊ້​ໃນ​ໄລຍະ​ປະຊຸມ​ປັດຈຸບັນ​ເທົ່ານັ້ນ ແລະ ຈະ​ບໍ່​ຖືກ​ເກັບ​ໄວ້. ພວກເຮົາ​ບໍ່​ເຄີຍ​ແບ່ງປັນ​ຂໍ້ມູນ​ຂອງທ່ານ​ກັບ​ພາກສ່ວນ​ທີ​ສາມ ຫຼື ໃຊ້​ມັນ​ເພື່ອ​ຝຶກ​ແບບ​ແບບ​ຕ່າງໆ.

ແມ່ນແລ້ວ. ສຽງທັງຫມົດທີ່ຜະລິດຢູ່ໃນ TTS.ai ແມ່ນຂອງທ່ານທີ່ຈະນໍາໃຊ້ການຄ້າ, ລວມທັງສໍາລັບວິດີໂອ YouTube, podcasts, audiobooks, apps, ການໂຄສະນາ, ແລະຜະລິດຕະພັນ. ຕົວແບບຂອງພວກເຮົາແມ່ນແຫຼ່ງເປີດພາຍໃຕ້ໃບອະນຸຍາດ permissive (MIT, Apache 2.0).

TTS.ai ສ້າງສຽງໃນຮູບແບບ WAV ໂດຍ default ສໍາລັບຄຸນນະພາບສູງສຸດ. ທ່ານສາມາດປ່ຽນເປັນ MP3, FLAC, OGG, ຫຼື M4A ໂດຍໃຊ້ເຄື່ອງມືການປ່ຽນສຽງຟຣີຂອງພວກເຮົາ. API ສະຫນັບສະຫນູນການກໍານົດຮູບແບບຜົນອອກທີ່ທ່ານຕ້ອງການໂດຍກົງໃນຄໍາຮ້ອງຂໍ.

ອັບໂຫລດຕົວຢ່າງສຽງສັ້ນໆ (ບໍ່ເກີນ5ວິນາທີ) ຂອງສຽງທີ່ທ່ານຕ້ອງການຖ່າຍທອດ, ຫຼັງຈາກນັ້ນພິມຂໍ້ຄວາມໃດໆເພື່ອສ້າງການເວົ້າໃນສຽງນັ້ນ. ແບບຢ່າງເຊັ່ນ Chatterbox, GPT-SoVITS, ແລະ CosyVoice2ສະໜັບສະໜູນການຖ່າຍທອດສຽງ. ສຽງທີ່ຖ່າຍທອດໄດ້ບັນທຶກສຽງ, ຕົວອັກສອນ, ແລະ ຮູບແບບການເວົ້າ.

ແບບຟອມຟຣີ (Kokoro, Piper, VITS, MeloTTS) ບໍ່ຕ້ອງການບັນຊີ ແລະ ຄ່າຕົວອັກສອນສະເລ່ຍ. ແບບຟອມມາດຕະຖານ (2,000 ຕົວອັກສອນ/1K ເຂົ້າ) ລວມມີ Bark, CosyVoice 2, F5-TTS, ແລະ Dia. ແບບຟອມພິເສດ (4,000 ຕົວອັກສອນ/1K ເຂົ້າ) ລວມມີ OpenVoice, Chatterbox, StyleTTS 2, ແລະ Tortoise. ແບບຟອມທີ່ຈ່າຍໂດຍທົ່ວໄປແລ້ວໃຫ້ຄຸນນະພາບສູງຂຶ້ນ, ສຽງຫຼາຍຂຶ້ນ, ແລະ ຄຸນລັກສະນະເພີ່ມເຕີມເຊັ່ນ: ການກັ່ນຕອງສຽງ.

ຍິນດີຕ້ອນຮັບ. API ສະຫນັບສະຫນູນການປຸງແຕ່ງ batch ສໍາລັບການປ່ຽນຂະຫນາດໃຫຍ່ຂອງຂໍ້ຄວາມໄປເວົ້າ. ສົ່ງຄໍາຮ້ອງຂໍຫຼາຍແລະດາວໂຫລດຜົນໄດ້ຮັບ asynchronously ໂດຍໃຊ້ວຽກ UUIDs. ແຜນທຸລະກິດ ($99 / ເດືອນ) ແລະສູງກວ່າປະກອບມີການເຂົ້າເຖິງທີ່ສໍາຄັນໃນລໍາດັບສໍາລັບການປຸງແຕ່ງ batch ໄວຂຶ້ນ. ເຫມາະສົມສໍາລັບການຜະລິດ audiobook, ເນື້ອໃນຫຼັກສູດ, ແລະໂຄງການ voiceover ຂະໜາດໃຫຍ່.
4.1/5 (42)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ເລີ່ມ​ໃຊ້ AI Voice ມື້ນີ້

ເຂົ້າຮ່ວມຜູ້ສ້າງ, ຜູ້ພັດທະນາ, ແລະ ທຸລະກິດທີ່ໃຊ້ TTS.ai