AI ແບບ​ຟຣີ ຂໍ້ຄວາມ​ເປັນ​ການ​ເວົ້າName

31+ ແບບ open-source, 231+ ສຽງ, 34+ ພາສາ. ບໍ່ມີ​ບັນຊີ​ທີ່​ຕ້ອງການ.

8K+
ຜູ້​បង្កើត
32K+
​ລຸ້ນ
31+
ຕົວແບບ AI
231+
ສຽງ
0/500 ​តួ​អក្សរ · Sign up for 5,000 per generation → ຟຣີ
ຮັກ TTS.ai? ເວົ້າກັບເພື່ອນຂອງທ່ານ!

ທຸກສິ່ງທຸກຢ່າງທີ່​ທ່ານ​ຕ້ອງການ​ສຳລັບ​ສຽງ AI

ເຄື່ອງມື 30+ ທີ່ມີພະລັງຈາກແບບ ຈຳ ລອງ AI ແຫຼ່ງເປີດ

31+ ແບບຟອມ​ສຽງ AI

ການ​ເກັບ​ກໍາ​ແບບ​ຟອມ TTS ແບບ​ເປີດ​ແຫຼ່ງ​ທີ່​ກວ້າງຂວາງ​ທີ່ສຸດ​ໃນ​ເວບໄຊທ໌​ດຽວ

KokoroKokoro Free

Kokoro ແມ່ນ 82 ລ້ານຕົວແບບການແປພາສາຈາກຂໍ້ຄວາມເປັນສຽງທີ່ຕີໄດ້ດີກວ່າລະດັບນໍ້າໜັກຂອງມັນ. ເຖິງວ່າຈະມີຂະ ໜາດ ນ້ອຍ, ມັນກໍ່ຜະລິດການເວົ້າທີ່ ໜ້າ ສົນໃຈແລະສະແດງອອກ. Kokoro ສະຫນັບສະຫນູນຫຼາຍພາສາລວມທັງພາສາອັງກິດ, ຍີ່ປຸ່ນ, ຈີນ, ແລະເກົາຫຼີດ້ວຍສຽງສະແດງອອກທີ່ຫຼາກຫຼາຍ. ມັນແລ່ນໄວຫຼາຍ — ສ້າງສຽງເກືອບ 100x ໄວກວ່າເວລາຈິງໃນ GPU.

ດີທີ່ສຸດ ສຳ ລັບ: TTS ທີ່ມີຄຸນນະພາບສູງດ້ວຍຄວາມຊ້າສຸດ, កម្មវិធី​ດາວໂຫລດ

ທົດລອງຟຣີ

PiperPiper Free

Piper ແມ່ນເຄື່ອງຈັກການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ເບົາບາງທີ່ພັດທະນາໂດຍ Rhasspy ເຊິ່ງໃຊ້ VITS ແລະ larynx architectures. ມັນແລ່ນທັງ ໝົດ ເທິງ CPU, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບອຸປະກອນ Edge, ອັດຕະໂນມັດໃນເຮືອນ, ແລະ ຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການ TTS ນອກອິນເຕີເນັດ. ດ້ວຍສຽງຫຼາຍກວ່າ 100 ຜ່ານ 30 + ພາສາ, Piper ສົ່ງຄໍາເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດໃນຄວາມໄວທີ່ແທ້ຈິງເຖິງແມ່ນວ່າຢູ່ໃນ Raspberry Pi 4.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ເບິ່ງ​ກ່ອນ​ໄວ, ການ​ເຂົ້າ​ເຖິງ​ງ່າຍ, ແລະ​ໂປແກຼມ​ທີ່​ຖືກ​ຝັງ​ໄວ້

ທົດລອງຟຣີ

VITSVITS Free

VITS (ການ​ຄິດ​ໄລ່​ຄວາມ​ແຕກຕ່າງ​ດ້ວຍ​ການ​ຮຽນ​ຮູ້​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ເພື່ອ​ການ​ແປ​ຂໍ້​ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ຈາກ​ຕົ້ນ​ເຖິງ​ທ້າຍ) ແມ່ນ​ວິທີການ​ TTS ແບບ​ຄຽງ​ຄູ່​ກັນ​ລະຫວ່າງ​ຕົ້ນ​ເຖິງ​ທ້າຍ​ທີ່​ຜະລິດ​ສຽງ​ທີ່​ມີ​ສຽງ​ທໍາມະຊາດ​ຫຼາຍ​ຂຶ້ນ​ກວ່າ​ແບບ​ແບບ​ສອງ​ຂັ້ນ​ທີ່​ມີ​ຢູ່​ໃນ​ປັດຈຸບັນ. ມັນ​ໃຊ້​ການຄິດໄລ່​ຄວາມ​ແຕກຕ່າງ​ທີ່​ເພີ່ມ​ຂຶ້ນ​ດ້ວຍ​ການ​ປ່ຽນ​ແປງ​ຂອງ​ການ​ໄຫຼ ແລະ ຂະບວນການ​ຝຶກ​ອົບຮົມ​ທີ່​ມີ​ການ​ຕໍ່​ສູ້​ກັນ, ເຮັດໃຫ້​ການ​ປັບ​ປຸງ​ທີ່​ມີ​ຄວາມ​ໝາຍ​ໃນ​ການ​ເວົ້າ​ທີ່​ມີ​ຄວາມ​ເປັນ​ທໍາ​ມະ​ຊາດ​ຫຼາຍ​ຂຶ້ນ.

ດີທີ່ສຸດ ສຳ ລັບ: ຂໍ້ຄວາມ​ໄປ​ສູ່​ການ​ເວົ້າ​ແບບ​ທົ່ວໄປ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳມະຊາດ

ທົດລອງຟຣີ

MeloTTSMeloTTS Free

MeloTTS ໂດຍ MyShell.ai ແມ່ນຫ້ອງສະໝຸດ TTS ຫຼາຍພາສາທີ່ສະຫນັບສະຫນູນພາສາອັງກິດ (ອາເມລິກາ, ບຣາຊິນ, ອິນເດຍ, ອົດສະຕາລີ), ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ. ມັນໄວຫຼາຍ, ຂະບວນການຂໍ້ຄວາມທີ່ໃກ້ກັບຄວາມໄວເວລາຈິງໃນ CPU ດຽວ. MeloTTS ແມ່ນອອກແບບສໍາລັບການໃຊ້ງານການຜະລິດແລະສະຫນັບສະຫນູນທັງ CPU ແລະ GPU ຜົນການຄິດໄລ່.

ດີທີ່ສຸດ ສຳ ລັບ: ໂປແກຼມ​ຜະລິດ​ທີ່​ຕ້ອງການ TTS ໄວ, ຫຼາຍ​ພາສາ

ທົດລອງຟຣີ

OuteTTSOuteTTS Free

OuteTTS ຂະຫຍາຍຕົວແບບພາສາໃຫຍ່ທີ່ມີຄວາມສາມາດໃນການແປພາສາໃນຂະນະດຽວກັນຮັກສາໂຄງສ້າງຕົ້ນສະບັບ. ມັນສະຫນັບສະຫນູນ backends ຫຼາຍຢ່າງລວມທັງ llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ແລະເຖິງແມ່ນວ່າການຄາດຄະເນຂອງຕົວທ່ອງເວັບຜ່ານ Transformers.js. ຄຸນສົມບັດການກັ່ນຕອງສຽງຜ່ານໂປຼໄຟລ໌ຜູ້ເວົ້າທີ່ເກັບໄວ້ເປັນ JSON.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ຈັດ​ຕັ້ງ​ໃຊ້ Edge, TTS ທີ່ມີ​ພື້ນຖານ​ໃນ​ຕົວ​ທ່ອງ​ເວັບ, ສະພາບແວດລ້ອມ​ທີ່​ມີ​ຊັບພະຍາກອນ​ຕ່ຳ

ທົດລອງຟຣີ

Pocket TTSPocket TTS Free

Pocket TTS ໂດຍ Kyutai (ຜູ້ສ້າງ Moshi) ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ມີຂະໜາດນ້ອຍ 100M ທີ່ມີນໍ້າໜັກເບົາກວ່າ. ມັນສາມາດໃຊ້ງານໄດ້ຢ່າງມີປະສິດຕິພາບໃນ CPU, ສະຫນັບສະຫນູນການກັ່ນຕອງສຽງແບບ zero-shot ຈາກຕົວຢ່າງສຽງດຽວ, ແລະຜະລິດສຽງເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດ. ຂະໜາດຂອງແບບຟອມທີ່ນ້ອຍເຮັດໃຫ້ມັນ ເໝາະ ສົມກັບການຕິດຕັ້ງດ້ານນອກແລະສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ໍາ.

ດີທີ່ສຸດ ສຳ ລັບ: ການ​ຈັດ​ຕັ້ງ​ໃຊ້​ເບົາ, ສະພາບແວດລ້ອມ CPU-only, ການ​ກັ່ນຕອງ​ສຽງ​ຢ່າງ​ໄວ

ທົດລອງຟຣີ

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ດີທີ່ສຸດ ສຳ ລັບ: Fast lightweight TTS, edge deployment, low-latency applications

ທົດລອງຟຣີ

BarkBark Standard

ແບບຈໍາລອງ​ຂໍ້ຄວາມ​ເປັນ​ສຽງ​ທີ່​ອີງ​ໃສ່​ການ​ປ່ຽນ​ແປງ​ທີ່​ສ້າງ​ການ​ເວົ້າ, ດົນຕີ ແລະ ຜົນ​ສະທ້ອນ​ສຽງ​ທີ່​ເປັນ​ຈິງ.

ຜູ້​ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

Bark SmallBark Small Standard

ເວີຊັນເບົາກວ່າຂອງ Bark ດ້ວຍ​ການ​ຄິດໄລ່​ໄວກວ່າ ແລະ ຫຼຸດ​ການ​ໃຊ້​ຄວາມ​ຈຳ​ລົງ

ຜູ້​ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ຜູ້​ພັດທະນາ: Alibaba (Tongyi Lab) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Dia TTSDia TTS Standard

ແບບຟອມ​ການ​ສ້າງ​ການ​ສົນທະນາ​ຂອງ​ຜູ້​ເວົ້າ​ຫຼາຍ​ຄົນ​ທີ່​ສ້າງ​ການ​ສົນທະນາ​ແບບ​ທຳມະຊາດ​ລະຫວ່າງ​ຜູ້​ເວົ້າ​

ຜູ້​ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Parler TTSParler TTS Standard

ອະທິບາຍສຽງທີ່ທ່ານຕ້ອງການໃນພາສາທໍາມະຊາດ ແລະ Parler ຈະສ້າງການເວົ້າທີ່ກົງກັນ.

ຜູ້​ພັດທະນາ: Hugging Face · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

GLM-TTSGLM-TTS Standard

ບັນລຸ​ອັດຕາ​ຄວາມຜິດພາດ​ຕົວອັກສອນ​ຕ່ຳ​ສຸດ​ໃນ​ບັນດາ​ແບບ​ຟອມ TTS ແຫຼ່ງ​ເປີດ.

ຜູ້​ພັດທະນາ: Zhipu AI · ໃບອະນຸຍາດ: GLM-4 License

ທົດລອງໃຊ້

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.

ຜູ້​ພັດທະນາ: Index Team · ໃບອະນຸຍາດ: Bilibili Model License

ທົດລອງໃຊ້

Spark TTSSpark TTS Standard

ການ​ກັ່ນຕອງ​ສຽງ TTS ດ້ວຍ​ອາລົມ​ທີ່​ສາມາດ​ຄວບຄຸມ​ໄດ້ ແລະ ແບບ​ເວົ້າ​ຜ່ານ​ການ​ແຈ້ງ​ເຕືອນ.

ຜູ້​ພັດທະນາ: SparkAudio · ໃບອະນຸຍາດ: CC BY-NC-SA 4.0

ທົດລອງໃຊ້

GPT-SoVITSGPT-SoVITS Standard

ສຽງ​ທີ່​ໄດ້​ຮັບ​ການ​ກັ່ນຕອງ​ສຽງ​ TTS ທີ່​ເຮັດ​ໃຫ້​ສຽງ​ໃດໆ​ມີ​ສຽງ​ຄື​ກັນ​ກັບ​ສຽງ​ທີ່​ໄດ້​ຮັບ​ຈາກ​ສຽງ​5ວິນາທີ​ເທົ່ານັ້ນ.

ຜູ້​ພັດທະນາ: RVC-Boss · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

OrpheusOrpheus Standard

ແບບຈໍາລອງ TTS ລະດັບມະນຸດທີ່ຮຽນຮູ້ຈາກຂໍ້ມູນການເວົ້າ 100K ຊົ່ວໂມງ.

ຜູ້​ພັດທະນາ: Canopy Labs · ໃບອະນຸຍາດ: Llama 3.2 Community

ທົດລອງໃຊ້

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ຜູ້​ພັດທະນາ: Alibaba (Qwen) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

Chatterbox TurboChatterbox Turbo Standard

Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.

ຜູ້​ພັດທະນາ: Resemble AI · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

Dia 2Dia 2 Standard

ສຽງ​ເວົ້າ​ແບບ​ດັງ​ໆ​ທີ່​ມີ​ການ​ສົນທະນາ​ກັບ​ຜູ້​ເວົ້າ​ຫຼາຍ​ຄົນ ແລະ ຄໍາແນະນໍາ​ທາງ​ພາສາ​

ຜູ້​ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

VoxCPMVoxCPM Standard

Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.

ຜູ້​ພັດທະນາ: OpenBMB · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

TADATADA Standard

Zero-Hallucination TTS ທີ່ມີຂໍ້ຄວາມ-acoustic ສອງການວາງເດີມພັນ, 5x ໄວກວ່າທຽບເທົ່າ LLM TTS.

ຜູ້​ພັດທະນາ: Hume AI · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

VibeVoiceVibeVoice Standard

ແບບຟອມ Microsoft ສຳ ລັບເນື້ອໃນແບບຟອມຍາວທີ່ມີຜູ້ເວົ້າຫຼາຍຄົນເຊັ່ນ Podcasts ແລະ Audiobooks.

ຜູ້​ພັດທະນາ: Microsoft · ໃບອະນຸຍາດ: MIT

ທົດລອງໃຊ້

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ຜູ້​ພັດທະນາ: Alibaba (FunAudioLLM) · ໃບອະນຸຍາດ: Apache 2.0

ທົດລອງໃຊ້

ChatterboxChatterbox Premium

ເຕັກໂນໂລຊີ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ບໍ່​ມີ​ສຽງ​ກັບ​ການ​ຄວບຄຸມ​ອາລົມ​ຈາກ Resemble AI.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

Tortoise TTSTortoise TTS Premium

ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ​ຫຼາຍ​ສຽງ​ທີ່​ສຸມ​ໃສ່​ຄຸນ​ນະ​ພາບ​ດ້ວຍ​ໂຄງ​ສ້າງ​ໂຄງ​ສ້າງ​ທີ່​ກັບ​ຄືນ​ໄປ​ບ່ອນ​ເອງ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

StyleTTS 2StyleTTS 2 Premium

ຂໍ້ຄວາມ​ເປັນ​ຄຳ​ເວົ້າ​ໃນ​ລະດັບ​ມະນຸດ​ຜ່ານ​ການ​ແຜ່​ກະຈາຍ​ແບບ​ແລະ​ການ​ຝຶກ​ອົບຮົມ​ທີ່​ມີ​ການ​ຕໍ່ສູ້​ກັນ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

OpenVoiceOpenVoice Premium

ສຽງ​ແບບ​ຄລີນ​ທັນທີ​ດ້ວຍ​ການ​ຄວບຄຸມ​ທີ່​ລະອຽດ​ອ່ອນ​ກວ່າ​ແບບ, ​ອາລົມ, ແລະ​ສຽງ​ອ່ອນ​.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

Sesame CSMSesame CSM Premium

ແບບຟອມການເວົ້າແບບສົນທະນາທີ່ສ້າງການສົນທະນາແບບ ທຳ ມະຊາດດ້ວຍເວລາທີ່ເໝາະສົມແລະອາລົມ.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ຄຸນ​ນະ​ພາບ:

ທົດລອງໃຊ້

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ພາສາ: en, zh, ja, ko, fr, de, it, es

ក្លូន​ສຽງ

GLM-TTSGLM-TTS

ບັນລຸ​ອັດຕາ​ຄວາມຜິດພາດ​ຕົວອັກສອນ​ຕ່ຳ​ສຸດ​ໃນ​ບັນດາ​ແບບ​ຟອມ TTS ແຫຼ່ງ​ເປີດ.

ພາສາ: en, zh

ក្លូន​ສຽງ

IndexTTS-2IndexTTS-2

Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.

ພາສາ: en, zh

ក្លូន​ສຽງ

Spark TTSSpark TTS

ການ​ກັ່ນຕອງ​ສຽງ TTS ດ້ວຍ​ອາລົມ​ທີ່​ສາມາດ​ຄວບຄຸມ​ໄດ້ ແລະ ແບບ​ເວົ້າ​ຜ່ານ​ການ​ແຈ້ງ​ເຕືອນ.

ພາສາ: en, zh

ក្លូន​ສຽງ

GPT-SoVITSGPT-SoVITS

ສຽງ​ທີ່​ໄດ້​ຮັບ​ການ​ກັ່ນຕອງ​ສຽງ​ TTS ທີ່​ເຮັດ​ໃຫ້​ສຽງ​ໃດໆ​ມີ​ສຽງ​ຄື​ກັນ​ກັບ​ສຽງ​ທີ່​ໄດ້​ຮັບ​ຈາກ​ສຽງ​5ວິນາທີ​ເທົ່ານັ້ນ.

ພາສາ: en, zh, ja, ko

ក្លូន​ສຽງ

ChatterboxChatterbox

ເຕັກໂນໂລຊີ​ການ​ຖ່າຍ​ແບບ​ສຽງ​ແບບ​ບໍ່​ມີ​ສຽງ​ກັບ​ການ​ຄວບຄຸມ​ອາລົມ​ຈາກ Resemble AI.

ພາສາ: en

ក្លូន​ສຽງ

Tortoise TTSTortoise TTS

ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າ​ຫຼາຍ​ສຽງ​ທີ່​ສຸມ​ໃສ່​ຄຸນ​ນະ​ພາບ​ດ້ວຍ​ໂຄງ​ສ້າງ​ໂຄງ​ສ້າງ​ທີ່​ກັບ​ຄືນ​ໄປ​ບ່ອນ​ເອງ.

ພາສາ: en

ក្លូន​ສຽງ

OpenVoiceOpenVoice

ສຽງ​ແບບ​ຄລີນ​ທັນທີ​ດ້ວຍ​ການ​ຄວບຄຸມ​ທີ່​ລະອຽດ​ອ່ອນ​ກວ່າ​ແບບ, ​ອາລົມ, ແລະ​ສຽງ​ອ່ອນ​.

ພາສາ: en, zh, ja, ko, fr, de, es, it

ក្លូន​ສຽງ

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ພາສາ: en, zh, ja, ko, de, fr, ru, pt, es, it

ក្លូន​ສຽງ

Chatterbox TurboChatterbox Turbo

Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.

ພາສາ: en

ក្លូន​ສຽງ

VoxCPMVoxCPM

Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.

ພາສາ: en, zh

ក្លូន​ສຽງ

OuteTTSOuteTTS

LLM-based TTS ທີ່ແລ່ນຢູ່ໃນ CPU, GPU, ຫຼື ເວບໄຊທ໌ຜ່ານ llama.cpp ແລະ Transformers.js.

ພາສາ: en

ក្លូន​ສຽງ

Pocket TTSPocket TTS

ແບບຈໍາລອງ​ຕົວ​ເລກ​ເບົາ 100M ໂດຍ Kyutai ທີ່ມີ​ການ​ກັ່ນຕອງ​ສຽງ​ຈາກ​ຕົວຢ່າງ​ດຽວ.

ພາສາ: en, fr

ក្លូន​ສຽງ

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ພາສາ: en, zh, ja, ko, de, es, fr, it, ru

ក្លូន​ສຽງ

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ພາສາ: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

ក្លូន​ສຽງ

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ພາສາ: en, zh

ក្លូន​ສຽງ

API ສຳລັບ​ຜູ້​ພັດທະນາ​ກ່ອນ

REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. ຈຸດສຸດທ້າຍ ໜຶ່ງ, ແບບ 22+ ແບບ. ການສະ ໜັບ ສະ ໜູນ ການຖ່າຍທອດສົດ ສຳ ລັບແອັບພລິເຄຊັນເວລາຈິງ.

  • ຮູບແບບ​ທີ່​ເຂົ້າ​ກັນ​ໄດ້​ກັບ OpenAI
  • ຖ່າຍທອດ TTS ສຳລັບ​ແອັບພລິເຄຊັນ​ເວລາ​ຈິງ
  • ການ​ປະມວນຜົນ​ຫຼາຍ​ຄັ້ງ​ສຳລັບ​ວຽກ​ທີ່​ໃຫຍ່
  • ການແຈ້ງເຕືອນ Webhook
ເບິ່ງ​ເອກະສານ API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ລາຄາ​ທີ່​ສະ​ອາດ ແລະ ງ່າຍດາຍ

ເລີ່ມຕົ້ນຟຣີ. ຂະ ໜາດ ຕາມທີ່ທ່ານເຕີບໃຫຍ່.

ຟຣີ

$0

15 ຄະແນນ

  • Kokoro, Piper, VITS, MeloTTS
  • ຈໍາກັດ​ຕົວ​ອັກສອນ 500
  • 3 ເດືອນ/ຊົ່ວໂມງ (ບໍ່ມີບັນຊີ)
ລົງທະບຽນຟຣີ

ຕົວ​ເລີ່ມ

$9/ເດືອນ

500 ຄະແນນ/ເດືອນ

  • ທັງໝົດ 22+ ແບບ
  • 100,000 ອັກສອນຕໍ່ການ​ສ້າງ
  • ການ​ກັ່ນຕອງ​ສຽງ
ເລີ່ມຕົ້ນ
ນິຍົມທີ່ສຸດ

ມືອາຊີບ

$29/ເດືອນ

2,000,000 ຕົວອັກສອນ/ເດືອນ

  • ທຸກຢ່າງໃນ Starter
  • ການ​ເຂົ້າ​ເຖິງ API
  • ການ​ປະມວນຜົນ​ບູລິມະສິດ
ໄດ້ຮັບ​ມື​ອາຊີບ

ທຸລະກິດ

$99/ເດືອນ

10,000,000 ຕົວອັກສອນ/ເດືອນ

  • ທຸກຢ່າງໃນ Pro
  • API ຫຼາຍ
  • ជួរ​អាទិភាព
​ຮັບ​ທຸລະກິດ

ເບິ່ງແຜນທັງຫມົດລວມທັງແຊັດ →

ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ

TTS.ai ແມ່ນເວທີສຽງ AI ທີ່ກວ້າງຂວາງທີ່ສຸດ, ສະຫນອງ 22+ ແບບຟອມຂໍ້ຄວາມ-ເປັນ-ຄໍາເວົ້າ, ການກັ່ນຕອງສຽງ, ຄໍາເວົ້າ-ເປັນ-ຂໍ້ຄວາມ, ແລະ ເຄື່ອງມືສຽງ. ທຸກໆແບບຟອມແມ່ນ Open Source ໂດຍບໍ່ມີການຂາຍ lock-in.

TTS.ai ສະຫນອງຟຣີຂໍ້ຄວາມ-to-ຄໍາເວົ້າກັບ Kokoro, Piper, VITS, ແລະ MeloTTS ແບບ. ບໍ່ມີບັນຊີທີ່ຕ້ອງການ. ລົງທະບຽນເພື່ອໄດ້ຮັບ 15 ສິນເຊື່ອຟຣີແລະເຂົ້າເຖິງທຸກໆແບບ. ແຜນທີ່ຈ່າຍເລີ່ມຕົ້ນທີ່ $9 / ເດືອນ.

ສຳລັບ​ຄວາມ​ໄວ, ໃຊ້ Kokoro ຫຼື Piper. ສຳລັບ​ຄຸນ​ນະ​ພາບ, ພະຍາຍາມ CosyVoice2ຫຼື StyleTTS 2. ສຳລັບ​ການ​ກັ່ນຕອງ​ສຽງ, ໃຊ້ Chatterbox ຫຼື GPT- SoVITS. ສຳລັບ​ການ​ສົນທະນາ, ໃຊ້ Dia TTS. ທົດລອງ​ໃຊ້​ແບບ​ຫຼາຍໆແບບ​ໃນ​ຂໍ້ຄວາມ​ດຽວ​ກັນ​ເພື່ອ​ທຽບ​ທຽບ.

ຍິນດີຕ້ອນຮັບ. OpenAI-ເຂົ້າກັນໄດ້ REST API ສໍາລັບ TTS, STT, ສຽງ cloning, ແລະເຄື່ອງມືສຽງ. ມີຢູ່ໃນ Pro ($29 / ເດືອນ) ແລະ Enterprise ($99 / ເດືອນ) ແຜນ. ເບິ່ງເອກະສານທີ່ tts.ai/api/.

ຄຸນ​ນະ​ພາບ​ສຽງ​ແມ່ນ​ແຕກ​ຕ່າງ​ກັນ​ຕາມ​ໂມ​ເດ​ລ. ໂມ​ເດ​ລ​ທີ່​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ​ສູງ​ເຊັ່ນ CosyVoice 2, StyleTTS 2, ແລະ Chatterbox ຜະລິດ​ການ​ເວົ້າ​ທີ່​ມີ​ຄຸນ​ນະ​ພາບ​ໃກ້​ຄຽງ​ກັບ​ການ​ເວົ້າ​ຂອງ​ມະນຸດ​ດ້ວຍ​ການ​ເວົ້າ​ແບບ​ທຳ​ມະ​ຊາດ ແລະ ຄວາມ​ຮູ້ສຶກ. ໂມ​ເດ​ລ​ທີ່​ບໍ່​ເສຍ​ຄ່າ​ເຊັ່ນ Kokoro ສະຫນອງ​ຄຸນ​ນະ​ພາບ​ທີ່​ດີ​ເລີດ​ສຳລັບ​ການ​ໃຊ້​ງານ​ຫຼາຍ​ທີ່ສຸດ.

TTS.ai ສະຫນັບສະຫນູນ 30+ ພາສາໃນຮາກຖານຂອງຕົວແບບຂອງມັນ. ພາສາອັງກິດມີຕົວແບບທີ່ກວ້າງທີ່ສຸດ, ແຕ່ຕົວແບບເຊັ່ນ CosyVoice2ປົກຄຸມຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ; GPT-SoVITS ຈັດການຈີນ, ຍີ່ປຸ່ນ, ເກົາຫຼີ, ແລະພາສາອັງກິດ; ແລະ MeloTTS ສະຫນັບສະຫນູນພາສາອັງກິດ, ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ.

ຍອມຮັບ. ທຸກໆ​ການ​ປະມວນຜົນ​ແມ່ນ​ເຮັດ​ຢູ່​ເທິງ​ເຊີບເວີ GPU ຂອງພວກເຮົາ. ພວກເຮົາ​ບໍ່​ເກັບ​ຂໍ້ຄວາມ​ທີ່​ເຂົ້າ​ມາ​ຂອງ​ທ່ານ ຫຼື ສຽງ​ທີ່​ໄດ້​ສ້າງ​ຂຶ້ນ​ຫຼັງຈາກ​ສົ່ງ​ອອກ​ໄປ. ຕົວຢ່າງ​ສຽງ​ທີ່​ໄດ້​ອັບ​ໂຫລດ​ໄວ້​ເພື່ອ​ການ​ກລອນ​ຈະ​ຖືກ​ໃຊ້​ໃນ​ໄລຍະ​ປະຊຸມ​ປັດຈຸບັນ​ເທົ່ານັ້ນ ແລະ ຈະ​ບໍ່​ຖືກ​ເກັບ​ໄວ້. ພວກເຮົາ​ບໍ່​ເຄີຍ​ແບ່ງປັນ​ຂໍ້ມູນ​ຂອງທ່ານ​ກັບ​ພາກສ່ວນ​ທີ​ສາມ ຫຼື ໃຊ້​ມັນ​ເພື່ອ​ຝຶກ​ແບບ​ແບບ​ຕ່າງໆ.

ແມ່ນແລ້ວ. ສຽງທັງຫມົດທີ່ຜະລິດຢູ່ໃນ TTS.ai ແມ່ນຂອງທ່ານທີ່ຈະນໍາໃຊ້ການຄ້າ, ລວມທັງສໍາລັບວິດີໂອ YouTube, podcasts, audiobooks, apps, ການໂຄສະນາ, ແລະຜະລິດຕະພັນ. ຕົວແບບຂອງພວກເຮົາແມ່ນແຫຼ່ງເປີດພາຍໃຕ້ໃບອະນຸຍາດ permissive (MIT, Apache 2.0).

TTS.ai ສ້າງສຽງໃນຮູບແບບ WAV ໂດຍ default ສໍາລັບຄຸນນະພາບສູງສຸດ. ທ່ານສາມາດປ່ຽນເປັນ MP3, FLAC, OGG, ຫຼື M4A ໂດຍໃຊ້ເຄື່ອງມືການປ່ຽນສຽງຟຣີຂອງພວກເຮົາ. API ສະຫນັບສະຫນູນການກໍານົດຮູບແບບຜົນອອກທີ່ທ່ານຕ້ອງການໂດຍກົງໃນຄໍາຮ້ອງຂໍ.

ອັບໂຫລດຕົວຢ່າງສຽງສັ້ນໆ (ບໍ່ເກີນ5ວິນາທີ) ຂອງສຽງທີ່ທ່ານຕ້ອງການຖ່າຍທອດ, ຫຼັງຈາກນັ້ນພິມຂໍ້ຄວາມໃດໆເພື່ອສ້າງການເວົ້າໃນສຽງນັ້ນ. ແບບຢ່າງເຊັ່ນ Chatterbox, GPT-SoVITS, ແລະ CosyVoice2ສະໜັບສະໜູນການຖ່າຍທອດສຽງ. ສຽງທີ່ຖ່າຍທອດໄດ້ບັນທຶກສຽງ, ຕົວອັກສອນ, ແລະ ຮູບແບບການເວົ້າ.

ແບບຟອມຟຣີ (Kokoro, Piper, VITS, MeloTTS) ບໍ່ຕ້ອງການບັນຊີ ແລະ ຄ່າຕົວອັກສອນສະເລ່ຍ. ແບບຟອມມາດຕະຖານ (2,000 ຕົວອັກສອນ/1K ເຂົ້າ) ລວມມີ Bark, CosyVoice 2, F5-TTS, ແລະ Dia. ແບບຟອມພິເສດ (4,000 ຕົວອັກສອນ/1K ເຂົ້າ) ລວມມີ OpenVoice, Chatterbox, StyleTTS 2, ແລະ Tortoise. ແບບຟອມທີ່ຈ່າຍໂດຍທົ່ວໄປແລ້ວໃຫ້ຄຸນນະພາບສູງຂຶ້ນ, ສຽງຫຼາຍຂຶ້ນ, ແລະ ຄຸນລັກສະນະເພີ່ມເຕີມເຊັ່ນ: ການກັ່ນຕອງສຽງ.

ແມ່ນແລ້ວ. API ສະຫນັບສະຫນູນການປຸງແຕ່ງ batch ສໍາລັບການປ່ຽນຂະຫນາດໃຫຍ່ຂອງຂໍ້ຄວາມໄປເວົ້າ. ສົ່ງຄໍາຮ້ອງຂໍຫຼາຍແລະດາວໂຫລດຜົນໄດ້ຮັບ asynchronously ໂດຍໃຊ້ວຽກ UUIDs. ແຜນ Enterprise ($99 / ເດືອນ) ລວມມີການເຂົ້າເຖິງຄໍາຮ້ອງສະຫມັກທີ່ສໍາຄັນສໍາລັບການປຸງແຕ່ງ batch ໄວຂຶ້ນ. ເຫມາະສົມສໍາລັບການຜະລິດ audiobook, ເນື້ອໃນຫຼັກສູດ, ແລະໂຄງການ voiceover ຂະໜາດໃຫຍ່.
4.0/5 (22)

ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.

ເລີ່ມ​ໃຊ້ AI Voice ມື້ນີ້

ເຂົ້າຮ່ວມຜູ້ສ້າງ, ຜູ້ພັດທະນາ, ແລະ ທຸລະກິດທີ່ໃຊ້ TTS.ai