AI ແບບຟຣີ ຂໍ້ຄວາມເປັນການເວົ້າName
31+ ແບບ open-source, 231+ ສຽງ, 34+ ພາສາ. ບໍ່ມີບັນຊີທີ່ຕ້ອງການ.
ທຸກສິ່ງທຸກຢ່າງທີ່ທ່ານຕ້ອງການສຳລັບສຽງ AI
ເຄື່ອງມື 30+ ທີ່ມີພະລັງຈາກແບບ ຈຳ ລອງ AI ແຫຼ່ງເປີດ
31+ ແບບຟອມສຽງ AI
ການເກັບກໍາແບບຟອມ TTS ແບບເປີດແຫຼ່ງທີ່ກວ້າງຂວາງທີ່ສຸດໃນເວບໄຊທ໌ດຽວ
Kokoro Free
Kokoro ແມ່ນ 82 ລ້ານຕົວແບບການແປພາສາຈາກຂໍ້ຄວາມເປັນສຽງທີ່ຕີໄດ້ດີກວ່າລະດັບນໍ້າໜັກຂອງມັນ. ເຖິງວ່າຈະມີຂະ ໜາດ ນ້ອຍ, ມັນກໍ່ຜະລິດການເວົ້າທີ່ ໜ້າ ສົນໃຈແລະສະແດງອອກ. Kokoro ສະຫນັບສະຫນູນຫຼາຍພາສາລວມທັງພາສາອັງກິດ, ຍີ່ປຸ່ນ, ຈີນ, ແລະເກົາຫຼີດ້ວຍສຽງສະແດງອອກທີ່ຫຼາກຫຼາຍ. ມັນແລ່ນໄວຫຼາຍ — ສ້າງສຽງເກືອບ 100x ໄວກວ່າເວລາຈິງໃນ GPU.
ດີທີ່ສຸດ ສຳ ລັບ: TTS ທີ່ມີຄຸນນະພາບສູງດ້ວຍຄວາມຊ້າສຸດ, កម្មវិធីດາວໂຫລດ
ທົດລອງຟຣີ
Piper Free
Piper ແມ່ນເຄື່ອງຈັກການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ເບົາບາງທີ່ພັດທະນາໂດຍ Rhasspy ເຊິ່ງໃຊ້ VITS ແລະ larynx architectures. ມັນແລ່ນທັງ ໝົດ ເທິງ CPU, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບອຸປະກອນ Edge, ອັດຕະໂນມັດໃນເຮືອນ, ແລະ ຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການ TTS ນອກອິນເຕີເນັດ. ດ້ວຍສຽງຫຼາຍກວ່າ 100 ຜ່ານ 30 + ພາສາ, Piper ສົ່ງຄໍາເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດໃນຄວາມໄວທີ່ແທ້ຈິງເຖິງແມ່ນວ່າຢູ່ໃນ Raspberry Pi 4.
ດີທີ່ສຸດ ສຳ ລັບ: ການເບິ່ງກ່ອນໄວ, ການເຂົ້າເຖິງງ່າຍ, ແລະໂປແກຼມທີ່ຖືກຝັງໄວ້
ທົດລອງຟຣີ
VITS Free
VITS (ການຄິດໄລ່ຄວາມແຕກຕ່າງດ້ວຍການຮຽນຮູ້ທີ່ມີການຕໍ່ສູ້ເພື່ອການແປຂໍ້ຄວາມເປັນຄຳເວົ້າຈາກຕົ້ນເຖິງທ້າຍ) ແມ່ນວິທີການ TTS ແບບຄຽງຄູ່ກັນລະຫວ່າງຕົ້ນເຖິງທ້າຍທີ່ຜະລິດສຽງທີ່ມີສຽງທໍາມະຊາດຫຼາຍຂຶ້ນກວ່າແບບແບບສອງຂັ້ນທີ່ມີຢູ່ໃນປັດຈຸບັນ. ມັນໃຊ້ການຄິດໄລ່ຄວາມແຕກຕ່າງທີ່ເພີ່ມຂຶ້ນດ້ວຍການປ່ຽນແປງຂອງການໄຫຼ ແລະ ຂະບວນການຝຶກອົບຮົມທີ່ມີການຕໍ່ສູ້ກັນ, ເຮັດໃຫ້ການປັບປຸງທີ່ມີຄວາມໝາຍໃນການເວົ້າທີ່ມີຄວາມເປັນທໍາມະຊາດຫຼາຍຂຶ້ນ.
ດີທີ່ສຸດ ສຳ ລັບ: ຂໍ້ຄວາມໄປສູ່ການເວົ້າແບບທົ່ວໄປດ້ວຍການເວົ້າແບບທຳມະຊາດ
ທົດລອງຟຣີ
MeloTTS Free
MeloTTS ໂດຍ MyShell.ai ແມ່ນຫ້ອງສະໝຸດ TTS ຫຼາຍພາສາທີ່ສະຫນັບສະຫນູນພາສາອັງກິດ (ອາເມລິກາ, ບຣາຊິນ, ອິນເດຍ, ອົດສະຕາລີ), ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ. ມັນໄວຫຼາຍ, ຂະບວນການຂໍ້ຄວາມທີ່ໃກ້ກັບຄວາມໄວເວລາຈິງໃນ CPU ດຽວ. MeloTTS ແມ່ນອອກແບບສໍາລັບການໃຊ້ງານການຜະລິດແລະສະຫນັບສະຫນູນທັງ CPU ແລະ GPU ຜົນການຄິດໄລ່.
ດີທີ່ສຸດ ສຳ ລັບ: ໂປແກຼມຜະລິດທີ່ຕ້ອງການ TTS ໄວ, ຫຼາຍພາສາ
ທົດລອງຟຣີ
OuteTTS Free
OuteTTS ຂະຫຍາຍຕົວແບບພາສາໃຫຍ່ທີ່ມີຄວາມສາມາດໃນການແປພາສາໃນຂະນະດຽວກັນຮັກສາໂຄງສ້າງຕົ້ນສະບັບ. ມັນສະຫນັບສະຫນູນ backends ຫຼາຍຢ່າງລວມທັງ llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ແລະເຖິງແມ່ນວ່າການຄາດຄະເນຂອງຕົວທ່ອງເວັບຜ່ານ Transformers.js. ຄຸນສົມບັດການກັ່ນຕອງສຽງຜ່ານໂປຼໄຟລ໌ຜູ້ເວົ້າທີ່ເກັບໄວ້ເປັນ JSON.
ດີທີ່ສຸດ ສຳ ລັບ: ການຈັດຕັ້ງໃຊ້ Edge, TTS ທີ່ມີພື້ນຖານໃນຕົວທ່ອງເວັບ, ສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ຳ
ທົດລອງຟຣີ
Pocket TTS Free
Pocket TTS ໂດຍ Kyutai (ຜູ້ສ້າງ Moshi) ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ມີຂະໜາດນ້ອຍ 100M ທີ່ມີນໍ້າໜັກເບົາກວ່າ. ມັນສາມາດໃຊ້ງານໄດ້ຢ່າງມີປະສິດຕິພາບໃນ CPU, ສະຫນັບສະຫນູນການກັ່ນຕອງສຽງແບບ zero-shot ຈາກຕົວຢ່າງສຽງດຽວ, ແລະຜະລິດສຽງເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດ. ຂະໜາດຂອງແບບຟອມທີ່ນ້ອຍເຮັດໃຫ້ມັນ ເໝາະ ສົມກັບການຕິດຕັ້ງດ້ານນອກແລະສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ໍາ.
ດີທີ່ສຸດ ສຳ ລັບ: ການຈັດຕັ້ງໃຊ້ເບົາ, ສະພາບແວດລ້ອມ CPU-only, ການກັ່ນຕອງສຽງຢ່າງໄວ
ທົດລອງຟຣີ
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ດີທີ່ສຸດ ສຳ ລັບ: Fast lightweight TTS, edge deployment, low-latency applications
ທົດລອງຟຣີ
Bark Standard
ແບບຈໍາລອງຂໍ້ຄວາມເປັນສຽງທີ່ອີງໃສ່ການປ່ຽນແປງທີ່ສ້າງການເວົ້າ, ດົນຕີ ແລະ ຜົນສະທ້ອນສຽງທີ່ເປັນຈິງ.
ຜູ້ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Bark Small Standard
ເວີຊັນເບົາກວ່າຂອງ Bark ດ້ວຍການຄິດໄລ່ໄວກວ່າ ແລະ ຫຼຸດການໃຊ້ຄວາມຈຳລົງ
ຜູ້ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ຜູ້ພັດທະນາ: Alibaba (Tongyi Lab) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Dia TTS Standard
ແບບຟອມການສ້າງການສົນທະນາຂອງຜູ້ເວົ້າຫຼາຍຄົນທີ່ສ້າງການສົນທະນາແບບທຳມະຊາດລະຫວ່າງຜູ້ເວົ້າ
ຜູ້ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Parler TTS Standard
ອະທິບາຍສຽງທີ່ທ່ານຕ້ອງການໃນພາສາທໍາມະຊາດ ແລະ Parler ຈະສ້າງການເວົ້າທີ່ກົງກັນ.
ຜູ້ພັດທະນາ: Hugging Face · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
GLM-TTS Standard
ບັນລຸອັດຕາຄວາມຜິດພາດຕົວອັກສອນຕ່ຳສຸດໃນບັນດາແບບຟອມ TTS ແຫຼ່ງເປີດ.
ຜູ້ພັດທະນາ: Zhipu AI · ໃບອະນຸຍາດ: GLM-4 License
ທົດລອງໃຊ້
IndexTTS-2 Standard
Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.
ຜູ້ພັດທະນາ: Index Team · ໃບອະນຸຍາດ: Bilibili Model License
ທົດລອງໃຊ້
Spark TTS Standard
ການກັ່ນຕອງສຽງ TTS ດ້ວຍອາລົມທີ່ສາມາດຄວບຄຸມໄດ້ ແລະ ແບບເວົ້າຜ່ານການແຈ້ງເຕືອນ.
ຜູ້ພັດທະນາ: SparkAudio · ໃບອະນຸຍາດ: CC BY-NC-SA 4.0
ທົດລອງໃຊ້
GPT-SoVITS Standard
ສຽງທີ່ໄດ້ຮັບການກັ່ນຕອງສຽງ TTS ທີ່ເຮັດໃຫ້ສຽງໃດໆມີສຽງຄືກັນກັບສຽງທີ່ໄດ້ຮັບຈາກສຽງ5ວິນາທີເທົ່ານັ້ນ.
ຜູ້ພັດທະນາ: RVC-Boss · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Orpheus Standard
ແບບຈໍາລອງ TTS ລະດັບມະນຸດທີ່ຮຽນຮູ້ຈາກຂໍ້ມູນການເວົ້າ 100K ຊົ່ວໂມງ.
ຜູ້ພັດທະນາ: Canopy Labs · ໃບອະນຸຍາດ: Llama 3.2 Community
ທົດລອງໃຊ້
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ຜູ້ພັດທະນາ: Alibaba (Qwen) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Chatterbox Turbo Standard
Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.
ຜູ້ພັດທະນາ: Resemble AI · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Dia 2 Standard
ສຽງເວົ້າແບບດັງໆທີ່ມີການສົນທະນາກັບຜູ້ເວົ້າຫຼາຍຄົນ ແລະ ຄໍາແນະນໍາທາງພາສາ
ຜູ້ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
VoxCPM Standard
Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.
ຜູ້ພັດທະນາ: OpenBMB · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
TADA Standard
Zero-Hallucination TTS ທີ່ມີຂໍ້ຄວາມ-acoustic ສອງການວາງເດີມພັນ, 5x ໄວກວ່າທຽບເທົ່າ LLM TTS.
ຜູ້ພັດທະນາ: Hume AI · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
VibeVoice Standard
ແບບຟອມ Microsoft ສຳ ລັບເນື້ອໃນແບບຟອມຍາວທີ່ມີຜູ້ເວົ້າຫຼາຍຄົນເຊັ່ນ Podcasts ແລະ Audiobooks.
ຜູ້ພັດທະນາ: Microsoft · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ຜູ້ພັດທະນາ: Alibaba (FunAudioLLM) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ພາສາ: en, zh, ja, ko, fr, de, it, es
ក្លូនສຽງ
GLM-TTS
ບັນລຸອັດຕາຄວາມຜິດພາດຕົວອັກສອນຕ່ຳສຸດໃນບັນດາແບບຟອມ TTS ແຫຼ່ງເປີດ.
ພາສາ: en, zh
ក្លូនສຽງ
IndexTTS-2
Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.
ພາສາ: en, zh
ក្លូនສຽງ
Spark TTS
ການກັ່ນຕອງສຽງ TTS ດ້ວຍອາລົມທີ່ສາມາດຄວບຄຸມໄດ້ ແລະ ແບບເວົ້າຜ່ານການແຈ້ງເຕືອນ.
ພາສາ: en, zh
ក្លូនສຽງ
GPT-SoVITS
ສຽງທີ່ໄດ້ຮັບການກັ່ນຕອງສຽງ TTS ທີ່ເຮັດໃຫ້ສຽງໃດໆມີສຽງຄືກັນກັບສຽງທີ່ໄດ້ຮັບຈາກສຽງ5ວິນາທີເທົ່ານັ້ນ.
ພາສາ: en, zh, ja, ko
ក្លូនສຽງ
Chatterbox
ເຕັກໂນໂລຊີການຖ່າຍແບບສຽງແບບບໍ່ມີສຽງກັບການຄວບຄຸມອາລົມຈາກ Resemble AI.
ພາສາ: en
ក្លូនສຽງ
Tortoise TTS
ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າຫຼາຍສຽງທີ່ສຸມໃສ່ຄຸນນະພາບດ້ວຍໂຄງສ້າງໂຄງສ້າງທີ່ກັບຄືນໄປບ່ອນເອງ.
ພາສາ: en
ក្លូនສຽງ
OpenVoice
ສຽງແບບຄລີນທັນທີດ້ວຍການຄວບຄຸມທີ່ລະອຽດອ່ອນກວ່າແບບ, ອາລົມ, ແລະສຽງອ່ອນ.
ພາສາ: en, zh, ja, ko, fr, de, es, it
ក្លូនສຽງ
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ພາສາ: en, zh, ja, ko, de, fr, ru, pt, es, it
ក្លូនສຽງ
Chatterbox Turbo
Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.
ພາສາ: en
ក្លូនສຽງ
OuteTTS
LLM-based TTS ທີ່ແລ່ນຢູ່ໃນ CPU, GPU, ຫຼື ເວບໄຊທ໌ຜ່ານ llama.cpp ແລະ Transformers.js.
ພາສາ: en
ក្លូនສຽງ
Pocket TTS
ແບບຈໍາລອງຕົວເລກເບົາ 100M ໂດຍ Kyutai ທີ່ມີການກັ່ນຕອງສຽງຈາກຕົວຢ່າງດຽວ.
ພາສາ: en, fr
ក្លូនສຽງ
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ພາສາ: en, zh, ja, ko, de, es, fr, it, ru
ក្លូនສຽງ
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ພາສາ: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
ក្លូនສຽງ
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ພາສາ: en, zh
ក្លូនສຽງAPI ສຳລັບຜູ້ພັດທະນາກ່ອນ
REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. ຈຸດສຸດທ້າຍ ໜຶ່ງ, ແບບ 22+ ແບບ. ການສະ ໜັບ ສະ ໜູນ ການຖ່າຍທອດສົດ ສຳ ລັບແອັບພລິເຄຊັນເວລາຈິງ.
- ຮູບແບບທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI
- ຖ່າຍທອດ TTS ສຳລັບແອັບພລິເຄຊັນເວລາຈິງ
- ການປະມວນຜົນຫຼາຍຄັ້ງສຳລັບວຽກທີ່ໃຫຍ່
- ການແຈ້ງເຕືອນ Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ລາຄາທີ່ສະອາດ ແລະ ງ່າຍດາຍ
ເລີ່ມຕົ້ນຟຣີ. ຂະ ໜາດ ຕາມທີ່ທ່ານເຕີບໃຫຍ່.
ຟຣີ
15 ຄະແນນ
- Kokoro, Piper, VITS, MeloTTS
- ຈໍາກັດຕົວອັກສອນ 500
- 3 ເດືອນ/ຊົ່ວໂມງ (ບໍ່ມີບັນຊີ)
ຕົວເລີ່ມ
500 ຄະແນນ/ເດືອນ
- ທັງໝົດ 22+ ແບບ
- 100,000 ອັກສອນຕໍ່ການສ້າງ
- ການກັ່ນຕອງສຽງ
ມືອາຊີບ
2,000,000 ຕົວອັກສອນ/ເດືອນ
- ທຸກຢ່າງໃນ Starter
- ການເຂົ້າເຖິງ API
- ການປະມວນຜົນບູລິມະສິດ
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.
ເລີ່ມໃຊ້ AI Voice ມື້ນີ້
ເຂົ້າຮ່ວມຜູ້ສ້າງ, ຜູ້ພັດທະນາ, ແລະ ທຸລະກິດທີ່ໃຊ້ TTS.ai