AI ແບບຟຣີ ຂໍ້ຄວາມເປັນການເວົ້າName
33+ ແບບ open-source, 273+ ສຽງ, 33+ ພາສາ. ບໍ່ມີບັນຊີທີ່ຕ້ອງການ.
ທຸກສິ່ງທຸກຢ່າງທີ່ທ່ານຕ້ອງການສຳລັບສຽງ AI
ເຄື່ອງມື 30+ ທີ່ມີພະລັງຈາກແບບ ຈຳ ລອງ AI ແຫຼ່ງເປີດ
33+ ແບບຟອມສຽງ AI
ການເກັບກໍາແບບຟອມ TTS ແບບເປີດແຫຼ່ງທີ່ກວ້າງຂວາງທີ່ສຸດໃນເວບໄຊທ໌ດຽວ
Kokoro ບໍ່ມີ
Kokoro ແມ່ນ 82 ລ້ານຕົວແບບການແປພາສາຈາກຂໍ້ຄວາມເປັນສຽງທີ່ຕີໄດ້ດີກວ່າລະດັບນໍ້າໜັກຂອງມັນ. ເຖິງວ່າຈະມີຂະ ໜາດ ນ້ອຍ, ມັນກໍ່ຜະລິດການເວົ້າທີ່ ໜ້າ ສົນໃຈແລະສະແດງອອກ. Kokoro ສະຫນັບສະຫນູນຫຼາຍພາສາລວມທັງພາສາອັງກິດ, ຍີ່ປຸ່ນ, ຈີນ, ແລະເກົາຫຼີດ້ວຍສຽງສະແດງອອກທີ່ຫຼາກຫຼາຍ. ມັນແລ່ນໄວຫຼາຍ — ສ້າງສຽງເກືອບ 100x ໄວກວ່າເວລາຈິງໃນ GPU.
ດີທີ່ສຸດ ສຳ ລັບ: TTS ທີ່ມີຄຸນນະພາບສູງດ້ວຍຄວາມຊ້າສຸດ, កម្មវិធីດາວໂຫລດ
ທົດລອງຟຣີ
Piper ບໍ່ມີ
Piper ແມ່ນເຄື່ອງຈັກການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ເບົາບາງທີ່ພັດທະນາໂດຍ Rhasspy ເຊິ່ງໃຊ້ VITS ແລະ larynx architectures. ມັນແລ່ນທັງ ໝົດ ເທິງ CPU, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບອຸປະກອນ Edge, ອັດຕະໂນມັດໃນເຮືອນ, ແລະ ຄໍາຮ້ອງສະຫມັກທີ່ຕ້ອງການ TTS ນອກອິນເຕີເນັດ. ດ້ວຍສຽງຫຼາຍກວ່າ 100 ຜ່ານ 30 + ພາສາ, Piper ສົ່ງຄໍາເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດໃນຄວາມໄວທີ່ແທ້ຈິງເຖິງແມ່ນວ່າຢູ່ໃນ Raspberry Pi 4.
ດີທີ່ສຸດ ສຳ ລັບ: ການເບິ່ງກ່ອນໄວ, ການເຂົ້າເຖິງງ່າຍ, ແລະໂປແກຼມທີ່ຖືກຝັງໄວ້
ທົດລອງຟຣີ
VITS ບໍ່ມີ
VITS (ການຄິດໄລ່ຄວາມແຕກຕ່າງດ້ວຍການຮຽນຮູ້ທີ່ມີການຕໍ່ສູ້ເພື່ອການແປຂໍ້ຄວາມເປັນຄຳເວົ້າຈາກຕົ້ນເຖິງທ້າຍ) ແມ່ນວິທີການ TTS ແບບຄຽງຄູ່ກັນລະຫວ່າງຕົ້ນເຖິງທ້າຍທີ່ຜະລິດສຽງທີ່ມີສຽງທໍາມະຊາດຫຼາຍຂຶ້ນກວ່າແບບແບບສອງຂັ້ນທີ່ມີຢູ່ໃນປັດຈຸບັນ. ມັນໃຊ້ການຄິດໄລ່ຄວາມແຕກຕ່າງທີ່ເພີ່ມຂຶ້ນດ້ວຍການປ່ຽນແປງຂອງການໄຫຼ ແລະ ຂະບວນການຝຶກອົບຮົມທີ່ມີການຕໍ່ສູ້ກັນ, ເຮັດໃຫ້ການປັບປຸງທີ່ມີຄວາມໝາຍໃນການເວົ້າທີ່ມີຄວາມເປັນທໍາມະຊາດຫຼາຍຂຶ້ນ.
ດີທີ່ສຸດ ສຳ ລັບ: ຂໍ້ຄວາມໄປສູ່ການເວົ້າແບບທົ່ວໄປດ້ວຍການເວົ້າແບບທຳມະຊາດ
ທົດລອງຟຣີ
MeloTTS ບໍ່ມີ
MeloTTS ໂດຍ MyShell.ai ແມ່ນຫ້ອງສະໝຸດ TTS ຫຼາຍພາສາທີ່ສະຫນັບສະຫນູນພາສາອັງກິດ (ອາເມລິກາ, ບຣາຊິນ, ອິນເດຍ, ອົດສະຕາລີ), ສະເປນ, ຝຣັ່ງ, ຈີນ, ຍີ່ປຸ່ນ, ແລະເກົາຫຼີ. ມັນໄວຫຼາຍ, ຂະບວນການຂໍ້ຄວາມທີ່ໃກ້ກັບຄວາມໄວເວລາຈິງໃນ CPU ດຽວ. MeloTTS ແມ່ນອອກແບບສໍາລັບການໃຊ້ງານການຜະລິດແລະສະຫນັບສະຫນູນທັງ CPU ແລະ GPU ຜົນການຄິດໄລ່.
ດີທີ່ສຸດ ສຳ ລັບ: ໂປແກຼມຜະລິດທີ່ຕ້ອງການ TTS ໄວ, ຫຼາຍພາສາ
ທົດລອງຟຣີ
Kani TTS 2 ບໍ່ມີ
Kani-TTS-2 ໂດຍ NineNineSix ແມ່ນແບບ ຈຳ ລອງຕົວຊີ້ວັດ 400M ທີ່ມີຄວາມເບົາບາງທີ່ສ້າງຂຶ້ນໂດຍໃຊ້ Liquid AI LFM2 backbone ດ້ວຍ NVIDIA NanoCodec. ມັນແລ່ນໃນພຽງແຕ່ 3GB VRAM ແລະຜະລິດ ~ 10 ວິນາທີຂອງການເວົ້າໃນ ~2 ວິນາທີໃນ A100 (RTF 0.2). ການປ່ອຍສາທາລະນະປະຈຸບັນສົ່ງເຄື່ອງກວດສອບພາສາອັງກິດ `kani-tts-2-en` ແລະບໍ່ເປີດເຜີຍຮູຮັບສຽງທີ່ ຈຳ ເປັນ ສຳ ລັບການກັ່ນຕອງສຽງ - ໃຊ້ Chatterbox / IndexTTS2 / F5-TTS ສຳ ລັບການກັ່ນຕອງ, ຫຼື Kokoro / MeloTTS ສຳ ລັບພາສາທີ່ບໍ່ເປັນພາສາອັງກິດ.
ດີທີ່ສຸດ ສຳ ລັບ: ສ້າງພາສາອັງກິດໄວຂຶ້ນ ເທິງຮາດແວ VRAM ຕ່ຳ, ເບິ່ງກ່ອນໄວ
ທົດລອງຟຣີ
OuteTTS ບໍ່ມີ
OuteTTS ຂະຫຍາຍຕົວແບບພາສາໃຫຍ່ທີ່ມີຄວາມສາມາດໃນການແປພາສາໃນຂະນະດຽວກັນຮັກສາໂຄງສ້າງຕົ້ນສະບັບ. ມັນສະຫນັບສະຫນູນ backends ຫຼາຍຢ່າງລວມທັງ llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ແລະເຖິງແມ່ນວ່າການຄາດຄະເນຂອງຕົວທ່ອງເວັບຜ່ານ Transformers.js. ຄຸນສົມບັດການກັ່ນຕອງສຽງຜ່ານໂປຼໄຟລ໌ຜູ້ເວົ້າທີ່ເກັບໄວ້ເປັນ JSON.
ດີທີ່ສຸດ ສຳ ລັບ: ການຈັດຕັ້ງໃຊ້ Edge, TTS ທີ່ມີພື້ນຖານໃນຕົວທ່ອງເວັບ, ສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ຳ
ທົດລອງຟຣີ
Pocket TTS ບໍ່ມີ
Pocket TTS ໂດຍ Kyutai (ຜູ້ສ້າງ Moshi) ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມເປັນສຽງທີ່ມີຂະໜາດນ້ອຍ 100M ທີ່ມີນໍ້າໜັກເບົາກວ່າ. ມັນສາມາດໃຊ້ງານໄດ້ຢ່າງມີປະສິດຕິພາບໃນ CPU, ສະຫນັບສະຫນູນການກັ່ນຕອງສຽງແບບ zero-shot ຈາກຕົວຢ່າງສຽງດຽວ, ແລະຜະລິດສຽງເວົ້າທີ່ຟັງຄືກັບທໍາມະຊາດ. ຂະໜາດຂອງແບບຟອມທີ່ນ້ອຍເຮັດໃຫ້ມັນ ເໝາະ ສົມກັບການຕິດຕັ້ງດ້ານນອກແລະສະພາບແວດລ້ອມທີ່ມີຊັບພະຍາກອນຕ່ໍາ.
ດີທີ່ສຸດ ສຳ ລັບ: ການຈັດຕັ້ງໃຊ້ເບົາ, ສະພາບແວດລ້ອມ CPU-only, ການກັ່ນຕອງສຽງຢ່າງໄວ
ທົດລອງຟຣີ
Kitten TTS ບໍ່ມີ
Kitten TTS ໂດຍ KittenML ແມ່ນແບບຟອມການແປພາສາຂໍ້ຄວາມທີ່ເບົາທີ່ສຸດທີ່ສ້າງຂຶ້ນໂດຍ ONNX. ດ້ວຍຕົວເລືອກຈາກ 15M ເຖິງ 80M (25-80 MB ໃນຮາດດິດ), ມັນສະ ໜອງ ການສັງເຄາະສຽງທີ່ມີຄຸນນະພາບສູງໃນ CPU ໂດຍບໍ່ຕ້ອງໃຊ້ GPU. ຄຸນລັກສະນະ 8 ສຽງພາຍໃນ, ໄວໃນການເວົ້າທີ່ປັບໄດ້, ແລະ ການປຸງແຕ່ງຂໍ້ຄວາມກ່ອນ ສຳ ລັບຕົວເລກ, ເງິນຕາແລະ ໜ່ວຍ. ດີເລີດ ສຳ ລັບການ ນຳ ໃຊ້ດ້ານ ໜ້າ ແລະ កម្មវិធីທີ່ມີ latency ຕ່ ຳ.
ດີທີ່ສຸດ ສຳ ລັບ: TTS ງ່າຍ ແລະ ໄວ, ຈັດການໃຊ້ງານດ້ານໜ້າ, ໂປແກຼມທີ່ໃຊ້ເວລາລໍຖ້າຕ່ຳ
ທົດລອງຟຣີ
Ming-Omni TTS ບໍ່ມີ
Ming-omni-tts-0.5B ໂດຍ inclusionAI ແມ່ນແບບຈໍາລອງການເວົ້າ omni-modal ຂະຫນາດນ້ອຍທີ່ສ້າງຂຶ້ນໃນ BailingMM ແຂງ backbone ທີ່ມີ Patch-by-Patch ສຽງ decoder ກົງກັນຂ້າມ. ສະຫນອງການອອກສຽງ 44.1kHz (ໃກ້ກັບຄຸນນະພາບ CD), ສະຫນັບສະຫນູນການຖ່າຍທອດສຽງສິ້ນສຸດລົງຈາກ 3+ ຄໍາຮ້ອງສະຫມັກຄັ້ງທໍາອິດ, ແລະປະກອບມີ built-in ຮູ້ສຶກ / ພາສາ / BGM ຄວບຄຸມຜ່ານຄໍາແນະນໍາ JSON. ມີຄວາມຫມັ້ນຄົງທີ່ດີ - 0.83% WER ກ່ຽວກັບການ benchmarks ຈີນ.
ດີທີ່ສຸດ ສຳ ລັບ: ພາສາສອງພາສາທີ່ມີຄວາມເຊື່ອຖືສູງ, ສຽງທີ່ຄວບຄຸມດ້ວຍອາລົມ, ເນື້ອໃນຂອງປື້ມສຽງພາສາຈີນ
ທົດລອງຟຣີ
MOSS-TTS Nano ບໍ່ມີ
MOSS-TTS-Nano-100M ແມ່ນ OpenMOSS ທີ່ມີຂະ ໜາດ ນ້ອຍ 100M-parameter ຂອງຄອບຄົວ MOSS-TTS, ແບ່ງປັນສະຖາປັດຕະຍະ ກຳ ປ່ຽນແປງຄວາມຊ້າ. ການຄ້າຄຸນນະພາບສູງສຸດຂອງແບບ 8B ສຳ ລັບ ~ 80x ນ້ອຍກວ່າແລະຫຼຸດລົງຢ່າງຫຼວງຫຼາຍຕໍ່ VRAM ຕາມການຮ້ອງຂໍ, ເຮັດໃຫ້ມັນ ເໝາະ ສົມ ສຳ ລັບການຕິດຕັ້ງແບບຟຣີແລະລະດັບສູງ. ຄືກັນກັບ 20 ພາສາ.
ດີທີ່ສຸດ ສຳ ລັບ: TTS ແບບຟຣີ, ຜະລິດຜົນງານທີ່ມີປະລິມານສູງ, ໃຊ້ງານແບບໂຕ້ຕອບທີ່ມີຄວາມຊ້າ
ທົດລອງຟຣີ
Bark ມາດຕະຖານ
ແບບຈໍາລອງຂໍ້ຄວາມເປັນສຽງທີ່ອີງໃສ່ການປ່ຽນແປງທີ່ສ້າງການເວົ້າ, ດົນຕີ ແລະ ຜົນສະທ້ອນສຽງທີ່ເປັນຈິງ.
ຜູ້ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Bark Small ມາດຕະຖານ
ເວີຊັນເບົາກວ່າຂອງ Bark ດ້ວຍການຄິດໄລ່ໄວກວ່າ ແລະ ຫຼຸດການໃຊ້ຄວາມຈຳລົງ
ຜູ້ພັດທະນາ: Suno · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
CosyVoice 2 ມາດຕະຖານ
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ຜູ້ພັດທະນາ: Alibaba (Tongyi Lab) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Dia TTS ມາດຕະຖານ
ແບບຟອມການສ້າງການສົນທະນາຂອງຜູ້ເວົ້າຫຼາຍຄົນທີ່ສ້າງການສົນທະນາແບບທຳມະຊາດລະຫວ່າງຜູ້ເວົ້າ
ຜູ້ພັດທະນາ: Nari Labs · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Parler TTS ມາດຕະຖານ
ອະທິບາຍສຽງທີ່ທ່ານຕ້ອງການໃນພາສາທໍາມະຊາດ ແລະ Parler ຈະສ້າງການເວົ້າທີ່ກົງກັນ.
ຜູ້ພັດທະນາ: Hugging Face · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
IndexTTS-2 ມາດຕະຖານ
Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.
ຜູ້ພັດທະນາ: Index Team · ໃບອະນຸຍາດ: Bilibili Model License
ທົດລອງໃຊ້
Spark TTS ມາດຕະຖານ
ການກັ່ນຕອງສຽງ TTS ດ້ວຍອາລົມທີ່ສາມາດຄວບຄຸມໄດ້ ແລະ ແບບເວົ້າຜ່ານການແຈ້ງເຕືອນ.
ຜູ້ພັດທະນາ: SparkAudio · ໃບອະນຸຍາດ: CC BY-NC-SA 4.0
ທົດລອງໃຊ້
GPT-SoVITS ມາດຕະຖານ
ສຽງທີ່ໄດ້ຮັບການກັ່ນຕອງສຽງ TTS ທີ່ເຮັດໃຫ້ສຽງໃດໆມີສຽງຄືກັນກັບສຽງທີ່ໄດ້ຮັບຈາກສຽງ5ວິນາທີເທົ່ານັ້ນ.
ຜູ້ພັດທະນາ: RVC-Boss · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Orpheus ມາດຕະຖານ
ແບບຈໍາລອງ TTS ລະດັບມະນຸດທີ່ຮຽນຮູ້ຈາກຂໍ້ມູນການເວົ້າ 100K ຊົ່ວໂມງ.
ຜູ້ພັດທະນາ: Canopy Labs · ໃບອະນຸຍາດ: Llama 3.2 Community
ທົດລອງໃຊ້
Qwen3 TTS ມາດຕະຖານ
Alibaba's multilingual TTS with preset voices and voice design from text.
ຜູ້ພັດທະນາ: Alibaba (Qwen) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
VieNeu-TTS-v2 ມາດຕະຖານ
ພາສາຫວຽດ + ພາສາອັງກິດ ປ່ຽນລະຫັດ TTS ດ້ວຍສຽງ7ສຽງ ແລະ ສຽງທີ່ບໍ່ມີສຽງ. CPU-only, ບໍ່ຕ້ອງການ GPU.
ຜູ້ພັດທະນາ: Phạm Nguyễn Ngọc Bảo · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
Chatterbox Turbo ມາດຕະຖານ
Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.
ຜູ້ພັດທະນາ: Resemble AI · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
VoxCPM ມາດຕະຖານ
Tokenizer-free TTS ຜະລິດ 44.1kHz ສຽງກັບ context-aware ຂໍ້ຄວາມຄົບຖ້ວນ.
ຜູ້ພັດທະນາ: OpenBMB · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
VibeVoice ມາດຕະຖານ
ແບບຟອມ Microsoft ສຳ ລັບເນື້ອໃນແບບຟອມຍາວທີ່ມີຜູ້ເວົ້າຫຼາຍຄົນເຊັ່ນ Podcasts ແລະ Audiobooks.
ຜູ້ພັດທະນາ: Microsoft · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
CosyVoice3 ມາດຕະຖານ
TTS ຫຼາຍພາສາລຸ້ນຕໍ່ໄປທີ່ມີ bi-streaming, ການຄວບຄຸມອາລົມ, ແລະ ການກັ່ນຕອງສຽງແບບ zero-shot.
ຜູ້ພັດທະນາ: Alibaba (FunAudioLLM) · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
NAMAA Saudi TTS ມາດຕະຖານ
ພາສາອາຣັບຊາອຸດີທີ່ເປີດໃຊ້ໄດ້ຄັ້ງທຳອິດທີ່ມີການກັ່ນຕອງສຽງແບບ Chatterbox.
ຜູ້ພັດທະນາ: NAMAA Space · ໃບອະນຸຍາດ: MIT
ທົດລອງໃຊ້
Darwin TTS ມາດຕະຖານ
ຕົວແປ Qwen3- TTS ແບບ cross- mode ທີ່ມີນໍ້າໜັກ FFN ຖືກປະສົມຈາກແບບຟອມພາສາ Qwen3- 1. 7B ເພື່ອການກັ່ນຕອງພາສາຫຼາຍພາສາທີ່ຊັດເຈນກວ່າ.
ຜູ້ພັດທະນາ: FINAL-Bench · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
MOSS-TTSD ມາດຕະຖານ
ແບບຟອມການສົນທະນາແບບຕໍ່ເນື່ອງຂອງຫຼາຍຄົນ - ສ້າງການສົນທະນາແບບ podcast ທີ່ມີຜູ້ເວົ້າເຖິງ5ຄົນແລະ 60 ນາທີຂອງສຽງທີ່ເປັນເອກະພາບ.
ຜູ້ພັດທະນາ: OpenMOSS · ໃບອະນຸຍາດ: Apache 2.0
ທົດລອງໃຊ້
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ພາສາ: en, zh, ja, ko, fr, de, it, es
ក្លូនສຽງ
IndexTTS-2
Zero-shot TTS ທີ່ມີການຄວບຄຸມອາລົມທີ່ລະອຽດອ່ອນ ແລະ ຄວາມສະແດງອອກສູງ.
ພາສາ: en, zh
ក្លូនສຽງ
Spark TTS
ການກັ່ນຕອງສຽງ TTS ດ້ວຍອາລົມທີ່ສາມາດຄວບຄຸມໄດ້ ແລະ ແບບເວົ້າຜ່ານການແຈ້ງເຕືອນ.
ພາສາ: en, zh
ក្លូនສຽງ
GPT-SoVITS
ສຽງທີ່ໄດ້ຮັບການກັ່ນຕອງສຽງ TTS ທີ່ເຮັດໃຫ້ສຽງໃດໆມີສຽງຄືກັນກັບສຽງທີ່ໄດ້ຮັບຈາກສຽງ5ວິນາທີເທົ່ານັ້ນ.
ພາສາ: en, zh, ja, ko
ក្លូនສຽງ
Chatterbox
ເຕັກໂນໂລຊີການຖ່າຍແບບສຽງແບບບໍ່ມີສຽງກັບການຄວບຄຸມອາລົມຈາກ Resemble AI.
ພາສາ: en
ក្លូនສຽງ
Tortoise TTS
ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າຫຼາຍສຽງທີ່ສຸມໃສ່ຄຸນນະພາບດ້ວຍໂຄງສ້າງໂຄງສ້າງທີ່ກັບຄືນໄປບ່ອນເອງ.
ພາສາ: en
ក្លូនສຽງ
OpenVoice
ສຽງແບບຄລີນທັນທີດ້ວຍການຄວບຄຸມທີ່ລະອຽດອ່ອນກວ່າແບບ, ອາລົມ, ແລະສຽງອ່ອນ.
ພາສາ: en, zh, ja, ko, fr, es
ក្លូនສຽງ
VieNeu-TTS-v2
ພາສາຫວຽດ + ພາສາອັງກິດ ປ່ຽນລະຫັດ TTS ດ້ວຍສຽງ7ສຽງ ແລະ ສຽງທີ່ບໍ່ມີສຽງ. CPU-only, ບໍ່ຕ້ອງການ GPU.
ພາສາ: vi, en
ក្លូនສຽງ
Chatterbox Turbo
Chatterbox ໄວຂຶ້ນດ້ວຍ sub-200ms latency ແລະ tag paralinguistic ສຳ ລັບສຽງຫົວ, ສຽງໄອ, ແລະອື່ນໆ.
ພາສາ: en
ក្លូនສຽງ
OuteTTS
LLM-based TTS ທີ່ແລ່ນຢູ່ໃນ CPU, GPU, ຫຼື ເວບໄຊທ໌ຜ່ານ llama.cpp ແລະ Transformers.js.
ພາສາ: en
ក្លូនສຽງ
Pocket TTS
ແບບຈໍາລອງຕົວເລກເບົາ 100M ໂດຍ Kyutai ທີ່ມີການກັ່ນຕອງສຽງຈາກຕົວຢ່າງດຽວ.
ພາສາ: en, fr
ក្លូនສຽງ
CosyVoice3
TTS ຫຼາຍພາສາລຸ້ນຕໍ່ໄປທີ່ມີ bi-streaming, ການຄວບຄຸມອາລົມ, ແລະ ການກັ່ນຕອງສຽງແບບ zero-shot.
ພາສາ: en, zh, ja, ko, de, es, fr, it, ru
ក្លូនສຽງ
NAMAA Saudi TTS
ພາສາອາຣັບຊາອຸດີທີ່ເປີດໃຊ້ໄດ້ຄັ້ງທຳອິດທີ່ມີການກັ່ນຕອງສຽງແບບ Chatterbox.
ພາສາ: ar
ក្លូនສຽງ
Darwin TTS
ຕົວແປ Qwen3- TTS ແບບ cross- mode ທີ່ມີນໍ້າໜັກ FFN ຖືກປະສົມຈາກແບບຟອມພາສາ Qwen3- 1. 7B ເພື່ອການກັ່ນຕອງພາສາຫຼາຍພາສາທີ່ຊັດເຈນກວ່າ.
ພາສາ: en, ko, ja, zh
ក្លូនສຽງ
MOSS-TTSD
ແບບຟອມການສົນທະນາແບບຕໍ່ເນື່ອງຂອງຫຼາຍຄົນ - ສ້າງການສົນທະນາແບບ podcast ທີ່ມີຜູ້ເວົ້າເຖິງ5ຄົນແລະ 60 ນາທີຂອງສຽງທີ່ເປັນເອກະພາບ.
ພາສາ: en, zh
ក្លូនສຽງ
Ming-Omni TTS
ແບບຈໍາລອງການເວົ້າແບບ omni-modal 0.5B ຈາກ inclusionAI ທີ່ມີຜົນຜະລິດ 44.1kHz ທີ່ມີຄຸນນະພາບສູງແລະການກັ່ນຕອງສຽງແບບ zero-shot.
ພາສາ: en, zh
ក្លូនສຽງ
MOSS-TTS Nano
100M MOSS-TTS ນ້ອຍໆ - ສະຖາປັດຕະຍະກໍາດຽວກັນ, 80x ນ້ອຍກວ່າ, ເວລາລໍຖ້າຟຣີ.
ພາສາ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
ក្លូនສຽງAPI ສຳລັບຜູ້ພັດທະນາກ່ອນ
REST API ທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI. ຈຸດສຸດທ້າຍ ໜຶ່ງ, ແບບ 22+ ແບບ. ການສະ ໜັບ ສະ ໜູນ ການຖ່າຍທອດສົດ ສຳ ລັບແອັບພລິເຄຊັນເວລາຈິງ.
- ຮູບແບບທີ່ເຂົ້າກັນໄດ້ກັບ OpenAI
- ຖ່າຍທອດ TTS ສຳລັບແອັບພລິເຄຊັນເວລາຈິງ
- ການປະມວນຜົນຫຼາຍຄັ້ງສຳລັບວຽກທີ່ໃຫຍ່
- ການແຈ້ງເຕືອນ Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ລາຄາທີ່ສະອາດ ແລະ ງ່າຍດາຍ
ເລີ່ມຕົ້ນຟຣີ. ຂະ ໜາດ ຕາມທີ່ທ່ານເຕີບໃຫຍ່.
ຟຣີ
15,000 ຕົວອັກສອນ + 5,000/ມື້
- 7 ແບບຟອມຟຣີລວມທັງ Kokoro
- 5,000 ຕົວອັກສອນຕໍ່ການສ້າງ
- ລວມການເຂົ້າເຖິງ API
ຕົວເລີ່ມ
500 ຄະແນນ/ເດືອນ
- ທັງໝົດ 22+ ແບບ
- 100,000 ອັກສອນຕໍ່ການສ້າງ
- ການກັ່ນຕອງສຽງ
ມືອາຊີບ
2,000,000 ຕົວອັກສອນ/ເດືອນ
- ທຸກຢ່າງໃນ Starter
- ການເຂົ້າເຖິງ API
- ການປະມວນຜົນບູລິມະສິດ
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.
ເລີ່ມໃຊ້ AI Voice ມື້ນີ້
ເຂົ້າຮ່ວມຜູ້ສ້າງ, ຜູ້ພັດທະນາ, ແລະ ທຸລະກິດທີ່ໃຊ້ TTS.ai