AI ឥតគិតថ្លៃ អត្ថបទទៅការនិយាយ
31+ ម៉ូដែលប្រភពបើកចំហ 231+ សំឡេង 34+ ភាសា & # 160; ។ គ្មានគណនីដែលត្រូវការ & # 160; ។
អ្វីដែលអ្នកត្រូវការសម្រាប់សំឡេង AI
30+ ឧបករណ៍ដែលមានថាមពលដោយម៉ូដែល AI ប្រភពបើកចំហ
31+ ម៉ូដែលសំឡេង AI
ការប្រមូលផ្ដុំដ៏ទូលំទូលាយបំផុតនៃម៉ូដែល TTS ប្រភពបើកចំហក្នុងវេទិកាមួយ
Kokoro Free
Kokoro គឺជាម៉ូដែលអត្ថបទទៅជាសំឡេងប៉ារ៉ាម៉ែត្រ 82 លាននាក់ដែលវាយល្អប្រសើរជាងថ្នាក់ទម្ងន់របស់ខ្លួន។ ទោះបីជាទំហំតូចក៏ដោយវាផលិតការនិយាយដែលគួរឱ្យកត់សម្គាល់និងមានលក្ខណៈធម្មជាតិ។ Kokoro គាំទ្រភាសាច្រើនរួមទាំងភាសាអង់គ្លេសជប៉ុនចិននិងកូរ៉េជាមួយនឹងសំឡេងបង្ហាញផ្សេងៗ។ វារត់យ៉ាងលឿនខ្លាំងណាស់ - បង្កើតអូឌីយ៉ូជិត 100x រហ័សជាងពេលពិតនៅលើ GPU ។
ល្អបំផុតសម្រាប់ & # 160; ៖ TTS គុណភាពខ្ពស់ជាមួយការពន្យារអប្បបរមា កម្មវិធីស្ទ្រីម
សាកល្បងដោយឥតគិតថ្លៃ
Piper Free
Piper គឺជាម៉ាស៊ីនអត្ថបទទៅជាសំឡេងស្រាលដែលត្រូវបានអភិវឌ្ឍន៍ដោយ Rhasspy ដែលប្រើស្ថាបត្យកម្ម VITS និង larynx ។ វារត់ទាំងស្រុងនៅលើស៊ីភីយូធ្វើឱ្យវាសមស្របសម្រាប់ឧបករណ៍កំរិតស្វ័យប្រវត្តិកម្មផ្ទះនិងកម្មវិធីដែលត្រូវការ TTS ក្រៅបណ្តាញ។ ជាមួយនឹងសំឡេងជាង 100 លើភាសា 30 + Piper ផ្ដល់នូវការនិយាយដែលមានសំឡេងធម្មជាតិនៅល្បឿនពេលវេលាពិតប្រាកដសូម្បីតែនៅលើ Raspberry Pi 4។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការមើលជាមុនរហ័ស មធ្យោបាយងាយស្រួល និងកម្មវិធីដែលបានបង្កប់
សាកល្បងដោយឥតគិតថ្លៃ
VITS Free
VITS (ការសន្និដ្ឋានខុសគ្នាជាមួយការរៀនដែលមានការប្រឈមមុខសម្រាប់ការរៀនពីចុងទៅចុងអត្ថបទទៅជាការនិយាយ) គឺជាវិធីសាស្ត្រ TTS មួយដែលបង្កើតសំឡេងធម្មជាតិជាងម៉ូដែលដំណាក់កាលពីរបច្ចុប្បន្ន។ វាប្រើការសន្និដ្ឋានខុសគ្នាដែលបានបង្កើនដោយការធ្វើឲ្យលំហូរធម្មតា និងដំណើរការហ្វឹកហាត់ដែលមានការប្រឈមមុខគ្នាដើម្បីសម្រេចបានការកែលម្អគួរឲ្យកត់សម្គាល់ក្នុងភាពធម្មជាតិ ។
ល្អបំផុតសម្រាប់ & # 160; ៖ អត្ថបទទៅការនិយាយគោលបំណងទូទៅជាមួយនឹងការនិយាយធម្មតា
សាកល្បងដោយឥតគិតថ្លៃ
MeloTTS Free
MeloTTS ដោយ MyShell.ai គឺជាបណ្ណាល័យ TTS ច្រើនភាសាដែលគាំទ្រភាសាអង់គ្លេស (អាមេរិក, អង់គ្លេស, ឥណ្ឌា, អូស្ត្រាលី), អេស្ប៉ាញ, បារាំង, ចិន, ជប៉ុននិងកូរ៉េ។ វាគឺលឿនខ្លាំងណាស់, ដំណើរការអត្ថបទនៅល្បឿនពេលពិតប្រាកដនៅជិត CPU ម្នាក់ឯង។ MeloTTS ត្រូវបានរចនាឡើងសម្រាប់ការប្រើប្រាស់ផលិតកម្មនិងគាំទ្រទាំង CPU និង GPU និន្នាការ។
ល្អបំផុតសម្រាប់ & # 160; ៖ កម្មវិធីផលិតកម្មដែលត្រូវការ TTS រហ័ស និងច្រើនភាសា
សាកល្បងដោយឥតគិតថ្លៃ
OuteTTS Free
OuteTTS ពង្រីកម៉ូដែលភាសាធំ ៗ ជាមួយសមត្ថភាពអត្ថបទទៅជាសំឡេង ខណៈពេលដែលរក្សាទុកស្ថាបត្យកម្មដើម។ វាគាំទ្រ backends ច្រើនរួមទាំង llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM និងសូម្បីតែការសន្និដ្ឋានកម្មវិធីរុករកតាមរយៈ Transformers.js ។ លក្ខណៈពិសេសការចម្លងសំឡេងដោយគ្មានការថតតាមរយៈទម្រង់អ្នកនិយាយដែលបានរក្សាទុកជា JSON ។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបែងចែកចំណុចប្រទាក់ TTS ផ្អែកលើកម្មវិធីរុករក បរិស្ថានធនធានទាប
សាកល្បងដោយឥតគិតថ្លៃ
Pocket TTS Free
Pocket TTS ដោយ Kyutai (អ្នកបង្កើត Moshi) គឺជាម៉ូដែលអត្ថបទ-ទៅ-ការនិយាយប៉ារ៉ាម៉ែត្រ 100M ដ៏តូចមួយដែលវាយលុកល្អប្រសើរជាងទំងន់របស់វា។ វារត់យ៉ាងមានប្រសិទ្ធភាពនៅលើស៊ីភីយូគាំទ្រការចម្លងសំឡេងសូន្យពីគំរូអូឌីយ៉ូតែមួយនិងផលិតការនិយាយដែលមានសំឡេងធម្មជាតិ។ ទំហំម៉ូដែលតូចធ្វើឱ្យវាសមស្របសម្រាប់បញ្ជូនច្រកនិងបរិស្ថានដែលមានធនធានទាប។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបែងចែកស្រាល បរិស្ថានតែស៊ីភីយូ ក្លូនសំឡេងរហ័ស
សាកល្បងដោយឥតគិតថ្លៃ
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ល្អបំផុតសម្រាប់ & # 160; ៖ Fast lightweight TTS, edge deployment, low-latency applications
សាកល្បងដោយឥតគិតថ្លៃ
Bark Standard
ម៉ូដែលអត្ថបទទៅអូឌីយ៉ូដែលមានមូលដ្ឋានលើបម្លែង ដែលបង្កើតការនិយាយពិត តន្ត្រី និងបែបផែនសំឡេង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Bark Small Standard
កំណែស្រាលជាងរបស់ Bark ដែលមានការសន្និដ្ឋានលឿនជាង និងការប្រើសតិទាបជាង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Tongyi Lab) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Dia TTS Standard
ម៉ូដែលបង្កើតប្រអប់អ្នកនិយាយច្រើនដែលបង្កើតការសន្ទនាធម្មជាតិរវាងអ្នកនិយាយ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Parler TTS Standard
ពិពណ៌នាសំឡេងដែលអ្នកចង់បានជាភាសាធម្មជាតិ ហើយ Parler បង្កើតការនិយាយដែលផ្គូផ្គង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Hugging Face · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
GLM-TTS Standard
សម្រេចអត្រាកំហុសតួអក្សរទាបបំផុតក្នុងចំណោមម៉ូដែល TTS ប្រភពបើកចំហ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Zhipu AI · អាជ្ញាបណ្ណ & # 160; ៖ GLM-4 License
សាកល្បង
IndexTTS-2 Standard
Zero-shot TTS ជាមួយការត្រួតពិនិត្យអារម្មណ៍ល្អិតល្អន់ និងការបង្ហាញខ្ពស់ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Index Team · អាជ្ញាបណ្ណ & # 160; ៖ Bilibili Model License
សាកល្បង
Spark TTS Standard
ក្លូនសំឡេង TTS ជាមួយអារម្មណ៍ដែលអាចត្រួតពិនិត្យបាន និងរចនាប័ទ្មនិយាយតាមរយៈការជូនដំណឹង ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ SparkAudio · អាជ្ញាបណ្ណ & # 160; ៖ CC BY-NC-SA 4.0
សាកល្បង
GPT-SoVITS Standard
សំឡេងខ្លីដែលបានចម្លង TTS ដែលចម្លងសំឡេងណាមួយពីតែ៥ វិនាទីនៃអូឌីយ៉ូ ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ RVC-Boss · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Orpheus Standard
ម៉ូដែល TTS កម្រិតមនុស្សដែលមានអារម្មណ៍ត្រូវបានបណ្តុះបណ្តាលលើ 100K ម៉ោងនៃទិន្នន័យនិយាយ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Canopy Labs · អាជ្ញាបណ្ណ & # 160; ៖ Llama 3.2 Community
សាកល្បង
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Qwen) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Chatterbox Turbo Standard
Chatterbox រហ័សជាងមុនជាមួយនឹងការរង់ចាំក្រោម 200ms និងស្លាក paralinguistic សម្រាប់ការញញឹម ហៀរក និងច្រើនទៀត ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Resemble AI · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Dia 2 Standard
ស្ទ្រីមដំបូងការសន្ទនា TTS ជាមួយនឹងប្រអប់អ្នកនិយាយច្រើន និងសញ្ញាភាសាបច្ចេកទេស ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
VoxCPM Standard
Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ OpenBMB · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
TADA Standard
Zero-ការភាន់ច្រឡំ TTS ជាមួយអត្ថបទ-acoustic ពីរការតម្រឹម, 5x រហ័សជាងអាចប្រៀបធៀបបាន LLM TTS.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Hume AI · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
VibeVoice Standard
ម៉ូដែល Microsoft សម្រាប់មាតិកាអ្នកនិយាយច្រើនបែបបទវែងដូចជាផតខាស់ និងសៀវភៅអូឌីយ៉ូ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Microsoft · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (FunAudioLLM) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ភាសា & # 160; ៖ en, zh, ja, ko, fr, de, it, es
ក្លូនសំឡេង
GLM-TTS
សម្រេចអត្រាកំហុសតួអក្សរទាបបំផុតក្នុងចំណោមម៉ូដែល TTS ប្រភពបើកចំហ & # 160; ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
IndexTTS-2
Zero-shot TTS ជាមួយការត្រួតពិនិត្យអារម្មណ៍ល្អិតល្អន់ និងការបង្ហាញខ្ពស់ & # 160; ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
Spark TTS
ក្លូនសំឡេង TTS ជាមួយអារម្មណ៍ដែលអាចត្រួតពិនិត្យបាន និងរចនាប័ទ្មនិយាយតាមរយៈការជូនដំណឹង ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
GPT-SoVITS
សំឡេងខ្លីដែលបានចម្លង TTS ដែលចម្លងសំឡេងណាមួយពីតែ៥ វិនាទីនៃអូឌីយ៉ូ ។
ភាសា & # 160; ៖ en, zh, ja, ko
ក្លូនសំឡេង
Chatterbox
state-of-the-art សំឡេងក្លែងក្លាយដោយគ្មានការបាញ់ដោយមានការត្រួតពិនិត្យអារម្មណ៍ពី Resemble AI ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
Tortoise TTS
អត្ថបទទៅការនិយាយសំឡេងច្រើនផ្តោតលើគុណភាពជាមួយស្ថាបត្យកម្មត្រឡប់ទៅវិញដោយស្វ័យប្រវត្តិ & # 160; ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
OpenVoice
ការក្លូនសំឡេងភ្លាមៗជាមួយការត្រួតពិនិត្យក្រឡាលើរចនាប័ទ្ម អារម្មណ៍ និងសំឡេងរំខាន ។
ភាសា & # 160; ៖ en, zh, ja, ko, fr, de, es, it
ក្លូនសំឡេង
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text ។
ភាសា & # 160; ៖ en, zh, ja, ko, de, fr, ru, pt, es, it
ក្លូនសំឡេង
Chatterbox Turbo
Chatterbox រហ័សជាងមុនជាមួយនឹងការរង់ចាំក្រោម 200ms និងស្លាក paralinguistic សម្រាប់ការញញឹម ហៀរក និងច្រើនទៀត ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
VoxCPM
Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
OuteTTS
LLM-based TTS ដែលរត់នៅលើ CPU, GPU, ឬកម្មវិធីរុករកតាមរយៈ llama.cpp និង Transformers.js ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
Pocket TTS
ម៉ូដែលប៉ារ៉ាម៉ែត្រ 100M ស្រាលដោយ Kyutai ជាមួយការចម្លងសំឡេងពីគំរូតែមួយ។
ភាសា & # 160; ៖ en, fr
ក្លូនសំឡេង
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ភាសា & # 160; ៖ en, zh, ja, ko, de, es, fr, it, ru
ក្លូនសំឡេង
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ភាសា & # 160; ៖ en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
ក្លូនសំឡេង
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេងAPI ដំបូងរបស់អ្នកអភិវឌ្ឍន៍
REST API ឆបគ្នាជាមួយ OpenAI ។ ចំណុចបញ្ចប់មួយ ម៉ូដែល 22 + ។ ការគាំទ្រស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត ។
- ទ្រង់ទ្រាយឆបគ្នាជាមួយ OpenAI
- ស្ទ្រីម TTS សម្រាប់កម្មវិធីពេលវេលាពិត
- ការដំណើរការបាច់សម្រាប់ការងារធំៗ
- ការជូនដំណឹង Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
តម្លៃធម្មតាថ្លា
ចាប់ផ្ដើមដោយឥតគិតថ្លៃ & # 160; ។ ធ្វើមាត្រដ្ឋានតាមដែលអ្នករីកចម្រើន & # 160; ។
ទំនេរ
១៥ ក្រេឌីត
- Kokoro, Piper, VITS, MeloTTS
- ដែនកំណត់តួអក្សរ ៥០០
- 3 មេកាបៃ/ ម៉ោង (គ្មានគណនី)
កម្មវិធីចាប់ផ្ដើម
500 ក្រេឌីត / ខែ
- ម៉ូដែល 22+ ទាំងអស់
- 100, 000 តួអក្សរក្នុងមួយជំនាន់
- ការក្លូនសំឡេង
ជំនាញ
2,000 ក្រេឌីត / ខែ
- ទាំងអស់នៅក្នុងកម្មវិធីចាប់ផ្ដើម
- ការចូលដំណើរការ API
- ដំណើរការអាទិភាព
សំណួរដែលសួរញឹកញាប់
តើយើងអាចធ្វើអ្វីបានប្រសើរឡើង & # 160;? មតិយោបល់របស់អ្នកជួយយើងជួសជុលបញ្ហា & # 160; ។
ចាប់ផ្ដើមប្រើសំឡេង AI ថ្ងៃនេះ
ចូលរួមអ្នកបង្កើតអ្នកអភិវឌ្ឍន៍និងអាជីវកម្មដោយប្រើ TTS.ai