AI ឥតគិតថ្លៃ អត្ថបទទៅការនិយាយ
33+ ម៉ូដែលប្រភពបើកចំហ 273+ សំឡេង 33+ ភាសា & # 160; ។ គ្មានគណនីដែលត្រូវការ & # 160; ។
អ្វីដែលអ្នកត្រូវការសម្រាប់សំឡេង AI
30+ ឧបករណ៍ដែលមានថាមពលដោយម៉ូដែល AI ប្រភពបើកចំហ
33+ ម៉ូដែលសំឡេង AI
ការប្រមូលផ្ដុំដ៏ទូលំទូលាយបំផុតនៃម៉ូដែល TTS ប្រភពបើកចំហក្នុងវេទិកាមួយ
Kokoro ឥតគិតថ្លៃ
Kokoro គឺជាម៉ូដែលអត្ថបទទៅជាសំឡេងប៉ារ៉ាម៉ែត្រ 82 លាននាក់ដែលវាយល្អប្រសើរជាងថ្នាក់ទម្ងន់របស់ខ្លួន។ ទោះបីជាទំហំតូចក៏ដោយវាផលិតការនិយាយដែលគួរឱ្យកត់សម្គាល់និងមានលក្ខណៈធម្មជាតិ។ Kokoro គាំទ្រភាសាច្រើនរួមទាំងភាសាអង់គ្លេសជប៉ុនចិននិងកូរ៉េជាមួយនឹងសំឡេងបង្ហាញផ្សេងៗ។ វារត់យ៉ាងលឿនខ្លាំងណាស់ - បង្កើតអូឌីយ៉ូជិត 100x រហ័សជាងពេលពិតនៅលើ GPU ។
ល្អបំផុតសម្រាប់ & # 160; ៖ TTS គុណភាពខ្ពស់ជាមួយការពន្យារអប្បបរមា កម្មវិធីស្ទ្រីម
សាកល្បងដោយឥតគិតថ្លៃ
Piper ឥតគិតថ្លៃ
Piper គឺជាម៉ាស៊ីនអត្ថបទទៅជាសំឡេងស្រាលដែលត្រូវបានអភិវឌ្ឍន៍ដោយ Rhasspy ដែលប្រើស្ថាបត្យកម្ម VITS និង larynx ។ វារត់ទាំងស្រុងនៅលើស៊ីភីយូធ្វើឱ្យវាសមស្របសម្រាប់ឧបករណ៍កំរិតស្វ័យប្រវត្តិកម្មផ្ទះនិងកម្មវិធីដែលត្រូវការ TTS ក្រៅបណ្តាញ។ ជាមួយនឹងសំឡេងជាង 100 លើភាសា 30 + Piper ផ្ដល់នូវការនិយាយដែលមានសំឡេងធម្មជាតិនៅល្បឿនពេលវេលាពិតប្រាកដសូម្បីតែនៅលើ Raspberry Pi 4។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការមើលជាមុនរហ័ស មធ្យោបាយងាយស្រួល និងកម្មវិធីដែលបានបង្កប់
សាកល្បងដោយឥតគិតថ្លៃ
VITS ឥតគិតថ្លៃ
VITS (ការសន្និដ្ឋានខុសគ្នាជាមួយការរៀនដែលមានការប្រឈមមុខសម្រាប់ការរៀនពីចុងទៅចុងអត្ថបទទៅជាការនិយាយ) គឺជាវិធីសាស្ត្រ TTS មួយដែលបង្កើតសំឡេងធម្មជាតិជាងម៉ូដែលដំណាក់កាលពីរបច្ចុប្បន្ន។ វាប្រើការសន្និដ្ឋានខុសគ្នាដែលបានបង្កើនដោយការធ្វើឲ្យលំហូរធម្មតា និងដំណើរការហ្វឹកហាត់ដែលមានការប្រឈមមុខគ្នាដើម្បីសម្រេចបានការកែលម្អគួរឲ្យកត់សម្គាល់ក្នុងភាពធម្មជាតិ ។
ល្អបំផុតសម្រាប់ & # 160; ៖ អត្ថបទទៅការនិយាយគោលបំណងទូទៅជាមួយនឹងការនិយាយធម្មតា
សាកល្បងដោយឥតគិតថ្លៃ
MeloTTS ឥតគិតថ្លៃ
MeloTTS ដោយ MyShell.ai គឺជាបណ្ណាល័យ TTS ច្រើនភាសាដែលគាំទ្រភាសាអង់គ្លេស (អាមេរិក, អង់គ្លេស, ឥណ្ឌា, អូស្ត្រាលី), អេស្ប៉ាញ, បារាំង, ចិន, ជប៉ុននិងកូរ៉េ។ វាគឺលឿនខ្លាំងណាស់, ដំណើរការអត្ថបទនៅល្បឿនពេលពិតប្រាកដនៅជិត CPU ម្នាក់ឯង។ MeloTTS ត្រូវបានរចនាឡើងសម្រាប់ការប្រើប្រាស់ផលិតកម្មនិងគាំទ្រទាំង CPU និង GPU និន្នាការ។
ល្អបំផុតសម្រាប់ & # 160; ៖ កម្មវិធីផលិតកម្មដែលត្រូវការ TTS រហ័ស និងច្រើនភាសា
សាកល្បងដោយឥតគិតថ្លៃ
Kani TTS 2 ឥតគិតថ្លៃ
Kani-TTS-2 ដោយ NineNineSix គឺជាម៉ូដែលប៉ារ៉ាម៉ែត្រ 400M ធ្ងន់ធ្ងរដែលសាងសង់ឡើងលើគ្រឹះ AI LFM2 ជាមួយ NVIDIA NanoCodec ។ វារត់ក្នុង VRAM 3GB ប៉ុណ្ណោះហើយផលិត ~ 10 វិនាទីនៃការនិយាយក្នុង ~2វិនាទីនៅលើ A100 (RTF 0.2) ។ កំណែសាធារណៈបច្ចុប្បន្នដឹកជញ្ជូនតែចំណុចត្រួតពិនិត្យ `kani-tts-2-en` ភាសាអង់គ្លេសប៉ុណ្ណោះហើយមិនបង្ហាញពី hook បញ្ចូលអ្នកនិយាយដែលត្រូវការសម្រាប់ក្លូនសំឡេងទេ - ប្រើ Chatterbox / IndexTTS2 / F5-TTS សម្រាប់ក្លូនឬ Kokoro / MeloTTS សម្រាប់ភាសាមិនអង់គ្លេស។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបង្កើតភាសាអង់គ្លេសរហ័សលើផ្នែករឹង VRAM ទាប ការមើលជាមុនរហ័ស
សាកល្បងដោយឥតគិតថ្លៃ
OuteTTS ឥតគិតថ្លៃ
OuteTTS ពង្រីកម៉ូដែលភាសាធំ ៗ ជាមួយសមត្ថភាពអត្ថបទទៅជាសំឡេង ខណៈពេលដែលរក្សាទុកស្ថាបត្យកម្មដើម។ វាគាំទ្រ backends ច្រើនរួមទាំង llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM និងសូម្បីតែការសន្និដ្ឋានកម្មវិធីរុករកតាមរយៈ Transformers.js ។ លក្ខណៈពិសេសការចម្លងសំឡេងដោយគ្មានការថតតាមរយៈទម្រង់អ្នកនិយាយដែលបានរក្សាទុកជា JSON ។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបែងចែកចំណុចប្រទាក់ TTS ផ្អែកលើកម្មវិធីរុករក បរិស្ថានធនធានទាប
សាកល្បងដោយឥតគិតថ្លៃ
Pocket TTS ឥតគិតថ្លៃ
Pocket TTS ដោយ Kyutai (អ្នកបង្កើត Moshi) គឺជាម៉ូដែលអត្ថបទ-ទៅ-ការនិយាយប៉ារ៉ាម៉ែត្រ 100M ដ៏តូចមួយដែលវាយលុកល្អប្រសើរជាងទំងន់របស់វា។ វារត់យ៉ាងមានប្រសិទ្ធភាពនៅលើស៊ីភីយូគាំទ្រការចម្លងសំឡេងសូន្យពីគំរូអូឌីយ៉ូតែមួយនិងផលិតការនិយាយដែលមានសំឡេងធម្មជាតិ។ ទំហំម៉ូដែលតូចធ្វើឱ្យវាសមស្របសម្រាប់បញ្ជូនច្រកនិងបរិស្ថានដែលមានធនធានទាប។
ល្អបំផុតសម្រាប់ & # 160; ៖ ការបែងចែកស្រាល បរិស្ថានតែស៊ីភីយូ ក្លូនសំឡេងរហ័ស
សាកល្បងដោយឥតគិតថ្លៃ
Kitten TTS ឥតគិតថ្លៃ
Kitten TTS ដោយ KittenML គឺជាម៉ូដែលអត្ថបទទៅជាសំឡេងដែលមានទំងន់ស្រាលបំផុតដែលបង្កើតឡើងនៅលើ ONNX ។ ជាមួយនឹងប៉ារ៉ាម៉ែត្រពី 15M ទៅ 80M (25-80 MB នៅលើថាស) វាផ្ដល់នូវការសំយោគសំឡេងដែលមានគុណភាពខ្ពស់នៅលើស៊ីភីយូដោយមិនចាំបាច់ត្រូវការ GPU ។ លក្ខណៈពិសេស 8 សំឡេងខាងក្នុងល្បឿននៃការនិយាយដែលអាចលៃតម្រូវបាននិងអត្ថបទដែលបានតំឡើងជាមុនសម្រាប់លេខរូបិយប័ណ្ណនិងឯកតា។ ល្អឥតខ្ចោះសម្រាប់កម្មវិធីបញ្ជូននិងកម្មវិធីអត្រាអត្រាទាប។
ល្អបំផុតសម្រាប់ & # 160; ៖ TTS ស្រាលលឿន ការបែងចែកចំណុចប្រទាក់ កម្មវិធីអត្រាពន្យារទាប
សាកល្បងដោយឥតគិតថ្លៃ
Ming-Omni TTS ឥតគិតថ្លៃ
Ming-omni-tts-0.5B ដោយ inclusionAI គឺជាម៉ូដែលនិយាយ omni-modal ដ៏តូចមួយដែលត្រូវបានសាងសង់ឡើងនៅលើឆ្អឹងខ្នង BailingMM ដែលមានភាពជិតស្និទ្ធជាមួយកម្មវិធីឌិកូដអូឌីយ៉ូដែលសមស្របនឹង Patch-by-Patch ។ ផ្តល់នូវលទ្ធផល 44.1kHz (ជិតគុណភាពស៊ីឌី) គាំទ្រការចម្លងសំឡេងសូន្យពីឯកសារយោង 3+ វិនាទីនិងរួមបញ្ចូលការត្រួតពិនិត្យអារម្មណ៍ / ភាសា / BGM តាមរយៈការណែនាំ JSON ។ ស្ថេរភាពល្អ - 0.83% WER លើចំណុចប្រទាក់ចិន។
ល្អបំផុតសម្រាប់ & # 160; ៖ ភាពស្មោះត្រង់ខ្ពស់ការនិយាយពីរភាសាការសម្ដែងសំឡេងដែលបានត្រួតពិនិត្យដោយអារម្មណ៍មាតិកាសៀវភៅអូឌីយ៉ូចិន
សាកល្បងដោយឥតគិតថ្លៃ
MOSS-TTS Nano ឥតគិតថ្លៃ
MOSS-TTS-Nano-100M គឺជាប៉ារ៉ាម៉ែត្រ 100M ដ៏តូចមួយរបស់ OpenMOSS នៃគ្រួសារ MOSS-TTS ដែលចែករំលែកស្ថាបត្យកម្មនៃការពន្យារពេល។ ពាណិជ្ជកម្មគុណភាពកំពូលរបស់ម៉ូដែល 8B សម្រាប់ទម្ងន់តូចជាង ~ 80x និង VRAM ទាបជាងការស្នើសុំដែលធ្វើឱ្យវាសមស្របសម្រាប់ការបញ្ជូនកម្រិតនិងកម្រិតខ្ពស់។ ដូចគ្នា 20-ភាសា។
ល្អបំផុតសម្រាប់ & # 160; ៖ TTS កម្រិតឥតគិតថ្លៃ ផលិតកម្មកម្រិតខ្ពស់ ការប្រើប្រាស់អន្តរកម្មអត្រាពន្យារទាប
សាកល្បងដោយឥតគិតថ្លៃ
Bark លំនាំដើម
ម៉ូដែលអត្ថបទទៅអូឌីយ៉ូដែលមានមូលដ្ឋានលើបម្លែង ដែលបង្កើតការនិយាយពិត តន្ត្រី និងបែបផែនសំឡេង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Bark Small លំនាំដើម
កំណែស្រាលជាងរបស់ Bark ដែលមានការសន្និដ្ឋានលឿនជាង និងការប្រើសតិទាបជាង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
CosyVoice 2 លំនាំដើម
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Tongyi Lab) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Dia TTS លំនាំដើម
ម៉ូដែលបង្កើតប្រអប់អ្នកនិយាយច្រើនដែលបង្កើតការសន្ទនាធម្មជាតិរវាងអ្នកនិយាយ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Parler TTS លំនាំដើម
ពិពណ៌នាសំឡេងដែលអ្នកចង់បានជាភាសាធម្មជាតិ ហើយ Parler បង្កើតការនិយាយដែលផ្គូផ្គង & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Hugging Face · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
IndexTTS-2 លំនាំដើម
Zero-shot TTS ជាមួយការត្រួតពិនិត្យអារម្មណ៍ល្អិតល្អន់ និងការបង្ហាញខ្ពស់ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Index Team · អាជ្ញាបណ្ណ & # 160; ៖ Bilibili Model License
សាកល្បង
Spark TTS លំនាំដើម
ក្លូនសំឡេង TTS ជាមួយអារម្មណ៍ដែលអាចត្រួតពិនិត្យបាន និងរចនាប័ទ្មនិយាយតាមរយៈការជូនដំណឹង ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ SparkAudio · អាជ្ញាបណ្ណ & # 160; ៖ CC BY-NC-SA 4.0
សាកល្បង
GPT-SoVITS លំនាំដើម
សំឡេងខ្លីដែលបានចម្លង TTS ដែលចម្លងសំឡេងណាមួយពីតែ៥ វិនាទីនៃអូឌីយ៉ូ ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ RVC-Boss · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Orpheus លំនាំដើម
ម៉ូដែល TTS កម្រិតមនុស្សដែលមានអារម្មណ៍ត្រូវបានបណ្តុះបណ្តាលលើ 100K ម៉ោងនៃទិន្នន័យនិយាយ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Canopy Labs · អាជ្ញាបណ្ណ & # 160; ៖ Llama 3.2 Community
សាកល្បង
Qwen3 TTS លំនាំដើម
Alibaba's multilingual TTS with preset voices and voice design from text.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Qwen) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
VieNeu-TTS-v2 លំនាំដើម
វៀតណាម + អង់គ្លេស កូដ-ប្តូរ TTS ជាមួយ7សំឡេងដែលបានកំណត់ជាមុននិងសូន្យ-គ្រាប់កាំភ្លើងក្លូនសំឡេង. CPU-តែប៉ុណ្ណោះ, មិន GPU ដែលត្រូវការ.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Phạm Nguyễn Ngọc Bảo · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
Chatterbox Turbo លំនាំដើម
Chatterbox រហ័សជាងមុនជាមួយនឹងការរង់ចាំក្រោម 200ms និងស្លាក paralinguistic សម្រាប់ការញញឹម ហៀរក និងច្រើនទៀត ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Resemble AI · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
VoxCPM លំនាំដើម
Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ OpenBMB · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
VibeVoice លំនាំដើម
ម៉ូដែល Microsoft សម្រាប់មាតិកាអ្នកនិយាយច្រើនបែបបទវែងដូចជាផតខាស់ និងសៀវភៅអូឌីយ៉ូ & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Microsoft · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
CosyVoice3 លំនាំដើម
TTS ជំនាន់ក្រោយជាច្រើនភាសាជាមួយការស្ទ្រីមពីរដង ការត្រួតពិនិត្យអារម្មណ៍ និងការក្លូនសំឡេងសូន្យគ្រាប់។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ Alibaba (FunAudioLLM) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
NAMAA Saudi TTS លំនាំដើម
បើក TTS ភាសាអារ៉ាប់សាអូឌីតដំបូងគេ ។ ភាសាសាអូឌីតដើមជាមួយការក្លូនសំឡេងគុណភាព Chatterbox ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ NAMAA Space · អាជ្ញាបណ្ណ & # 160; ៖ MIT
សាកល្បង
Darwin TTS លំនាំដើម
ប្រភេទឆ្លងរបៀប Qwen3- TTS ជាមួយទម្ងន់ FFN លាយពីម៉ូដែលភាសា Qwen3- 1. 7B សម្រាប់ការក្លូនភាសាច្រើនច្បាស់ជាងមុន & # 160; ។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ FINAL-Bench · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
MOSS-TTSD លំនាំដើម
ម៉ូដែលបន្តការសន្ទនាជាមួយអ្នកនិយាយច្រើន - បង្កើតការសន្ទនាបែបផែន podcast ជាមួយអ្នកនិយាយរហូតដល់ទៅ5នាក់និង 60 នាទីនៃអូឌីយ៉ូដែលទាក់ទងគ្នា។
អ្នកអភិវឌ្ឍន៍ & # 160; ៖ OpenMOSS · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0
សាកល្បង
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ភាសា & # 160; ៖ en, zh, ja, ko, fr, de, it, es
ក្លូនសំឡេង
IndexTTS-2
Zero-shot TTS ជាមួយការត្រួតពិនិត្យអារម្មណ៍ល្អិតល្អន់ និងការបង្ហាញខ្ពស់ & # 160; ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
Spark TTS
ក្លូនសំឡេង TTS ជាមួយអារម្មណ៍ដែលអាចត្រួតពិនិត្យបាន និងរចនាប័ទ្មនិយាយតាមរយៈការជូនដំណឹង ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
GPT-SoVITS
សំឡេងខ្លីដែលបានចម្លង TTS ដែលចម្លងសំឡេងណាមួយពីតែ៥ វិនាទីនៃអូឌីយ៉ូ ។
ភាសា & # 160; ៖ en, zh, ja, ko
ក្លូនសំឡេង
Chatterbox
state-of-the-art សំឡេងក្លែងក្លាយដោយគ្មានការបាញ់ដោយមានការត្រួតពិនិត្យអារម្មណ៍ពី Resemble AI ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
Tortoise TTS
អត្ថបទទៅការនិយាយសំឡេងច្រើនផ្តោតលើគុណភាពជាមួយស្ថាបត្យកម្មត្រឡប់ទៅវិញដោយស្វ័យប្រវត្តិ & # 160; ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
OpenVoice
ការក្លូនសំឡេងភ្លាមៗជាមួយការត្រួតពិនិត្យក្រឡាលើរចនាប័ទ្ម អារម្មណ៍ និងសំឡេងរំខាន ។
ភាសា & # 160; ៖ en, zh, ja, ko, fr, es
ក្លូនសំឡេង
VieNeu-TTS-v2
វៀតណាម + អង់គ្លេស កូដ-ប្តូរ TTS ជាមួយ7សំឡេងដែលបានកំណត់ជាមុននិងសូន្យ-គ្រាប់កាំភ្លើងក្លូនសំឡេង. CPU-តែប៉ុណ្ណោះ, មិន GPU ដែលត្រូវការ.
ភាសា & # 160; ៖ vi, en
ក្លូនសំឡេង
Chatterbox Turbo
Chatterbox រហ័សជាងមុនជាមួយនឹងការរង់ចាំក្រោម 200ms និងស្លាក paralinguistic សម្រាប់ការញញឹម ហៀរក និងច្រើនទៀត ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
VoxCPM
Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
OuteTTS
LLM-based TTS ដែលរត់នៅលើ CPU, GPU, ឬកម្មវិធីរុករកតាមរយៈ llama.cpp និង Transformers.js ។
ភាសា & # 160; ៖ en
ក្លូនសំឡេង
Pocket TTS
ម៉ូដែលប៉ារ៉ាម៉ែត្រ 100M ស្រាលដោយ Kyutai ជាមួយការចម្លងសំឡេងពីគំរូតែមួយ។
ភាសា & # 160; ៖ en, fr
ក្លូនសំឡេង
CosyVoice3
TTS ជំនាន់ក្រោយជាច្រើនភាសាជាមួយការស្ទ្រីមពីរដង ការត្រួតពិនិត្យអារម្មណ៍ និងការក្លូនសំឡេងសូន្យគ្រាប់។
ភាសា & # 160; ៖ en, zh, ja, ko, de, es, fr, it, ru
ក្លូនសំឡេង
NAMAA Saudi TTS
បើក TTS ភាសាអារ៉ាប់សាអូឌីតដំបូងគេ ។ ភាសាសាអូឌីតដើមជាមួយការក្លូនសំឡេងគុណភាព Chatterbox ។
ភាសា & # 160; ៖ ar
ក្លូនសំឡេង
Darwin TTS
ប្រភេទឆ្លងរបៀប Qwen3- TTS ជាមួយទម្ងន់ FFN លាយពីម៉ូដែលភាសា Qwen3- 1. 7B សម្រាប់ការក្លូនភាសាច្រើនច្បាស់ជាងមុន & # 160; ។
ភាសា & # 160; ៖ en, ko, ja, zh
ក្លូនសំឡេង
MOSS-TTSD
ម៉ូដែលបន្តការសន្ទនាជាមួយអ្នកនិយាយច្រើន - បង្កើតការសន្ទនាបែបផែន podcast ជាមួយអ្នកនិយាយរហូតដល់ទៅ5នាក់និង 60 នាទីនៃអូឌីយ៉ូដែលទាក់ទងគ្នា។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
Ming-Omni TTS
ម៉ូដែលសម្លេង omni-modal 0.5B ដ៏តូចមួយពី inclusionAI ជាមួយនឹងលទ្ធផល 44.1kHz ខ្ពស់និងការចម្លងសំឡេងសូន្យ។
ភាសា & # 160; ៖ en, zh
ក្លូនសំឡេង
MOSS-TTS Nano
100M MOSS-TTS តិចតួច - សណ្ឋាគារដូចគ្នា, 80x តិចជាង, ភាពយឺតយ៉ាវដោយឥតគិតថ្លៃ.
ភាសា & # 160; ៖ en, zh, de, es, fr, ja, it, ko, ru, ar, pt
ក្លូនសំឡេងAPI ដំបូងរបស់អ្នកអភិវឌ្ឍន៍
REST API ឆបគ្នាជាមួយ OpenAI ។ ចំណុចបញ្ចប់មួយ ម៉ូដែល 22 + ។ ការគាំទ្រស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត ។
- ទ្រង់ទ្រាយឆបគ្នាជាមួយ OpenAI
- ស្ទ្រីម TTS សម្រាប់កម្មវិធីពេលវេលាពិត
- ការដំណើរការបាច់សម្រាប់ការងារធំៗ
- ការជូនដំណឹង Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
តម្លៃធម្មតាថ្លា
ចាប់ផ្ដើមដោយឥតគិតថ្លៃ & # 160; ។ ធ្វើមាត្រដ្ឋានតាមដែលអ្នករីកចម្រើន & # 160; ។
ទំនេរ
15,000 តួអក្សរ + 5,000/ថ្ងៃ
- 7 ម៉ូដែលឥតគិតថ្លៃរួមទាំង Kokoro
- ៥, ០០០ តួអក្សរក្នុងមួយជំនាន់
- ចូលដំណើរការ API ដែលបានរួមបញ្ចូល
កម្មវិធីចាប់ផ្ដើម
500 ក្រេឌីត / ខែ
- ម៉ូដែល 22+ ទាំងអស់
- 100, 000 តួអក្សរក្នុងមួយជំនាន់
- ការក្លូនសំឡេង
ជំនាញ
2,000 ក្រេឌីត / ខែ
- ទាំងអស់នៅក្នុងកម្មវិធីចាប់ផ្ដើម
- ការចូលដំណើរការ API
- ដំណើរការអាទិភាព
សំណួរដែលសួរញឹកញាប់
តើយើងអាចធ្វើអ្វីបានប្រសើរឡើង & # 160;? មតិយោបល់របស់អ្នកជួយយើងជួសជុលបញ្ហា & # 160; ។
ចាប់ផ្ដើមប្រើសំឡេង AI ថ្ងៃនេះ
ចូលរួមអ្នកបង្កើតអ្នកអភិវឌ្ឍន៍និងអាជីវកម្មដោយប្រើ TTS.ai