AI ឥត​គិត​ថ្លៃ អត្ថបទ​ទៅ​ការ​និយាយ

31+ ម៉ូដែល​ប្រភព​បើកចំហ 231+ សំឡេង 34+ ភាសា & # 160; ។ គ្មាន​គណនី​ដែល​ត្រូវការ & # 160; ។

8K+
អ្នក​បង្កើត
30K+
ជំនាន់
31+
ម៉ូដែល AI
231+
សំឡេង
0/500 តួអក្សរ · Sign up for 5,000 per generation → ទំនេរ
ស្រឡាញ់ TTS.ai? ប្រាប់មិត្តភក្តិរបស់អ្នក!

អ្វី​ដែល​អ្នក​ត្រូវការ​សម្រាប់​សំឡេង AI

30+ ឧបករណ៍ដែលមានថាមពលដោយម៉ូដែល AI ប្រភពបើកចំហ

31+ ម៉ូដែល​សំឡេង AI

ការ​ប្រមូល​ផ្ដុំ​ដ៏​ទូលំទូលាយ​បំផុត​នៃ​ម៉ូដែល TTS ប្រភព​បើកចំហ​ក្នុង​វេទិកា​មួយ

KokoroKokoro Free

Kokoro គឺជាម៉ូដែលអត្ថបទទៅជាសំឡេងប៉ារ៉ាម៉ែត្រ 82 លាននាក់ដែលវាយល្អប្រសើរជាងថ្នាក់ទម្ងន់របស់ខ្លួន។ ទោះបីជាទំហំតូចក៏ដោយវាផលិតការនិយាយដែលគួរឱ្យកត់សម្គាល់និងមានលក្ខណៈធម្មជាតិ។ Kokoro គាំទ្រភាសាច្រើនរួមទាំងភាសាអង់គ្លេសជប៉ុនចិននិងកូរ៉េជាមួយនឹងសំឡេងបង្ហាញផ្សេងៗ។ វារត់យ៉ាងលឿនខ្លាំងណាស់ - បង្កើតអូឌីយ៉ូជិត 100x រហ័សជាងពេលពិតនៅលើ GPU ។

ល្អបំផុត​សម្រាប់ & # 160; ៖ TTS គុណភាព​ខ្ពស់​ជាមួយ​ការ​ពន្យារ​អប្បបរមា កម្មវិធី​ស្ទ្រីម

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

PiperPiper Free

Piper គឺជាម៉ាស៊ីនអត្ថបទទៅជាសំឡេងស្រាលដែលត្រូវបានអភិវឌ្ឍន៍ដោយ Rhasspy ដែលប្រើស្ថាបត្យកម្ម VITS និង larynx ។ វារត់ទាំងស្រុងនៅលើស៊ីភីយូធ្វើឱ្យវាសមស្របសម្រាប់ឧបករណ៍កំរិតស្វ័យប្រវត្តិកម្មផ្ទះនិងកម្មវិធីដែលត្រូវការ TTS ក្រៅបណ្តាញ។ ជាមួយនឹងសំឡេងជាង 100 លើភាសា 30 + Piper ផ្ដល់នូវការនិយាយដែលមានសំឡេងធម្មជាតិនៅល្បឿនពេលវេលាពិតប្រាកដសូម្បីតែនៅលើ Raspberry Pi 4។

ល្អបំផុត​សម្រាប់ & # 160; ៖ ការ​មើល​ជាមុន​រហ័ស មធ្យោបាយ​ងាយស្រួល និង​កម្មវិធី​ដែល​បាន​បង្កប់

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

VITSVITS Free

VITS (ការ​សន្និដ្ឋាន​ខុស​គ្នា​ជាមួយ​ការ​រៀន​ដែល​មាន​ការ​ប្រឈម​មុខ​សម្រាប់​ការ​រៀន​ពី​ចុង​ទៅ​ចុង​អត្ថបទ​ទៅ​ជា​ការ​និយាយ) គឺ​ជា​វិធីសាស្ត្រ TTS មួយ​ដែល​បង្កើត​សំឡេង​ធម្មជាតិ​ជាង​ម៉ូដែល​ដំណាក់កាល​ពីរ​បច្ចុប្បន្ន​។ វា​ប្រើ​ការ​សន្និដ្ឋាន​ខុស​គ្នា​ដែល​បាន​បង្កើន​ដោយ​ការ​ធ្វើ​ឲ្យ​លំហូរ​ធម្មតា និង​ដំណើរការ​ហ្វឹកហាត់​ដែល​មាន​ការ​ប្រឈម​មុខ​គ្នា​ដើម្បី​សម្រេច​បាន​ការ​កែ​លម្អ​គួរ​ឲ្យ​កត់សម្គាល់​ក្នុង​ភាព​ធម្មជាតិ ។

ល្អបំផុត​សម្រាប់ & # 160; ៖ អត្ថបទ​ទៅ​ការ​និយាយ​គោលបំណង​ទូទៅ​ជាមួយ​នឹង​ការ​និយាយ​ធម្មតា

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

MeloTTSMeloTTS Free

MeloTTS ដោយ MyShell.ai គឺជាបណ្ណាល័យ TTS ច្រើនភាសាដែលគាំទ្រភាសាអង់គ្លេស (អាមេរិក, អង់គ្លេស, ឥណ្ឌា, អូស្ត្រាលី), អេស្ប៉ាញ, បារាំង, ចិន, ជប៉ុននិងកូរ៉េ។ វាគឺលឿនខ្លាំងណាស់, ដំណើរការអត្ថបទនៅល្បឿនពេលពិតប្រាកដនៅជិត CPU ម្នាក់ឯង។ MeloTTS ត្រូវបានរចនាឡើងសម្រាប់ការប្រើប្រាស់ផលិតកម្មនិងគាំទ្រទាំង CPU និង GPU និន្នាការ។

ល្អបំផុត​សម្រាប់ & # 160; ៖ កម្មវិធី​ផលិតកម្ម​ដែល​ត្រូវការ TTS រហ័ស និង​ច្រើន​ភាសា

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

OuteTTSOuteTTS Free

OuteTTS ពង្រីកម៉ូដែលភាសាធំ ៗ ជាមួយសមត្ថភាពអត្ថបទទៅជាសំឡេង ខណៈពេលដែលរក្សាទុកស្ថាបត្យកម្មដើម។ វាគាំទ្រ backends ច្រើនរួមទាំង llama.cpp (CPU / GPU), Hugging Face Transformers, ExLlamaV2, VLLM និងសូម្បីតែការសន្និដ្ឋានកម្មវិធីរុករកតាមរយៈ Transformers.js ។ លក្ខណៈពិសេសការចម្លងសំឡេងដោយគ្មានការថតតាមរយៈទម្រង់អ្នកនិយាយដែលបានរក្សាទុកជា JSON ។

ល្អបំផុត​សម្រាប់ & # 160; ៖ ការ​បែងចែក​ចំណុច​ប្រទាក់ TTS ផ្អែក​លើ​កម្មវិធី​រុករក បរិស្ថាន​ធនធាន​ទាប

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

Pocket TTSPocket TTS Free

Pocket TTS ដោយ Kyutai (អ្នកបង្កើត Moshi) គឺជាម៉ូដែលអត្ថបទ-ទៅ-ការនិយាយប៉ារ៉ាម៉ែត្រ 100M ដ៏តូចមួយដែលវាយលុកល្អប្រសើរជាងទំងន់របស់វា។ វារត់យ៉ាងមានប្រសិទ្ធភាពនៅលើស៊ីភីយូគាំទ្រការចម្លងសំឡេងសូន្យពីគំរូអូឌីយ៉ូតែមួយនិងផលិតការនិយាយដែលមានសំឡេងធម្មជាតិ។ ទំហំម៉ូដែលតូចធ្វើឱ្យវាសមស្របសម្រាប់បញ្ជូនច្រកនិងបរិស្ថានដែលមានធនធានទាប។

ល្អបំផុត​សម្រាប់ & # 160; ៖ ការ​បែងចែក​ស្រាល បរិស្ថាន​តែ​ស៊ីភីយូ ក្លូន​សំឡេង​រហ័ស

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ល្អបំផុត​សម្រាប់ & # 160; ៖ Fast lightweight TTS, edge deployment, low-latency applications

សាកល្បង​ដោយ​ឥត​គិត​ថ្លៃ

BarkBark Standard

ម៉ូដែល​អត្ថបទ​ទៅ​អូឌីយ៉ូ​ដែល​មាន​មូលដ្ឋាន​លើ​បម្លែង ដែល​បង្កើត​ការ​និយាយ​ពិត តន្ត្រី និង​បែបផែន​សំឡេង & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

Bark SmallBark Small Standard

កំណែ​ស្រាល​ជាង​របស់ Bark ដែល​មាន​ការ​សន្និដ្ឋាន​លឿន​ជាង និង​ការ​ប្រើ​សតិ​ទាប​ជាង & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Suno · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Tongyi Lab) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

Dia TTSDia TTS Standard

ម៉ូដែល​បង្កើត​ប្រអប់​អ្នក​និយាយ​ច្រើន​ដែល​បង្កើត​ការ​សន្ទនា​ធម្មជាតិ​រវាង​អ្នក​និយាយ & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

Parler TTSParler TTS Standard

ពិពណ៌នា​សំឡេង​ដែល​អ្នក​ចង់​បាន​ជា​ភាសា​ធម្មជាតិ ហើយ Parler បង្កើត​ការ​និយាយ​ដែល​ផ្គូផ្គង & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Hugging Face · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

GLM-TTSGLM-TTS Standard

សម្រេច​អត្រា​កំហុស​តួអក្សរ​ទាប​បំផុត​ក្នុង​ចំណោម​ម៉ូដែល TTS ប្រភព​បើកចំហ & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Zhipu AI · អាជ្ញាបណ្ណ & # 160; ៖ GLM-4 License

សាកល្បង

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS ជាមួយ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ល្អិតល្អន់ និង​ការ​បង្ហាញ​ខ្ពស់ & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Index Team · អាជ្ញាបណ្ណ & # 160; ៖ Bilibili Model License

សាកល្បង

Spark TTSSpark TTS Standard

ក្លូន​សំឡេង TTS ជាមួយ​អារម្មណ៍​ដែល​អាច​ត្រួតពិនិត្យ​បាន និង​រចនាប័ទ្ម​និយាយ​តាម​រយៈ​ការ​ជូនដំណឹង ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ SparkAudio · អាជ្ញាបណ្ណ & # 160; ៖ CC BY-NC-SA 4.0

សាកល្បង

GPT-SoVITSGPT-SoVITS Standard

សំឡេង​ខ្លី​ដែល​បាន​ចម្លង​ TTS ដែល​ចម្លង​សំឡេង​ណាមួយ​ពី​តែ​៥ វិនាទី​នៃ​អូឌីយ៉ូ ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ RVC-Boss · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

OrpheusOrpheus Standard

ម៉ូដែល TTS កម្រិតមនុស្សដែលមានអារម្មណ៍ត្រូវបានបណ្តុះបណ្តាលលើ 100K ម៉ោងនៃទិន្នន័យនិយាយ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Canopy Labs · អាជ្ញាបណ្ណ & # 160; ៖ Llama 3.2 Community

សាកល្បង

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Alibaba (Qwen) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

Chatterbox TurboChatterbox Turbo Standard

Chatterbox រហ័ស​ជាង​មុន​ជាមួយ​នឹង​ការ​រង់ចាំ​ក្រោម 200ms និង​ស្លាក paralinguistic សម្រាប់​ការ​ញញឹម ហៀរ​ក និង​ច្រើន​ទៀត ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Resemble AI · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

Dia 2Dia 2 Standard

ស្ទ្រីម​ដំបូង​ការ​សន្ទនា TTS ជាមួយ​នឹង​ប្រអប់​អ្នក​និយាយ​ច្រើន និង​សញ្ញា​ភាសា​បច្ចេកទេស ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Nari Labs · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

VoxCPMVoxCPM Standard

Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ OpenBMB · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

TADATADA Standard

Zero-ការភាន់ច្រឡំ TTS ជាមួយអត្ថបទ-acoustic ពីរការតម្រឹម, 5x រហ័សជាងអាចប្រៀបធៀបបាន LLM TTS.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Hume AI · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

VibeVoiceVibeVoice Standard

ម៉ូដែល Microsoft សម្រាប់​មាតិកា​អ្នក​និយាយ​ច្រើន​បែបបទ​វែង​ដូច​ជា​ផតខាស់ និង​សៀវភៅ​អូឌីយ៉ូ & # 160; ។

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Microsoft · អាជ្ញាបណ្ណ & # 160; ៖ MIT

សាកល្បង

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

អ្នក​អភិវឌ្ឍន៍ & # 160; ៖ Alibaba (FunAudioLLM) · អាជ្ញាបណ្ណ & # 160; ៖ Apache 2.0

សាកល្បង

ChatterboxChatterbox Premium

state-of-the-art សំឡេង​ក្លែងក្លាយ​ដោយ​គ្មាន​ការ​បាញ់​ដោយ​មាន​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ពី Resemble AI ។

គុណភាព & # 160; ៖

សាកល្បង

Tortoise TTSTortoise TTS Premium

អត្ថបទ​ទៅ​ការ​និយាយ​សំឡេង​ច្រើន​ផ្តោត​លើ​គុណភាព​ជាមួយ​ស្ថាបត្យកម្ម​ត្រឡប់​ទៅ​វិញ​ដោយ​ស្វ័យប្រវត្តិ & # 160; ។

គុណភាព & # 160; ៖

សាកល្បង

StyleTTS 2StyleTTS 2 Premium

អត្ថបទ​ទៅ​ជា​ការ​និយាយ​កម្រិត​មនុស្ស​តាមរយៈ​ការ​ពង្រីក​រចនាប័ទ្ម និង​ការ​បណ្តុះបណ្តាល​ដែល​មាន​ការ​ប្រកួត​ប្រជែង & # 160; ។

គុណភាព & # 160; ៖

សាកល្បង

OpenVoiceOpenVoice Premium

ការ​ក្លូន​សំឡេង​ភ្លាមៗ​ជាមួយ​ការ​ត្រួតពិនិត្យ​ក្រឡា​លើ​រចនាប័ទ្ម អារម្មណ៍ និង​សំឡេង​រំខាន ។

គុណភាព & # 160; ៖

សាកល្បង

Sesame CSMSesame CSM Premium

ម៉ូដែល​ការ​និយាយ​ការ​សន្ទនា​បង្កើត​ប្រអប់​ធម្មតា​ជាមួយ​ពេល​វេលា​សមរម្យ និង​អារម្មណ៍ & # 160; ។

គុណភាព & # 160; ៖

សាកល្បង

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

គុណភាព & # 160; ៖

សាកល្បង

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

គុណភាព & # 160; ៖

សាកល្បង

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ភាសា & # 160; ៖ en, zh, ja, ko, fr, de, it, es

ក្លូន​សំឡេង

GLM-TTSGLM-TTS

សម្រេច​អត្រា​កំហុស​តួអក្សរ​ទាប​បំផុត​ក្នុង​ចំណោម​ម៉ូដែល TTS ប្រភព​បើកចំហ & # 160; ។

ភាសា & # 160; ៖ en, zh

ក្លូន​សំឡេង

IndexTTS-2IndexTTS-2

Zero-shot TTS ជាមួយ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ល្អិតល្អន់ និង​ការ​បង្ហាញ​ខ្ពស់ & # 160; ។

ភាសា & # 160; ៖ en, zh

ក្លូន​សំឡេង

Spark TTSSpark TTS

ក្លូន​សំឡេង TTS ជាមួយ​អារម្មណ៍​ដែល​អាច​ត្រួតពិនិត្យ​បាន និង​រចនាប័ទ្ម​និយាយ​តាម​រយៈ​ការ​ជូនដំណឹង ។

ភាសា & # 160; ៖ en, zh

ក្លូន​សំឡេង

GPT-SoVITSGPT-SoVITS

សំឡេង​ខ្លី​ដែល​បាន​ចម្លង​ TTS ដែល​ចម្លង​សំឡេង​ណាមួយ​ពី​តែ​៥ វិនាទី​នៃ​អូឌីយ៉ូ ។

ភាសា & # 160; ៖ en, zh, ja, ko

ក្លូន​សំឡេង

ChatterboxChatterbox

state-of-the-art សំឡេង​ក្លែងក្លាយ​ដោយ​គ្មាន​ការ​បាញ់​ដោយ​មាន​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ពី Resemble AI ។

ភាសា & # 160; ៖ en

ក្លូន​សំឡេង

Tortoise TTSTortoise TTS

អត្ថបទ​ទៅ​ការ​និយាយ​សំឡេង​ច្រើន​ផ្តោត​លើ​គុណភាព​ជាមួយ​ស្ថាបត្យកម្ម​ត្រឡប់​ទៅ​វិញ​ដោយ​ស្វ័យប្រវត្តិ & # 160; ។

ភាសា & # 160; ៖ en

ក្លូន​សំឡេង

OpenVoiceOpenVoice

ការ​ក្លូន​សំឡេង​ភ្លាមៗ​ជាមួយ​ការ​ត្រួតពិនិត្យ​ក្រឡា​លើ​រចនាប័ទ្ម អារម្មណ៍ និង​សំឡេង​រំខាន ។

ភាសា & # 160; ៖ en, zh, ja, ko, fr, de, es, it

ក្លូន​សំឡេង

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text ។

ភាសា & # 160; ៖ en, zh, ja, ko, de, fr, ru, pt, es, it

ក្លូន​សំឡេង

Chatterbox TurboChatterbox Turbo

Chatterbox រហ័ស​ជាង​មុន​ជាមួយ​នឹង​ការ​រង់ចាំ​ក្រោម 200ms និង​ស្លាក paralinguistic សម្រាប់​ការ​ញញឹម ហៀរ​ក និង​ច្រើន​ទៀត ។

ភាសា & # 160; ៖ en

ក្លូន​សំឡេង

VoxCPMVoxCPM

Tokenizer- ឥតគិតថ្លៃ TTS ផលិត 44. 1kHz អូឌីយ៉ូ ជាមួយ បរិបទ- ដឹង មាត្រា ភាព ឆបគ្នា.

ភាសា & # 160; ៖ en, zh

ក្លូន​សំឡេង

OuteTTSOuteTTS

LLM-based TTS ដែលរត់នៅលើ CPU, GPU, ឬកម្មវិធីរុករកតាមរយៈ llama.cpp និង Transformers.js ។

ភាសា & # 160; ៖ en

ក្លូន​សំឡេង

Pocket TTSPocket TTS

ម៉ូដែលប៉ារ៉ាម៉ែត្រ 100M ស្រាលដោយ Kyutai ជាមួយការចម្លងសំឡេងពីគំរូតែមួយ។

ភាសា & # 160; ៖ en, fr

ក្លូន​សំឡេង

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ភាសា & # 160; ៖ en, zh, ja, ko, de, es, fr, it, ru

ក្លូន​សំឡេង

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ភាសា & # 160; ៖ en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

ក្លូន​សំឡេង

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ភាសា & # 160; ៖ en, zh

ក្លូន​សំឡេង

API ដំបូង​របស់​អ្នក​អភិវឌ្ឍន៍

REST API ឆបគ្នាជាមួយ OpenAI ។ ចំណុចបញ្ចប់មួយ ម៉ូដែល 22 + ។ ការគាំទ្រស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត ។

  • ទ្រង់ទ្រាយ​ឆបគ្នា​ជាមួយ OpenAI
  • ស្ទ្រីម TTS សម្រាប់​កម្មវិធី​ពេលវេលា​ពិត
  • ការ​ដំណើរការ​បាច់​សម្រាប់​ការងារ​ធំៗ
  • ការ​ជូនដំណឹង Webhook
មើល​ឯកសារ API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

តម្លៃ​ធម្មតា​ថ្លា

ចាប់ផ្ដើម​ដោយ​ឥត​គិត​ថ្លៃ & # 160; ។ ធ្វើ​មាត្រដ្ឋាន​តាម​ដែល​អ្នក​រីកចម្រើន & # 160; ។

ទំនេរ

$0

១៥ ក្រេឌីត

  • Kokoro, Piper, VITS, MeloTTS
  • ដែន​កំណត់​តួអក្សរ ៥០០
  • 3 មេកាបៃ/ ម៉ោង (គ្មានគណនី)
ចុះឈ្មោះដោយឥតគិតថ្លៃ

កម្មវិធី​ចាប់ផ្ដើម

$9/​ខែ

500 ក្រេឌីត / ខែ

  • ម៉ូដែល 22+ ទាំងអស់
  • 100, 000 តួអក្សរ​ក្នុង​មួយ​ជំនាន់
  • ការ​ក្លូន​សំឡេង
ចាប់ផ្ដើម
ពេញនិយម​បំផុត

ជំនាញ

$29/​ខែ

2,000 ក្រេឌីត / ខែ

  • ទាំងអស់​នៅ​ក្នុង​កម្មវិធី​ចាប់ផ្ដើម
  • ការ​ចូលដំណើរការ API
  • ដំណើរការ​អាទិភាព
ទទួលបាន​ជំនាញ

អាជីវកម្ម

$99/​ខែ

10,000 ក្រេឌីត / ខែ

  • អ្វីៗ​ទាំងអស់​នៅ​ក្នុង Pro
  • API ច្រើន
  • ជួរ​អាទិភាព
យក​អាជីវកម្ម

មើល​ផែនការ​ទាំងអស់​រួម​ទាំង​កញ្ចប់​តួអក្សរ →

សំណួរ​ដែល​សួរ​ញឹកញាប់

TTS.ai គឺជាវេទិកាសំឡេង AI ទូលំទូលាយបំផុតដែលផ្តល់ជូននូវម៉ូដែលអត្ថបទទៅជាសំឡេង 22+ ការចម្លងសំឡេង ការនិយាយទៅជាអត្ថបទ និងឧបករណ៍អូឌីយ៉ូ។ ម៉ូដែលទាំងអស់គឺមានប្រភពបើកចំហដោយគ្មានការចាក់សោក្រុមហ៊ុនលក់។

TTS.ai ផ្តល់ជូនអត្ថបទទៅជាសំឡេងដោយឥតគិតថ្លៃជាមួយម៉ូដែល Kokoro, Piper, VITS និង MeloTTS ។ គ្មានគណនីចាំបាច់។ ចុះឈ្មោះដើម្បីទទួលបាន 15,000 តួអក្សរដោយឥតគិតថ្លៃនិងចូលដំណើរការម៉ូដែលទាំងអស់។ ផែនការដែលបានបង់ចាប់ផ្តើមនៅ $9 / ខែ។

សម្រាប់​ល្បឿន ប្រើ Kokoro ឬ Piper ។ សម្រាប់​គុណភាព ព្យាយាម CosyVoice2ឬ StyleTTS2។ សម្រាប់​ក្លូន​សំឡេង ប្រើ Chatterbox ឬ GPT- SoVITS ។ សម្រាប់​ប្រអប់ ប្រើ Dia TTS ។ ព្យាយាម​ម៉ូដែល​ច្រើន​លើ​អត្ថបទ​ដូចគ្នា​ដើម្បី​ប្រៀបធៀប ។

បាទ។ OpenAI-ឆបគ្នា REST API សម្រាប់ TTS, STT, ក្លូនសំឡេងនិងឧបករណ៍អូឌីយ៉ូ។ មាននៅលើគម្រោង Pro ($29 / mo) និង Enterprise ($99 / mo) ។ មើលឯកសារនៅ tts.ai/api/ ។

គុណភាព​សំឡេង​ប្រែប្រួល​ទៅ​តាម​ម៉ូដែល ។ ម៉ូដែល​ពិសេស​ដូចជា CosyVoice 2, StyleTTS 2, និង Chatterbox ផលិត​ការ​និយាយ​ដែល​មាន​គុណភាព​ជិត​មនុស្ស​ជាមួយ​នឹង​ការ​បញ្ចេញ​សំឡេង និង​អារម្មណ៍​ធម្មជាតិ ។ ម៉ូដែល​ឥត​គិត​ថ្លៃ​ដូចជា Kokoro ផ្តល់ជូន​គុណភាព​ល្អ​សម្រាប់​ករណី​ប្រើ​ច្រើន​បំផុត ។

TTS.ai គាំទ្រ 30+ ភាសានៅទូទាំងបណ្ណាល័យគំរូរបស់ខ្លួន។ ភាសាអង់គ្លេសមានការគាំទ្រគំរូទូលំទូលាយបំផុតប៉ុន្តែគំរូដូចជា CosyVoice2គ្របដណ្តប់ចិនជប៉ុននិងកូរ៉េ; GPT-SoVITS គ្រប់គ្រងចិនជប៉ុនកូរ៉េនិងអង់គ្លេស; និង MeloTTS គាំទ្រភាសាអង់គ្លេសអេស្ប៉ាញបារាំងចិនជប៉ុននិងកូរ៉េ។

បាទ/ ចាស ។ ការ​ដំណើរការ​ទាំងអស់​កើតឡើង​លើ​ម៉ាស៊ីន​បម្រើ GPU ដែលបាន​បម្រុងទុក​របស់​យើង ។ យើង​មិន​រក្សាទុក​ការ​បញ្ចូល​អត្ថបទ​របស់​អ្នក ឬ​អូឌីយ៉ូ​ដែល​បាន​បង្កើត​បន្ទាប់​ពី​ការ​ផ្ដល់​ជូន​ឡើយ ។ គំរូ​សំឡេង​ដែល​បាន​ផ្ទុក​ឡើង​សម្រាប់​ក្លូន​ត្រូវបាន​ប្រើ​តែ​សម្រាប់​សម័យ​បច្ចុប្បន្ន​ប៉ុណ្ណោះ ហើយ​មិន​ត្រូវ​បាន​រក្សាទុក​ឡើយ ។ យើង​មិន​ដែល​ចែករំលែក​ទិន្នន័យ​របស់​អ្នក​ជាមួយ​ភាគី​ទីបី​ឡើយ ឬ​ប្រើ​វា​ដើម្បី​ហ្វឹកហាត់​ម៉ូដែល ។

បាទ / ចាស។ អូឌីយ៉ូទាំងអស់ដែលបង្កើតឡើងនៅលើ TTS.ai គឺជារបស់អ្នកដើម្បីប្រើជាពាណិជ្ជកម្មរួមទាំងវីដេអូ YouTube ផតខាស់សៀវភៅអូឌីយ៉ូកម្មវិធីការផ្សាយពាណិជ្ជកម្មនិងផលិតផល។ ម៉ូដែលរបស់យើងគឺជាប្រភពបើកចំហក្រោមអាជ្ញាប័ណ្ណអនុញ្ញាត (MIT, Apache 2.0) ។ គ្មានការបង់ពន្ធឬការបញ្ជាក់ដែលត្រូវការទេ។

TTS.ai បង្កើតអូឌីយ៉ូក្នុងទ្រង់ទ្រាយ WAV ដោយលំនាំដើមសម្រាប់គុណភាពអតិបរមា. អ្នកអាចបម្លែងទៅជា MP3, FLAC, OGG, ឬ M4A ដោយប្រើឧបករណ៍បម្លែងអូឌីយ៉ូឥតគិតថ្លៃរបស់យើង. API គាំទ្រការបញ្ជាក់ទ្រង់ទ្រាយលទ្ធផលដែលអ្នកចូលចិត្តដោយផ្ទាល់នៅក្នុងសំណើ.

ផ្ទុក​ឧទាហរណ៍​អូឌីយ៉ូ​ខ្លី (តិច​ជាង​៥ វិនាទី) នៃ​សំឡេង​ដែល​អ្នក​ចង់​ក្លូន បន្ទាប់​មក​វាយ​អត្ថបទ​ណាមួយ​ដើម្បី​បង្កើត​ការ​និយាយ​ក្នុង​សំឡេង​នោះ & # 160; ។ ម៉ូដែល​ដូចជា Chatterbox GPT- SoVITS និង CosyVoice2គាំទ្រ​ការ​ក្លូន​សំឡេង & # 160; ។ សំឡេង​ដែល​បាន​ក្លូន​ចាប់​យក​សំឡេង វណ្ណយុត្ត និង​រចនាប័ទ្ម​និយាយ & # 160; ។

ម៉ូដែលឥតគិតថ្លៃ (Kokoro, Piper, VITS, MeloTTS) មិន ត្រូវការ គណនី និង ចំណាយ តួអក្សរ សូន្យ ។ ម៉ូដែលស្តង់ដារ (2,000 តួអក្សរ / 1K បញ្ចូល) រួមមាន Bark, CosyVoice2, F5-TTS, និង Dia ។ ម៉ូដែលប្រាក់រង្វាន់ (4,000 តួអក្សរ / 1K បញ្ចូល) រួមមាន OpenVoice, Chatterbox, StyleTTS2, និង Tortoise ។ ម៉ូដែលដែលបង់ប្រាក់ជាទូទៅផ្តល់ជូននូវគុណភាពខ្ពស់ជាងមុន សំឡេងច្រើន និង លក្ខណៈពិសេសបន្ថែមដូចជាការចម្លងសំឡេង ។

បាទ / ចាស. API គាំទ្រការដំណើរការ batch សម្រាប់បម្លែងបរិមាណធំនៃអត្ថបទទៅជាសំឡេង. ដាក់ស្នើសំណើច្រើននិងទាញយកលទ្ធផល asynchronously ដោយប្រើការងារ UUIDs. ផែនការសហគ្រាស ($99 / ខែ) រួមបញ្ចូលការចូលដំណើរការជួរអាទិភាពសម្រាប់ដំណើរការ batch រហ័ស. ល្អសម្រាប់ផលិតកម្មសៀវភៅអូឌីយ៉ូ, មាតិកាវគ្គសិក្សានិងគម្រោង voiceover ធំ.
4.1/5 (21)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

ចាប់ផ្ដើម​ប្រើ​សំឡេង AI ថ្ងៃនេះ

ចូលរួមអ្នកបង្កើតអ្នកអភិវឌ្ឍន៍និងអាជីវកម្មដោយប្រើ TTS.ai