តើខ្ញុំអាចទទួលបានសោ API បានយ៉ាងដូចម្តេច?

ចុះឈ្មោះសម្រាប់គណនីឥតគិតថ្លៃ TTS.ai បន្ទាប់មករុករកទៅអេក្រង់គ្រប់គ្រងគណនីរបស់អ្នកហើយចុច "បង្កើតសោ API" ។ សោរបស់អ្នកនឹងត្រូវបានដាក់បុព្វបទជាមួយ sk-tts- ហើយអាចត្រូវបានប្រើភ្លាមៗ។ គណនីឥតគិតថ្លៃទទួលបានតួអក្សរ 15,000 ដើម្បីចាប់ផ្តើម។

តើ API ឆបគ្នាជាមួយទ្រង់ទ្រាយរបស់ OpenAI ទេ ?

បាទ, API របស់យើងតាមសំណើ OpenAI-ឆបគ្នានិងទ្រង់ទ្រាយឆ្លើយតប. ប្រសិនបើអ្នកមានកូដដែលមានស្រាប់ដែលប្រើ TTS API របស់ OpenAI, អ្នកអាចប្តូរទៅ TTS.ai ដោយផ្លាស់ប្តូរមូលដ្ឋាន URL និងសោ API ជាមួយនឹងការផ្លាស់ប្តូរកូដអប្បបរមា.

តើភាសាកម្មវិធីអ្វីដែលត្រូវបានគាំទ្រ ?

REST API ធ្វើការជាមួយភាសាណាមួយដែលអាចធ្វើឱ្យសំណើ HTTP ។ យើងផ្តល់ជូននូវឧទាហរណ៍កូដនៅក្នុង Python, JavaScript (Node.js និងកម្មវិធីរុករក), cURL និងច្រើនទៀត។ ភាសាណាមួយដែលមានបណ្ណាល័យម៉ាស៊ីនភ្ញៀវ HTTP (Go, Ruby, Java, C #, PHP, ល) អាចប្រើ API ។

តើអ្វីទៅជាដែនកំណត់អត្រា API?

គណនីឥតគិតថ្លៃត្រូវបានកំណត់ទៅ3សំណើក្នុងមួយម៉ោង។ ផែនការដែលបង់ប្រាក់មានដែនកំណត់ខ្ពស់ជាងនេះផ្អែកលើកម្រិតការជាវប្រចាំរបស់អ្នក: ចាប់ផ្តើម (60 / ម៉ោង), វិជ្ជាជីវៈ (300 / ម៉ោង), សហគ្រាស (គ្មានដែនកំណត់) ។ បឋមកថាដែនកំណត់អត្រាត្រូវបានរួមបញ្ចូលនៅក្នុងការឆ្លើយតប API ទាំងអស់។

តើ API ធ្វើការយ៉ាងដូចម្តេច?

ការប្រើ API ប្រើប្រាស់តួអក្សរផ្អែកលើកម្រិតម៉ូដែលនិងប្រវែងអត្ថបទ។ ម៉ូដែលឥតគិតថ្លៃប្រើ0តួអក្សរម៉ូដែលស្តង់ដារប្រើតួអក្សរ 2x និងម៉ូដែលប្រាក់រង្វាន់ប្រើតួអក្សរ 4x ។ តួអក្សរត្រូវបានរួមបញ្ចូលក្នុងផែនការបង់ប្រាក់ទាំងអស់ហើយក៏អាចត្រូវបានទិញដោយឡែកផងដែរជាកញ្ចប់តួអក្សរ។

តើចំណុចបញ្ចប់អ្វីដែលអាចប្រើបាន ?

API ផ្តល់នូវចំណុចបញ្ចប់សម្រាប់អត្ថបទទៅជាសំឡេង (POST /v1/tts/), សំឡេងទៅជាអត្ថបទ (POST /v1/transcribe/), ការចម្លងសំឡេង (POST /v1/voice-clone/), ការបម្លែងសំឡេង (POST /v1/voice-convert/), ការបកប្រែសំឡេង (POST /v1/speech-translate/), ការពង្រីកអូឌីយ៉ូ (POST /v1/audio-enhance/), ការយកចេញសំឡេង, ការបំបែកដើម, ការវិភាគគ្រាប់ចុចនិង BPM, និងច្រើនទៀត។

តើទ្រង់ទ្រាយអូឌីយ៉ូអ្វីដែល API ត្រឡប់វិញ ?

API ត្រឡប់អូឌីយ៉ូជាទ្រង់ទ្រាយ WAV តាមលំនាំដើម ។ អ្នកអាចបញ្ជាក់ទ្រង់ទ្រាយលទ្ធផល (mp3, wav, ogg, flac) ដោយប្រើប៉ារ៉ាម៉ែត្រ response_ format ។ MP3 ត្រូវបានផ្ដល់អនុសាសន៍សម្រាប់កម្មវិធីបណ្ដាញ WAV សម្រាប់ដំណើរការអូឌីយ៉ូបន្ថែម ។

តើមានស្ទ្រីម API សម្រាប់ TTS ពេលពិតឬទេ ?

បាទ/ ចាស API async របស់យើងត្រឡប់ការងារ UUID ដែលអ្នកអាចសួររកលទ្ធផល ។ សម្រាប់ម៉ូដែលដែលបានគាំទ្រដូចជា Kokoro ការបង្កើតអូឌីយ៉ូគឺលឿនគ្រប់គ្រាន់សម្រាប់កម្មវិធីពេលវេលាពិត ។ ចំណុចបញ្ចប់សួរត្រឡប់ URL អូឌីយ៉ូ ពេលដំណើរការបានបញ្ចប់ ។

តើខ្ញុំដោះស្រាយកំហុសនៅក្នុង API ដោយរបៀបណា?

API ត្រឡប់កូដស្ថានភាព HTTP ស្តង់ដារ (400 សម្រាប់សំណើអាក្រក់ 401 សម្រាប់កំហុសផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវ 429 សម្រាប់ដែនកំណត់អត្រា 500 សម្រាប់កំហុសម៉ាស៊ីនបម្រើ) ជាមួយសារកំហុស JSON ។ តែងតែពិនិត្យមើលកូដស្ថានភាព និងវាលកំហុសក្នុងការឆ្លើយតបសម្រាប់ការដោះស្រាយកំហុសត្រឹមត្រូវ ។

តើខ្ញុំអាចប្រើ API សម្រាប់កម្មវិធីពាណិជ្ជកម្មបានទេ?

បាទ/ ចាស API ត្រូវបានរចនាឡើងសម្រាប់ការប្រើពាណិជ្ជកម្ម ។ អូឌីយ៉ូដែលបានបង្កើតតាមរយៈ API អាចត្រូវបានប្រើក្នុងផលិតផល កម្មវិធី និងសេវារបស់អ្នក ។ ម៉ូដែលទាំងអស់ប្រើអាជ្ញាប័ណ្ណប្រភពបើកចំហ ហើយគ្មានការបង់ពន្ធបន្ថែមលើអូឌីយ៉ូដែលបានបង្កើតឡើយ ។

តើមាន sandbox ឬបរិស្ថានសាកល្បងទេ ?

ម៉ូដែលកម្រិតឥតគិតថ្លៃ (Kokoro, Piper, VITS, MeloTTS) ដើរតួជា sandbox ដ៏ល្អ - ពួកគេប្រើតួអក្សរសូន្យហើយអាចប្រើបានសម្រាប់គណនីទាំងអស់។ សាកល្បងការរួមបញ្ចូលរបស់អ្នកជាមួយម៉ូដែលឥតគិតថ្លៃមុនពេលប្តូរទៅម៉ូដែលប្រាក់រង្វាន់សម្រាប់ការប្រើប្រាស់ផលិតកម្ម។

តើខ្ញុំត្រូវរាយបញ្ជីសំឡេង និងម៉ូដែលដែលអាចប្រើបានតាមរយៈ API ដោយរបៀបណា?

ប្រើ GET / v1 / voices ដើម្បីរាយបញ្ជីសំឡេងដែលមានទាំងអស់ជាមួយនឹងជម្រើសតម្រង (ម៉ូដែល ភាសា ភេទ) ។ ប្រើ GET / v1 / models ដើម្បីរាយបញ្ជីម៉ូដែល TTS ដែលមានទាំងអស់ជាមួយនឹងសមត្ថភាពរបស់ពួកគេ និងព័ត៌មានថ្នាក់ ។ ចំណុចបញ្ចប់ទាំងពីរត្រឡប់ការឆ្លើយតប JSON ។

រាយការណ៍កំហុស / សំណើលក្ខណៈពិសេស

ឯកសារ API

បញ្ចូល TTS.ai ទៅក្នុងកម្មវិធីរបស់អ្នកជាមួយ REST API របស់យើង។ ទ្រង់ទ្រាយ OpenAI ឆបគ្នាសម្រាប់ការផ្លាស់ប្តូរងាយស្រួល។

REST API ឆបគ្នាជាមួយ OpenAI ការឆ្លើយតប JSON ការគាំទ្រស្ទ្រីម

សេចក្ដីសង្ខេប

TTS.ai API ផ្តល់នូវការចូលដំណើរការកម្មវិធីទៅនឹងលក្ខណៈពិសេសទាំងអស់នៃវេទិកា: អត្ថបទទៅជាសំឡេងសំយោគ, សំឡេងទៅជាអត្ថបទបកប្រែ, ក្លូនសំឡេង, ការពង្រឹងអូឌីយ៉ូនិងច្រើនទៀត។ API ប្រើសន្ធិសញ្ញាស្តង់ដារ REST ជាមួយសំណើ JSON / រាងកាយឆ្លើយតប។

កូនសោ API

យកសោ API របស់អ្នកពី ការកំណត់គណនី. មាននៅលើផែនការ Pro និង Enterprise ។

URL មូលដ្ឋាន

https://api.tts.ai/v1/

ការអនុញ្ញាត

និមិត្តសញ្ញារបស់អ្នកកាន់តាម Authorization បឋមកថា

ការផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវ

កម្រិតឥតគិតថ្លៃ — មិនត្រូវការសោទេ ។ ប្រកាសអនាមិកទៅ /v1/tts/ ធ្វើការដោយគ្មានការអនុញ្ញាតណាមួយឡើយ, រហូតដល់ទៅ 5,000 តួអក្សរ / ថ្ងៃក្នុងមួយ IP, ដោយប្រើម៉ូដែលឥតគិតថ្លៃណាមួយរបស់យើង (piper, vits, melotts, kokoro). ចុះឈ្មោះសម្រាប់គណនីឥតគិតថ្លៃដើម្បីទទួលបាន 15,000 តួអក្សរប្រាក់រង្វាន់និងចូលដំណើរការទៅម៉ូដែលប្រាក់រង្វាន់.

សម្រាប់ម៉ូដែលប្រាក់រង្វាន់និងដែនកំណត់អត្រាខ្ពស់, ផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវជាមួយតួអក្សរ Bearer នៅក្នុង Authorization បឋមកថា.

បឋមកថា HTTP

Authorization: Bearer sk-tts-your-api-key-here

រក្សាសម្ងាត់សោ API របស់អ្នក ។ កុំចែករំលែកវាក្នុងកូដផ្នែកម៉ាស៊ីនភ្ញៀវ ឃ្លាំងសាធារណៈ ឬកំណត់ហេតុ ។ បង្វិលគ្រាប់ចុចជាទៀងទាត់ពីការកំណត់គណនីរបស់អ្នក ។

SDKs

SDK ផ្លូវការធ្វើឱ្យវាងាយស្រួលក្នុងការរួមបញ្ចូល TTS.ai ទៅក្នុងកម្មវិធីរបស់អ្នក។ ទាំងពីរគឺប្រភពបើកចំហនិងអាចរកបាននៅលើ GitHub ។

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

URL មូលដ្ឋាន

URL មូលដ្ឋាន: https://api.tts.ai/v1/

ចំណុចបញ្ចប់ទាំងអស់គឺទាក់ទងនឹង URL មូលដ្ឋាននេះ ។ ឧទាហរណ៍ ចំណុចបញ្ចប់ TTS គឺ ៖

POST https://api.tts.ai/v1/tts/

អត្រាកំណត់

ដែនកំណត់អត្រា API ប្រែប្រួលដោយផែនការ ៖

ផែនការ	សំណើ/ នាទី	កំពុងរត់	ប្រវែងអត្ថបទអតិបរមា
ឥតគិតថ្លៃ	10	2	៥០០ តួអក្សរ
កម្មវិធីចាប់ផ្ដើម	30	3	1,000,000 តួអក្សរ
ជំនាញ	60	5	1,000,000 តួអក្សរ
សហគ្រាស	300	20	៥០, ០០០ តួអក្សរ

បឋមកថាដែនកំណត់អត្រាត្រូវបានរួមបញ្ចូលក្នុងការឆ្លើយតបនីមួយៗ ៖ X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

តម្លៃឥណទាន

សេវា	តម្លៃ	ឯកតា
TTS (ម៉ូដែលឥតគិតថ្លៃ ៖ Piper, VITS, MeloTTS)	១, ០០០ តួអក្សរ	ក្នុងមួយ ១, ០០០ តួអក្សរ
TTS (គំរូស្តង់ដារ ៖ Kokoro, CosyVoice2ល)	២, ០០០ តួអក្សរ	ក្នុងមួយ ១, ០០០ តួអក្សរ
TTS (ម៉ូដែលពិសេស ៖ Tortoise, Chatterbox, ល)	៤, ០០០ តួអក្សរ	ក្នុងមួយ ១, ០០០ តួអក្សរ
ការនិយាយទៅអត្ថបទ	២, ០០០ តួអក្សរ	ចំនួនអូឌីយ៉ូក្នុងមួយនាទី
ការក្លូនសំឡេង	៤, ០០០ តួអក្សរ	ក្នុងមួយ ១, ០០០ តួអក្សរ
កម្មវិធីប្ដូរសំឡេង	៣, ០០០ តួអក្សរ	ចំនួនអូឌីយ៉ូក្នុងមួយនាទី
ការពង្រឹងអូឌីយ៉ូ	២, ០០០ តួអក្សរ	ចំនួនអូឌីយ៉ូក្នុងមួយនាទី
ការយកចេញសំឡេង / ការបំបែកសំឡេង	3,000-4,000 តួអក្សរ	ចំនួនអូឌីយ៉ូក្នុងមួយនាទី
ការបកប្រែការនិយាយ	៥, ០០០ តួអក្សរ	ចំនួនអូឌីយ៉ូក្នុងមួយនាទី
ជជែកកំសាន្តសំឡេងName	៣, ០០០ តួអក្សរ	ក្នុងមួយវេន
កម្មវិធីរកគ្រាប់ចុច BPM	ឥតគិតថ្លៃ	--
កម្មវិធីបម្លែងអូឌីយ៉ូ	ឥតគិតថ្លៃ	--

អត្ថបទទៅការនិយាយ

POST /v1/tts/

បម្លែងអត្ថបទទៅជាអូឌីយ៉ូនិយាយ ។ ត្រឡប់ឯកសារអូឌីយ៉ូក្នុងទ្រង់ទ្រាយដែលបានស្នើ ។

តួសំណើ

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ត្រូវការ	ការពិពណ៌នា
model	string	គ្មាន	លេខសម្គាល់ម៉ូដែល (ឧទាហរណ៍ `kokoro`, `chatterbox`, `piper`) ។ បើមិនបានបញ្ចូល យើងជ្រើសម៉ូដែលដោយស្វ័យប្រវត្តិដែលគាំទ្រ `language` ដែលបានស្នើសុំ — `kokoro` សម្រាប់ en/ja/zh/ko/fr/de/it/pt/es/hi/ru, `piper` សម្រាប់ភាសាដែលបានគាំទ្រផ្សេងទៀត (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.) ។
text	string	បាទ/ ចាស	អត្ថបទត្រូវបម្លែងទៅជាការនិយាយ ។ កម្រិតសំណើក្នុងមួយសំណើ ៖ ៥០០ តួអក្សរ (អនាមិក) ៥, ០០០ (គណនីឥតគិតថ្លៃ) ១, ០០០, ០០០ (ផែនការបង់ប្រាក់) ។ ធាតុបញ្ចូលវែងត្រូវបានបែងចែកដោយស្វ័យប្រវត្តិនៅខាងម៉ាស៊ីនបម្រើ ។
voice	string	បាទ/ ចាស	លេខសម្គាល់សំឡេង (ប្រើ `/v1/voices/` ដើម្បីរាយសំឡេងដែលមាន)
format	string	គ្មាន	ទ្រង់ទ្រាយលទ្ធផល ៖ `mp3` (លំនាំដើម), `wav`, `flac`, `ogg`
speed	float	គ្មាន	គុណប្រភាគល្បឿននិយាយ ។ លំនាំដើម ៖ < code> 1.0 ។ ជួរ ៖ < code> 0.5 ទៅ < code> 2.0
language	string	គ្មាន	កូដភាសា (ឧទាហរណ៍ `en`, `es`) ។ រកឃើញដោយស្វ័យប្រវត្តិ ប្រសិនបើបានរំលង ។
instructions	string	គ្មាន	ដើរតួជា / ការដឹកជញ្ជូន cues (≤500 តួអក្សរ) ។ ឧ. <កូដ>\
pronunciations	object \| array	គ្មាន	ការបដិសេធការបញ្ចេញសំឡេងតាមសំណើ ។ ទាំង `{\`
stream	boolean	គ្មាន	អនុញ្ញាតការឆ្លើយតបស្ទ្រីម ។ លំនាំដើម ៖ < code> false

សំណើឧទាហរណ៍

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

ស្លាក < say- as > SSML

លេខវេចខ្ចប់, កាលបរិច្ឆេទ, រូបិយប័ណ្ណ, លេខទូរស័ព្ទ, និង acronyms ក្នុង


                    
                        
                            បកប្រែជា បញ្ចូល បាននិយាយជា
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 ខែ ធ្នូ បីរយមួយ, ដប់ប្រាំមួយ ដប់ប្រាំមួយ
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

បកប្រែជា	បញ្ចូល	បាននិយាយជា
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ខែ ធ្នូ បីរយមួយ, ដប់ប្រាំមួយ ដប់ប្រាំមួយ
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                ទ្រង់ទ្រាយកាលបរិច្ឆេទលំនាំដើមទៅ  mdy សម្រាប់ភាសាអង់គ្លេស និង  dmy នៅកន្លែងផ្សេងទៀត បដិសេធជាមួយ  format=\

                
                    
                        ឧទាហរណ៍
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                ការឆ្លើយតប
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                ឧទាហរណ៍ពេញលេញ
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                ការនិយាយទៅអត្ថបទ
                
                    POST /v1/stt/
                
                បម្លែងអូឌីយ៉ូទៅអត្ថបទ ។ គាំទ្រភាសា ៩៩ ជាមួយការរកឃើញដោយស្វ័យប្រវត្តិ ។

                តួសំណើ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                file
                                file
                                បាទ/ ចាស
                                ឯកសារអូឌីយ៉ូ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM) ។ អតិបរមា 100MB ។
                            
                            
                                model
                                string
                                គ្មាន
                                ម៉ូដែល STT ៖  whisper (លំនាំដើម),  faster-whisper,  sensevoice
                            
                            
                                language
                                string
                                គ្មាន
                                កូដភាសា ។ auto សម្រាប់ការរកឃើញដោយស្វ័យប្រវត្តិ (លំនាំដើម) ។
                            
                            
                                timestamps
                                boolean
                                គ្មាន
                                រួមបញ្ចូលត្រាពេលវេលាកម្រិតពាក្យ ។ លំនាំដើម ៖ false
                            
                            
                                diarize
                                boolean
                                គ្មាន
                                អនុញ្ញាតការកំណត់ទិនានុប្បវត្តិអ្នកនិយាយ ។ លំនាំដើម ៖ < code> false
                            
                        
                    
                

                ការឆ្លើយតប
                
                    
                        ការឆ្លើយតប JSON
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                ការក្លូនសំឡេង
                
                    POST /v1/tts/clone/
                
                បង្កើតការនិយាយក្នុងសំឡេងក្លូន ។ ផ្ទុកអូឌីយ៉ូ និងអត្ថបទយោងឡើង ។

                តួសំណើ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                reference_audio
                                file
                                បាទ/ ចាស
                                សំឡេងអូឌីយ៉ូយោង (10-30 វិនាទីដែលបានផ្ដល់អនុសាសន៍) ។ 20MB អតិបរមា ។
                            
                            
                                text
                                string
                                បាទ/ ចាស
                                អត្ថបទដែលត្រូវនិយាយក្នុងសំឡេងក្លូន ។
                            
                            
                                model
                                string
                                គ្មាន
                                ម៉ូដែលក្លូន ៖ chatterbox (លំនាំដើម), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                គ្មាន
                                ទ្រង់ទ្រាយលទ្ធផល ៖ mp3 (លំនាំដើម), wav, flac
                            
                            
                                language
                                string
                                គ្មាន
                                កូដភាសាគោលដៅ ។ ត្រូវតែគាំទ្រដោយម៉ូដែលដែលបានជ្រើស ។
                            
                        
                    
                

                ការឆ្លើយតប
                ត្រឡប់ឯកសារអូឌីយ៉ូជាទិន្នន័យគោលពីរដូចជាចំណុចបញ្ចប់ TTS ។
            

            
            
                កម្មវិធីប្ដូរសំឡេង
                
                    POST /v1/voice-convert/
                
                បម្លែងអូឌីយ៉ូទៅជាសំឡេងផ្សេងទៀត ។ ផ្ទុកអូឌីយ៉ូប្រភពឡើង និងជ្រើសសំឡេងគោលដៅ ។

                តួសំណើ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                file
                                file
                                បាទ/ ចាស
                                ឯកសារអូឌីយ៉ូប្រភព (MP3, WAV, FLAC) ។ អតិបរមា 50MB ។
                            
                            
                                target_voice
                                string
                                បាទ/ ចាស
                                លេខសម្គាល់សំឡេងគោលដៅត្រូវបម្លែងទៅ (ប្រើ /v1/voices/ ដើម្បីរាយសំឡេងដែលមាន)
                            
                            
                                model
                                string
                                គ្មាន
                                ម៉ូដែលបម្លែងសំឡេង ៖ openvoice (លំនាំដើម), knn-vc
                            
                            
                                format
                                string
                                គ្មាន
                                ទ្រង់ទ្រាយលទ្ធផល ៖ wav (លំនាំដើម), mp3, flac
                            
                        
                    
                

                សំណើឧទាហរណ៍
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                ការឆ្លើយតប
                ត្រឡប់ឯកសារអូឌីយ៉ូដែលបានបម្លែងជាទិន្នន័យគោលពីរ ។
            

            
            
                ការបកប្រែការនិយាយ
                
                    POST /v1/speech-translate/
                
                បកប្រែអូឌីយ៉ូដែលបាននិយាយពីភាសាមួយទៅភាសាមួយទៀត ។ រួមបញ្ចូលការនិយាយទៅអត្ថបទ ការបកប្រែ និងអត្ថបទទៅការនិយាយក្នុងការហៅតែមួយ ។

                តួសំណើ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                file
                                file
                                បាទ/ ចាស
                                ឯកសារអូឌីយ៉ូប្រភពក្នុងភាសាដើម ។ អតិបរមា ១០០ មេកាបៃ ។
                            
                            
                                target_language
                                string
                                បាទ/ ចាស
                                កូដភាសាគោលដៅ (ឧ. es, fr, de, ja)
                            
                            
                                voice
                                string
                                គ្មាន
                                សំឡេងសម្រាប់លទ្ធផលបកប្រែ ។ ត្រូវបានជ្រើសដោយស្វ័យប្រវត្តិ ប្រសិនបើបានរំលង ។
                            
                            
                                preserve_voice
                                boolean
                                គ្មាន
                                ព្យាយាមរក្សាលក្ខណៈពិសេសសំឡេងរបស់អ្នកនិយាយដើម ។ លំនាំដើម ៖ < code> false
                            
                        
                    
                

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                និយាយទៅនិយាយ
                
                    POST /v1/speech-to-speech/
                
                បម្លែងរចនាប័ទ្មនិយាយ អារម្មណ៍ ឬការផ្ដល់ខណៈពេលរក្សាមាតិកា ។ មានប្រយោជន៍សម្រាប់លៃតម្រូវសំឡេង ល្បឿន និងភាពបង្ហាញ ។

                តួសំណើ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                file
                                file
                                បាទ/ ចាស
                                ឯកសារអូឌីយ៉ូនិយាយប្រភព ។ អតិបរមា ៥០ មេកាបៃ ។
                            
                            
                                voice
                                string
                                បាទ/ ចាស
                                លេខសម្គាល់សំឡេងគោលដៅសម្រាប់ការនិយាយលទ្ធផល
                            
                            
                                model
                                string
                                គ្មាន
                                ម៉ូដែល ៖ openvoice (លំនាំដើម), chatterbox
                            
                            
                                emotion
                                string
                                គ្មាន
                                អារម្មណ៍គោលដៅ ៖ អព្យាក្រឹត, សប្បាយ, សោក, ខឹង, រំភើប
                            
                            
                                speed
                                float
                                គ្មាន
                                ការលៃតម្រូវល្បឿន ។ លំនាំដើម ៖ < code> 1.0 ។ ជួរ ៖ < code> 0.5 ទៅ < code> 2.0
                            
                        
                    
                

                ការឆ្លើយតប
                ត្រឡប់ឯកសារអូឌីយ៉ូដែលបានបម្លែងជាទិន្នន័យគោលពីរ ។
            

            
            
                ឧបករណ៍អូឌីយ៉ូ
                ចំណុចបញ្ចប់ដំណើរការអូឌីយ៉ូសម្រាប់ការពង្រីក ការយកសំឡេងចេញ ការបំបែកដើម និងច្រើនទៀត ។

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        បង្កើនគុណភាពអូឌីយ៉ូ ៖ denoise បង្កើនភាពច្បាស់ គុណភាពបង្ហាញខ្ពស់ ។
                        
                            
                                
                                    file file ឯកសារអូឌីយ៉ូត្រូវពង្រីក
                                    denoise boolean អនុញ្ញាតការបំបាត់សំឡេងរំខាន (លំនាំដើម ៖ ពិត)
                                    enhance_clarity boolean បង្កើនភាពច្បាស់នៃការនិយាយ (លំនាំដើម ៖ ពិត)
                                    super_resolution boolean ធ្វើមាត្រដ្ឋានគុណភាពអូឌីយ៉ូឡើងវិញ (លំនាំដើម ៖ មិនពិត)
                                    strength integer ១- ៣ (ស្រាល មធ្យម ខ្លាំង) ។ លំនាំដើម ៖ ២
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        បំបែកសំឡេងពីឧបករណ៍ភ្លេង (យកសំឡេងចេញ) ឬបំបែកទៅជាដើម ។
                        
                            
                                
                                    file file ឯកសារអូឌីយ៉ូដែលត្រូវបំបែក
                                    model string demucs (លំនាំដើម) ឬ spleeter
                                    stems integer ចំនួនដើម ៖ ២, ៤, ៥ ឬ ៦ (លំនាំដើម ៖ ២)
                                    format string ទ្រង់ទ្រាយលទ្ធផល ៖ wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        យកសំឡេងរំខាន និងសំឡេងរំខានចេញពីការថតអូឌីយ៉ូ ។
                        
                            
                                
                                    file file ឯកសារអូឌីយ៉ូដែលត្រូវដំណើរការ
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            ទំនេរ
                        
                        វិភាគអូឌីយ៉ូដើម្បីរកឃើញគ្រាប់ចុច BPM និងហត្ថលេខាពេលវេលា ។
                        
                            
                                
                                    file file ឯកសារអូឌីយ៉ូដែលត្រូវវិភាគ
                                
                            
                        
                        
                            ការឆ្លើយតប
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            ទំនេរ
                        
                        បម្លែងអូឌីយ៉ូរវាងទ្រង់ទ្រាយ ។
                        
                            
                                
                                    file file ឯកសារអូឌីយ៉ូដែលត្រូវបម្លែង
                                    format string ទ្រង់ទ្រាយគោលដៅ ៖ mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer អត្រាប៊ីតលទ្ធផលគិតជាគីឡូបៃ ៖ ៦៤, ១២៨, ១៩២, ២៥៦, ៣២០
                                    sample_rate integer អត្រាគំរូ: 22050, 44100, 48000
                                    channels string mono ឬ stereo
                                
                            
                        
                    
                
            

            
            
                ជជែកកំសាន្តសំឡេងName
                
                    POST /v1/voice-chat/
                
                ផ្ញើអូឌីយ៉ូ ឬអត្ថបទ និងទទួលការឆ្លើយតប AI ជាមួយនឹងការនិយាយដែលបានសំយោគ ។

                តួសំណើ (multipart/form-data ឬ JSON)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ត្រូវការ ការពិពណ៌នា
                        
                        
                            
                                audio
                                file
                                គ្មាន*
                                ការបញ្ចូលអូឌីយ៉ូ (ត្រូវការ audio ឬ text)
                            
                            
                                text
                                string
                                គ្មាន*
                                ការបញ្ចូលអត្ថបទ (ត្រូវការ audio ឬ text)
                            
                            
                                voice
                                string
                                គ្មាន
                                សំឡេងសម្រាប់ការឆ្លើយតប AI ។ លំនាំដើម ៖ af_bella
                            
                            
                                tts_model
                                string
                                គ្មាន
                                ម៉ូដែល TTS សម្រាប់ការឆ្លើយតប ។ លំនាំដើម ៖ kokoro
                            
                            
                                system_prompt
                                string
                                គ្មាន
                                សំណួរប្រព័ន្ធផ្ទាល់ខ្លួនសម្រាប់ AI
                            
                            
                                conversation_id
                                string
                                គ្មាន
                                បន្តការសន្ទនាដែលមានស្រាប់
                            
                        
                    
                

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                បាច់ TTS
                
                    POST /v1/tts/batch/
                
                ដាក់ស្នើអត្ថបទច្រើនសម្រាប់ការបង្កើត TTS ប៉ារ៉ាឡែល ។ ទទួលការហៅត្រឡប់ webhook នៅពេលការងារទាំងអស់បានបញ្ចប់ ។

                ប៉ារ៉ាម៉ែត្រ
                
                    ប៉ារ៉ាម៉ែត្រ ប្រភេទ សេចក្ដីពិពណ៌នា
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string URL ជម្រើសដើម្បីបង្ហាញលទ្ធផល POST ពេលបាច់បញ្ចប់ ។
                    
                

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                វឌ្ឍនភាពនៃការស្ទង់មតិជាមួយ GET /v1/tts/batch/result/?batch_id=abc123
            

            
            
                ការបង្កប់សំឡេង
                
                    POST /v1/voice-embed/
                
                គណនាជាមុនការបង្កប់សំឡេងពីអូឌីយ៉ូយោង ។ ប្រើ embed_ id ដែលបានត្រឡប់ក្នុងសំណើក្លូនសំឡេងបន្ទាប់សម្រាប់ការបង្កើតឆាប់ៗ ។

                ប៉ារ៉ាម៉ែត្រ
                
                    ប៉ារ៉ាម៉ែត្រ ប្រភេទ សេចក្ដីពិពណ៌នា
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                ពិនិត្យមើលសុខភាព
                
                    GET /v1/health/
                
                ពិនិត្យមើលស្ថានភាពម៉ាស៊ីនបម្រើ GPU ម៉ូដែលដែលបានផ្ទុក និងទំហំជួរ ។ មិនចាំបាច់ផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវទេ ។ បានដាក់ឃ្លាំងសម្ងាត់សម្រាប់ ៣០ វិនាទី ។

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                បញ្ជីម៉ូដែល
                
                    GET /v1/models/
                
                ត្រឡប់បញ្ជីនៃម៉ូដែលដែលមានទាំងអស់ជាមួយនឹងសមត្ថភាពរបស់ពួកវា ។

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                បញ្ជីសំឡេង
                
                    GET /v1/voices/
                
                ត្រឡប់បញ្ជីនៃសំឡេងដែលមានទាំងអស់ ដែលបានត្រងតាមម៉ូដែល ឬភាសា ។

                ប៉ារ៉ាម៉ែត្រសំណួរ
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ប្រភេទ ការពិពណ៌នា
                        
                        
                            
                                model
                                string
                                តម្រងតាមលេខសម្គាល់ម៉ូដែល (ឧ. kokoro)
                            
                            
                                language
                                string
                                តម្រងតាមកូដភាសា (ឧ. en)
                            
                            
                                gender
                                string
                                តម្រងតាមភេទ ៖ ប្រុស, ស្រី, អព្យាក្រឹត
                            
                        
                    
                

                ការឆ្លើយតប
                
                    ការឆ្លើយតប JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                ចំណងជើងរង (SRT / VTT) ថ្មី
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                បង្កើតចំណងជើងរងដែលបានធ្វើសមកាលកម្មសម្រាប់ការងារ TTS ដែលបានបញ្ចប់ណាមួយ ។ រត់ការតម្រឹម Whisper លើអូឌីយ៉ូ និងត្រឡប់ SRT ឬ WebVTT ។ លទ្ធផលត្រូវបានឃ្លាំងសម្ងាត់លើថាស ដូច្នេះការហៅលើកទីពីរសម្រាប់ uuid ដូចគ្នាគឺជាការអានថាស ។
                ប៉ារ៉ាម៉ែត្រសំណួរ
                
                    
                        ប៉ារ៉ាម៉ែត្រ ត្រូវការ ការពិពណ៌នា
                        
                            uuid បាទ/ ចាស UUID ការងារត្រឡប់ដោយ / v1/ tts / ឬ / v1/ voice- clone / ។
                            format គ្មាន srt (លំនាំដើម) ឬ vtt ។
                            download គ្មាន 1 ដើម្បីផ្ញើ Content- Disposition: attachment ដូច្នេះកម្មវិធីរុករករក្សាទុកជំនួសឲ្យបង្ហាញ ។
                            language គ្មាន ព័ត៌មានជំនួយសម្រាប់ម៉ូដែលតម្រឹម (រកឃើញដោយស្វ័យប្រវត្តិបើបានរំលង) ។
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                វចនានុក្រមការបញ្ចេញសំឡេង ថ្មី
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                ប្រាប់ម៉ាស៊ីន TTS អំពីរបៀបបញ្ចេញសំឡេងពាក្យជាក់លាក់ ។ ធាតុដែលបានរក្សាទុកអនុវត្តដោយស្វ័យប្រវត្តិទៅសំណើ TTS ទាំងអស់ដែលអ្នកធ្វើ ។ កំណត់ចំនួនធាតុក្នុងមួយគណនីចំនួន 200 ។
                តួសំណើ (POST)
                
                    
                        ប៉ារ៉ាម៉ែត្រ ប្រភេទ ការពិពណ៌នា
                        
                            word string ពាក្យដែលត្រូវបដិសេធ (ឧ. GIF, Anthropic) ។ ព្រំដែនពាក្យផ្គូផ្គង ។
                            replacement string របៀប spell វាសម្រាប់ម៉ូដែល (ឧទាហរណ៍ jiff, ann THROP ick) ។
                            language string កូដ ISO ជម្រើស ។ ទទេ = អនុវត្តទៅភាសាទាំងអស់ ។
                            case_sensitive boolean លំនាំដើម false ។ ផ្គូផ្គងតួអក្សរតូចធំនៅពេលដែល true ។
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                អ្នកក៏អាចផ្ញើការបដិសេធសំណើដោយមិនរក្សាទុកពួកគេដែរ — រួមបញ្ចូល pronunciations លើការហៅ /v1/tts/ ណាមួយជាវត្ថុ ឬជាអារេ (មើលប៉ារ៉ាម៉ែត្រចំណុចបញ្ចប់ TTS) ។
            

            
            
                កម្មវិធីនិយាយអត្ថបទ ថ្មី
                ទម្លាក់តែមួយ

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ត្រូវការ	ការពិពណ៌នា
file	file	បាទ/ ចាស	ឯកសារអូឌីយ៉ូ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM) ។ អតិបរមា 100MB ។
model	string	គ្មាន	ម៉ូដែល STT ៖ `whisper` (លំនាំដើម), `faster-whisper`, `sensevoice`
language	string	គ្មាន	កូដភាសា ។ `auto` សម្រាប់ការរកឃើញដោយស្វ័យប្រវត្តិ (លំនាំដើម) ។
timestamps	boolean	គ្មាន	រួមបញ្ចូលត្រាពេលវេលាកម្រិតពាក្យ ។ លំនាំដើម ៖ `false`
diarize	boolean	គ្មាន	អនុញ្ញាតការកំណត់ទិនានុប្បវត្តិអ្នកនិយាយ ។ លំនាំដើម ៖ < code> false

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ត្រូវការ	ការពិពណ៌នា
reference_audio	file	បាទ/ ចាស	សំឡេងអូឌីយ៉ូយោង (10-30 វិនាទីដែលបានផ្ដល់អនុសាសន៍) ។ 20MB អតិបរមា ។
text	string	បាទ/ ចាស	អត្ថបទដែលត្រូវនិយាយក្នុងសំឡេងក្លូន ។
model	string	គ្មាន	ម៉ូដែលក្លូន ៖ `chatterbox` (លំនាំដើម), `cosyvoice2`, `gpt-sovits`
format	string	គ្មាន	ទ្រង់ទ្រាយលទ្ធផល ៖ `mp3` (លំនាំដើម), `wav`, `flac`
language	string	គ្មាន	កូដភាសាគោលដៅ ។ ត្រូវតែគាំទ្រដោយម៉ូដែលដែលបានជ្រើស ។

file file	ឯកសារអូឌីយ៉ូត្រូវពង្រីក
denoise boolean	អនុញ្ញាតការបំបាត់សំឡេងរំខាន (លំនាំដើម ៖ ពិត)
enhance_clarity boolean	បង្កើនភាពច្បាស់នៃការនិយាយ (លំនាំដើម ៖ ពិត)
super_resolution boolean	ធ្វើមាត្រដ្ឋានគុណភាពអូឌីយ៉ូឡើងវិញ (លំនាំដើម ៖ មិនពិត)
strength integer	១- ៣ (ស្រាល មធ្យម ខ្លាំង) ។ លំនាំដើម ៖ ២

file file	ឯកសារអូឌីយ៉ូដែលត្រូវបំបែក
model string	`demucs` (លំនាំដើម) ឬ `spleeter`
stems integer	ចំនួនដើម ៖ ២, ៤, ៥ ឬ ៦ (លំនាំដើម ៖ ២)
format string	ទ្រង់ទ្រាយលទ្ធផល ៖ `wav`, `mp3`, `flac`

file file	ឯកសារអូឌីយ៉ូដែលត្រូវដំណើរការ
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	ឯកសារអូឌីយ៉ូដែលត្រូវបម្លែង
format string	ទ្រង់ទ្រាយគោលដៅ ៖ `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	អត្រាប៊ីតលទ្ធផលគិតជាគីឡូបៃ ៖ ៦៤, ១២៨, ១៩២, ២៥៦, ៣២០
sample_rate integer	អត្រាគំរូ: 22050, 44100, 48000
channels string	`mono` ឬ `stereo`

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ត្រូវការ	ការពិពណ៌នា
audio	file	គ្មាន*	ការបញ្ចូលអូឌីយ៉ូ (ត្រូវការ `audio` ឬ `text`)
text	string	គ្មាន*	ការបញ្ចូលអត្ថបទ (ត្រូវការ `audio` ឬ `text`)
voice	string	គ្មាន	សំឡេងសម្រាប់ការឆ្លើយតប AI ។ លំនាំដើម ៖ `af_bella`
tts_model	string	គ្មាន	ម៉ូដែល TTS សម្រាប់ការឆ្លើយតប ។ លំនាំដើម ៖ `kokoro`
system_prompt	string	គ្មាន	សំណួរប្រព័ន្ធផ្ទាល់ខ្លួនសម្រាប់ AI
conversation_id	string	គ្មាន	បន្តការសន្ទនាដែលមានស្រាប់

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	សេចក្ដីពិពណ៌នា
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	URL ជម្រើសដើម្បីបង្ហាញលទ្ធផល POST ពេលបាច់បញ្ចប់ ។

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	សេចក្ដីពិពណ៌នា
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ការពិពណ៌នា
model	string	តម្រងតាមលេខសម្គាល់ម៉ូដែល (ឧ. `kokoro`)
language	string	តម្រងតាមកូដភាសា (ឧ. `en`)
gender	string	តម្រងតាមភេទ ៖ `ប្រុស`, `ស្រី`, `អព្យាក្រឹត`

ប៉ារ៉ាម៉ែត្រ	ត្រូវការ	ការពិពណ៌នា
uuid	បាទ/ ចាស	UUID ការងារត្រឡប់ដោយ / v1/ tts / ឬ / v1/ voice- clone / ។
format	គ្មាន	`srt` (លំនាំដើម) ឬ `vtt` ។
download	គ្មាន	`1` ដើម្បីផ្ញើ `Content- Disposition: attachment` ដូច្នេះកម្មវិធីរុករករក្សាទុកជំនួសឲ្យបង្ហាញ ។
language	គ្មាន	ព័ត៌មានជំនួយសម្រាប់ម៉ូដែលតម្រឹម (រកឃើញដោយស្វ័យប្រវត្តិបើបានរំលង) ។

ប៉ារ៉ាម៉ែត្រ	ប្រភេទ	ការពិពណ៌នា
word	string	ពាក្យដែលត្រូវបដិសេធ (ឧ. `GIF`, `Anthropic`) ។ ព្រំដែនពាក្យផ្គូផ្គង ។
replacement	string	របៀប spell វាសម្រាប់ម៉ូដែល (ឧទាហរណ៍ `jiff`, `ann THROP ick`) ។
language	string	កូដ ISO ជម្រើស ។ ទទេ = អនុវត្តទៅភាសាទាំងអស់ ។
case_sensitive	boolean	លំនាំដើម `false` ។ ផ្គូផ្គងតួអក្សរតូចធំនៅពេលដែល `true` ។

ឯកសារ API

សេចក្ដី​សង្ខេប

កូនសោ API

URL មូលដ្ឋាន

ការ​អនុញ្ញាត

ការ​ផ្ទៀងផ្ទាត់​ភាព​ត្រឹមត្រូវ

SDKs

Python

JavaScript / Node.js

URL មូលដ្ឋាន

អត្រា​កំណត់

តម្លៃ​ឥណទាន

អត្ថបទ​ទៅ​ការ​និយាយ

តួ​សំណើ

សំណើ​ឧទាហរណ៍

ស្លាក < say- as > SSML

ការ​ឆ្លើយតប

Step 1: Submit request

Step 2: Poll for result

Step 3: Download audio

ឧទាហរណ៍​ពេញលេញ

ការ​និយាយ​ទៅ​អត្ថបទ

តួ​សំណើ (multipart/form-data)

ការ​ឆ្លើយតប

ការ​ក្លូន​សំឡេង

តួ​សំណើ (multipart/form-data)

ការ​ឆ្លើយតប

កម្មវិធី​ប្ដូរ​សំឡេង

តួ​សំណើ (multipart/form-data)

សំណើ​ឧទាហរណ៍

ការ​ឆ្លើយតប

ការ​បកប្រែ​ការ​និយាយ

តួ​សំណើ (multipart/form-data)

ការ​ឆ្លើយតប

និយាយ​ទៅ​និយាយ

តួ​សំណើ (multipart/form-data)

ការ​ឆ្លើយតប

ឧបករណ៍​អូឌីយ៉ូ

ជជែក​កំសាន្ត​សំឡេងName

តួ​សំណើ (multipart/form-data ឬ JSON)

ការ​ឆ្លើយតប

បាច់ TTS

ប៉ារ៉ាម៉ែត្រ

ការ​ឆ្លើយតប

ការ​បង្កប់​សំឡេង

ប៉ារ៉ាម៉ែត្រ

ការ​ឆ្លើយតប

ពិនិត្យ​មើល​សុខភាព

ការ​ឆ្លើយតប

បញ្ជី​ម៉ូដែល

ការ​ឆ្លើយតប

បញ្ជី​សំឡេង

ប៉ារ៉ាម៉ែត្រ​សំណួរ

ការ​ឆ្លើយតប

ចំណង​ជើង​រង (SRT / VTT) ថ្មី

ប៉ារ៉ាម៉ែត្រ​សំណួរ

វចនានុក្រម​ការ​បញ្ចេញ​សំឡេង ថ្មី

តួ​សំណើ (POST)

កម្មវិធី​និយាយ​អត្ថបទ ថ្មី

សេចក្ដីសង្ខេប

ការអនុញ្ញាត

ការផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវ

អត្រាកំណត់

តម្លៃឥណទាន

អត្ថបទទៅការនិយាយ

តួសំណើ

សំណើឧទាហរណ៍

ការឆ្លើយតប

ឧទាហរណ៍ពេញលេញ

ការនិយាយទៅអត្ថបទ

តួសំណើ (multipart/form-data)

ការឆ្លើយតប

ការក្លូនសំឡេង

តួសំណើ (multipart/form-data)

ការឆ្លើយតប

កម្មវិធីប្ដូរសំឡេង

តួសំណើ (multipart/form-data)

សំណើឧទាហរណ៍

ការឆ្លើយតប

ការបកប្រែការនិយាយ

តួសំណើ (multipart/form-data)

ការឆ្លើយតប

និយាយទៅនិយាយ

តួសំណើ (multipart/form-data)

ការឆ្លើយតប

ឧបករណ៍អូឌីយ៉ូ

ជជែកកំសាន្តសំឡេងName

តួសំណើ (multipart/form-data ឬ JSON)

ការឆ្លើយតប

ការឆ្លើយតប

ការបង្កប់សំឡេង

ការឆ្លើយតប

ពិនិត្យមើលសុខភាព

ការឆ្លើយតប

បញ្ជីម៉ូដែល

ការឆ្លើយតប

បញ្ជីសំឡេង

ប៉ារ៉ាម៉ែត្រសំណួរ

ការឆ្លើយតប

ចំណងជើងរង (SRT / VTT) ថ្មី

ប៉ារ៉ាម៉ែត្រសំណួរ

វចនានុក្រមការបញ្ចេញសំឡេង ថ្មី

តួសំណើ (POST)

កម្មវិធីនិយាយអត្ថបទ ថ្មី