ຂ້ອຍຈະໄດ້ຮັບກຸນແຈ API ໄດ້ແນວໃດ?

ລົງທະບຽນບັນຊີ TTS.ai ໂດຍບໍ່ເສຍຄ່າ, ຈາກນັ້ນໄປທີ່ ໜ້າ ຈໍຄວບຄຸມບັນຊີຂອງທ່ານແລະຄລິກໃສ່ "ສ້າງກຸນແຈ API." ກຸນແຈຂອງທ່ານຈະຖືກຕັ້ງຊື່ດ້ວຍ sk-tts- ແລະສາມາດໃຊ້ໄດ້ທັນທີ. ບັນຊີຟຣີໄດ້ຮັບ 15 ຄະແນນເພື່ອເລີ່ມຕົ້ນ.

API ນີ້ແມ່ນເຂົ້າກັນໄດ້ກັບຮູບແບບ OpenAI ບໍ?

ຍິນດີ, API ຂອງພວກເຮົາປະຕິບັດຕາມ OpenAI-ເຂົ້າກັນໄດ້ຄໍາຮ້ອງຂໍແລະຮູບແບບການຕອບສະຫນອງ. ຖ້າຫາກວ່າທ່ານມີໂປຣແກຣມທີ່ໃຊ້ TTS API ຂອງ OpenAI, ທ່ານສາມາດປ່ຽນໄປ TTS.ai ໂດຍການປ່ຽນ URL ພື້ນຖານແລະ API ລະຫັດກັບການປ່ຽນແປງໂປຣແກຣມຢ່າງຫນ້ອຍ.

ພາສາໂປຣແກຣມໃດທີ່ໄດ້ຮັບການສະໜັບສະໜູນ?

REST API ເຮັດວຽກກັບພາສາໃດກໍ່ຕາມທີ່ສາມາດເຮັດໃຫ້ຄໍາຮ້ອງຂໍ HTTP. ພວກເຮົາສະຫນອງຕົວຢ່າງຂອງໂປຣແກຣມໃນ Python, JavaScript (Node.js ແລະຕົວທ່ອງເວັບ), cURL, ແລະອື່ນໆ. ພາສາໃດກໍ່ຕາມທີ່ມີຫ້ອງສະຫມຸດລູກຄ້າ HTTP (ໄປ, Ruby, Java, C #, PHP, ແລະອື່ນໆ) ສາມາດໃຊ້ API.

ຂໍ້ຈໍາກັດອັດຕາ API ແມ່ນຫຍັງ?

ບັນຊີຟຣີມີຂໍ້ ຈຳ ກັດຕໍ່ ຄຳ ຮ້ອງຂໍ3ຕໍ່ຊົ່ວໂມງ. ແຜນທີ່ຈ່າຍມີຂໍ້ ຈຳ ກັດທີ່ສູງຂື້ນອີງຕາມລະດັບການລົງທະບຽນຂອງທ່ານ: Starter (60 / ຊົ່ວໂມງ), Professional (300 / ຊົ່ວໂມງ), Enterprise (ບໍ່ມີຂໍ້ ຈຳ ກັດ).

ວິທີການ API ລາຄາເຮັດວຽກ?

ການໃຊ້ API ບໍລິໂພກຕົວອັກສອນອີງໃສ່ລະດັບແບບແລະຄວາມຍາວຂອງຂໍ້ຄວາມ. ແບບຟອມຟຣີໃຊ້0ຕົວອັກສອນ, ແບບຟອມມາດຕະຖານໃຊ້ຕົວອັກສອນ 2x, ແລະແບບຟອມພິເສດໃຊ້ຕົວອັກສອນ 4x. ຕົວອັກສອນແມ່ນລວມຢູ່ໃນແຜນທີ່ຈ່າຍທັງ ໝົດ ແລະສາມາດຊື້ໄດ້ເປັນແຍກຕ່າງຫາກເປັນແຊ້ມຕົວອັກສອນ.

ມີຈຸດຈົບຫຍັງແດ່?

API ສະຫນອງຈຸດສຸດທ້າຍສໍາລັບຂໍ້ຄວາມ-ເປັນ-ຄໍາເວົ້າ (POST / v1 / tts /), ຄໍາເວົ້າ-ເປັນ-ຂໍ້ຄວາມ (POST / v1 / transcribe /), ສຽງ cloning (POST / v1 / voice-clone /), ການປ່ຽນສຽງ (POST / v1 / voice-convert /), ການແປຄໍາເວົ້າ (POST / v1 / speech-translate /), ການປັບປຸງສຽງ (POST / v1 / audio-enhance /), ການກໍາຈັດສຽງ, stem splitting, ປຸ່ມແລະ BPM ການວິເຄາະ, ແລະອື່ນໆ.

ຮູບແບບສຽງໃດທີ່ API ຈະສົ່ງຄືນ?

API ຈະສົ່ງສຽງຄືນເປັນຮູບແບບ WAV ໂດຍປັບໂປງ. ທ່ານສາມາດກຳນົດຮູບແບບຜົນອອກ (mp3, wav, ogg, flac) ໂດຍໃຊ້ບາຣາແມັດ response_ format. MP3 ແມ່ນແນະນຳໃຫ້ໃຊ້ກັບໂປແກຼມເວບ, WAV ແມ່ນໃຊ້ກັບການປະມວນຜົນສຽງຕື່ມອີກ.

ມີ API ສຳລັບການສົ່ງຕໍ່ສຽງ TTS ໃນເວລາຈິງບໍ?

ແມ່ນແລ້ວ, async API ຂອງພວກເຮົາຈະສົ່ງຄືນ UUID ຂອງວຽກທີ່ທ່ານສາມາດສອບຖາມຜົນໄດ້. ສຳລັບແບບທີ່ໄດ້ຮັບການສະໜັບສະໜູນເຊັ່ນ Kokoro, ການສ້າງສຽງແມ່ນໄວພໍທີ່ຈະໃຊ້ງານໄດ້ໃກ້ກັບເວລາຈິງ. ຈຸດສຸດທ້າຍການສອບຖາມຈະສົ່ງຄືນ URL ຂອງສຽງເມື່ອການປະມວນຜົນໄດ້ສຳເລັດ.

ຂ້ອຍຈະຈັດການກັບຂໍ້ຜິດພາດໃນ API ໄດ້ແນວໃດ?

API ສົ່ງຄືນລະຫັດສະຖານະ HTTP ມາດຕະຖານ (400 ສຳ ລັບ ຄຳ ຮ້ອງຂໍທີ່ບໍ່ດີ, 401 ສຳ ລັບຂໍ້ຜິດພາດໃນການຢັ້ງຢືນ, 429 ສຳ ລັບ ຈຳ ກັດອັດຕາ, 500 ສຳ ລັບຂໍ້ຜິດພາດຂອງເຄື່ອງແມ່ຂ່າຍ) ດ້ວຍການແຈ້ງເຕືອນຂໍ້ຜິດພາດ JSON. ກວດເບິ່ງລະຫັດສະຖານະແລະພື້ນທີ່ຂໍ້ຜິດພາດໃນຄໍາຕອບເພື່ອແກ້ໄຂຂໍ້ຜິດພາດທີ່ຖືກຕ້ອງ.

ຂ້ອຍສາມາດໃຊ້ API ສຳ ລັບແອັບພລິເຄຊັນການຄ້າໄດ້ບໍ?

ແມ່ນແລ້ວ, API ແມ່ນຖືກອອກແບບມາເພື່ອໃຊ້ໃນທາງທຸລະກິດ. ສຽງທີ່ຜະລິດຜ່ານ API ສາມາດໃຊ້ໄດ້ໃນຜະລິດຕະພັນ, កម្មវិធី ແລະ ການບໍລິການຂອງທ່ານ. ແບບທັງ ໝົດ ໃຊ້ໃບອະນຸຍາດ Open Source ແລະ ບໍ່ມີຄ່າໃຊ້ຈ່າຍເພີ່ມເຕີມໃນການສ້າງສຽງ.

ມີ sandbox ຫຼື ສະພາບແວດລ້ອມການທົດລອງບໍ?

ແບບຟອມຟຣີ (Kokoro, Piper, VITS, MeloTTS) ໃຫ້ບໍລິການເປັນ sandbox ທີ່ດີເລີດ - ພວກເຂົາໃຊ້ສະກຸນເງິນສົດແລະມີໃຫ້ກັບບັນຊີທັງ ໝົດ. ທົດສອບການລວມຕົວຂອງທ່ານກັບແບບຟອມຟຣີກ່ອນທີ່ຈະປ່ຽນໄປໃຊ້ແບບຟອມພິເສດ ສຳ ລັບການ ນຳ ໃຊ້ການຜະລິດ.

ຂ້ອຍຈະຈັດລາຍຊື່ສຽງ ແລະ ຕົວແບບທີ່ມີຢູ່ຜ່ານ API ໄດ້ແນວໃດ?

ໃຊ້ GET /v1/voices ເພື່ອຈັດລາຍຊື່ສຽງທີ່ໃຊ້ໄດ້ທັງໝົດພ້ອມກັບຕົວເລືອກການກັ່ນຕອງ (ແບບ, ພາສາ, ເພດ). ໃຊ້ GET /v1/models ເພື່ອຈັດລາຍຊື່ແບບ TTS ທີ່ໃຊ້ໄດ້ທັງໝົດພ້ອມກັບຄວາມສາມາດ ແລະ ຂໍ້ມູນຂັ້ນ. ຈຸດສຸດທ້າຍທັງສອງຈຸດຈະສົ່ງຜົນຕອບຮັບ JSON.

ລາຍງານຂໍ້ຜິດພາດ / ຮ້ອງຂໍຄຸນສົມບັດ

ເອກະສານ API

ລວມເອົາ TTS.ai ເຂົ້າໃນໂປແກຼມຂອງທ່ານດ້ວຍ REST API ຂອງພວກເຮົາ. ຮູບແບບ OpenAI ທີ່ສາມາດເຂົ້າກັນໄດ້ ສຳ ລັບການຍ້າຍງ່າຍ.

REST API ເຂົ້າກັນໄດ້ກັບ OpenAI ການຕອບໂຕ້ JSON ການສະໜັບສະໜູນການຖ່າຍທອດ

ເບິ່ງລວມ

TTS.ai API ສະຫນອງການເຂົ້າເຖິງໂປຣແກມສໍາລັບຄຸນສົມບັດທັງຫມົດຂອງເວທີ: ຂໍ້ຄວາມ-to-ຄໍາເວົ້າ synthesization, ຄໍາເວົ້າ-to-ຂໍ້ຄວາມ transcription, ສຽງ cloning, ການປັບປຸງສຽງ, ແລະອື່ນໆ. API ນໍາໃຊ້ມາດຕະຖານ REST ສົນທິສັນຍາກັບ JSON ຄໍາຮ້ອງສະຫມັກ / ຕອບໂຕ້ຮ່າງກາຍ.

គ្រាប់ចុច API

ເອົາກຸນແຈ API ຂອງທ່ານຈາກ ການຕັ້ງຄ່າບັນຊີ. ມີຢູ່ໃນແຜນ Pro ແລະ Enterprise.

URL ພື້ນຖານ

https://api.tts.ai/v1/

ອະນຸຍາດ

ຕົວແທນຜູ້ຖືຜ່ານ Authorization បឋមកថា

ການផ្ទៀងផ្ទាត់ຄວາມຖືກຕ້ອງ

ລະດັບຟຣີ — ບໍ່ຕ້ອງການໃຊ້ປຸ່ມ ສົ່ງຂໍ້ຄວາມທີ່ບໍ່ມີຊື່ໄປຫາ /v1/tts/ ເຮັດວຽກໂດຍບໍ່ມີການ auth ໃດໆ, ເຖິງ 5,000 ຕົວອັກສອນ / ວັນຕໍ່ IP, ໂດຍໃຊ້ແບບຟອມຟຣີຂອງພວກເຮົາ (piper, vits, melotts, kokoro). ລົງທະບຽນບັນຊີຟຣີເພື່ອໄດ້ຮັບ 15,000 ຕົວອັກສອນໂບນັດແລະເຂົ້າເຖິງແບບພິເສດ.

ສຳ ລັບແບບພິເສດແລະ ຈຳ ກັດອັດຕາທີ່ສູງກວ່າ, ຢັ້ງຢືນດ້ວຍໂຕກັ່ນ Bearer ໃນ Authorization បឋមកថា.

បឋមកថា HTTP

Authorization: Bearer sk-tts-your-api-key-here

ຮັກສາກຸນແຈ API ຂອງທ່ານໄວ້ເປັນຄວາມລັບ. อย่าแบ่งปันมันในโค้ดด้านลูกศิษย์, รีพอร์ตสาธารณะ, หรือบันทึก. หมุนปุ่มเป็นประจำจากการตั้งค่าบัญชีของคุณ.

SDKs

SDKs ທາງການເຮັດໃຫ້ມັນງ່າຍທີ່ຈະລວມເອົາ TTS.ai ເຂົ້າໃນຄໍາຮ້ອງສະຫມັກຂອງທ່ານ. ທັງສອງແມ່ນແຫຼ່ງເປີດແລະມີຢູ່ໃນ GitHub.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

URL ພື້ນຖານ

URL ພື້ນຖານ: https://api.tts.ai/v1/

ຈຸດສຸດທ້າຍທັງໝົດແມ່ນກ່ຽວຂ້ອງກັບ URL ພື້ນຖານນີ້ ຕົວຢ່າງ ຈຸດສຸດທ້າຍ TTS ແມ່ນ:

POST https://api.tts.ai/v1/tts/

ຈໍາກັດອັດຕາ

ຈໍາກັດອັດຕາ API ແຕກຕ່າງກັນໂດຍແຜນ:

ແຜນ	ຄໍາຮ້ອງຂໍ/ນາທີ	ຮ່ວມກັນ	ຄວາມຍາວຂໍ້ຄວາມສູງສຸດ
ບໍ່ມີ	10	2	500 ຕົວອັກສອນ
ຕົວເລີ່ມ	30	3	1,000,000 ຕົວອັກສອນ
ມືອາຊີບ	60	5	1,000,000 ຕົວອັກສອນ
ວິສາຫະກິດ	300	20	50,000 ຕົວອັກສອນ

ຫົວຂໍ້ຈໍາກັດອັດຕາຈະຖືກລວມເຂົ້າໃນການຕອບໂຕ້ທຸກຄັ້ງ: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ຄ່າກູ້ຢືມ

ບໍລິການ	ຄ່າໃຊ້ຈ່າຍ	ឯកតា
TTS (ຕົວແບບຟຣີ: Piper, VITS, MeloTTS)	1,000 ຕົວອັກສອນ	ຕໍ່ 1,000 តួអក្សរ
TTS (ແບບມາດຕະຖານ: Kokoro, CosyVoice 2, ແລະອື່ນໆ)	2,000 ຕົວອັກສອນ	ຕໍ່ 1,000 តួអក្សរ
TTS (ແບບ Premium: Tortoise, Chatterbox, ແລະອື່ນໆ)	4 ຄະແນນ	ຕໍ່ 1,000 តួអក្សរ
ການເວົ້າເປັນຂໍ້ຄວາມName	2,000 ຕົວອັກສອນ	ສຽງຕໍ່ນາທີ
ການກັ່ນຕອງສຽງ	4 ຄະແນນ	ຕໍ່ 1,000 តួអក្សរ
កម្មវិធីປ່ຽນສຽງName	3 ຄະແນນ	ສຽງຕໍ່ນາທີ
ເພີ່ມປະສິດທິພາບສຽງ	2,000 ຕົວອັກສອນ	ສຽງຕໍ່ນາທີ
ເອົາສຽງອອກ / ແບ່ງສຽງອອກ	3,000-4,000 ຕົວອັກສອນ	ສຽງຕໍ່ນາທີ
ການແປຄຳເວົ້າ	5,000 ຕົວອັກສອນ	ສຽງຕໍ່ນາທີ
ການສົນທະນາດ້ວຍສຽງ	3 ຄະແນນ	ຕໍ່ຮອບ
ເຄື່ອງມືຄົ້ນຫາປຸ່ມ & BPM	ບໍ່ມີ	--
កម្មវិធីបម្លែងສຽງ	ບໍ່ມີ	--

ຂໍ້ຄວາມເປັນການເວົ້າName

POST /v1/tts/

ປ່ຽນຂໍ້ຄວາມເປັນສຽງເວົ້າ ។ ສົ່ງຄືນເອກະສານສຽງໃນຮູບແບບທີ່ໄດ້ຮ້ອງຂໍ

ທ້ອງຂອງຄໍາຮ້ອງຂໍ

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ຕ້ອງການ	ການອະທິບາຍ
model	string	ບໍ່	ຕົວລະບຸແບບ (ຕົວຢ່າງ, `kokoro`, `chatterbox`, `piper`). ຖ້າບໍ່ໄດ້ລະບຸ, ພວກເຮົາຈະເລືອກແບບແບບອັດຕະໂນມັດທີ່ສະໜັບສະໜູນ `ພາສາ` ທີ່ໄດ້ຮ້ອງຂໍ — `kokoro` ສຳລັບ en/ja/zh/ko/fr/de/it/pt/es/hi/ru, `piper` ສຳລັບພາສາອື່ນໆທີ່ໄດ້ສະໜັບສະໜູນ (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.).
text	string	ແມ່ນ	ຂໍ້ຄວາມທີ່ຈະປ່ຽນເປັນສຽງ. ສູງສຸດຕໍ່ການຮ້ອງຂໍ: 500 ຕົວອັກສອນ (ບໍ່ລະບຸຊື່), 5,000 (ບັນຊີຟຣີ), 1,000,000 (ແຜນທີ່ຈ່າຍ). ຂໍ້ມູນເຂົ້າທີ່ຍາວກວ່າຈະຖືກແບ່ງອອກເປັນສ່ວນໆໂດຍອັດຕະໂນມັດຢູ່ດ້ານເຊີບເວີ.
voice	string	ແມ່ນ	ລະຫັດສຽງ (ໃຊ້ `/v1/voices/` ເພື່ອລາຍຊື່ສຽງທີ່ມີ)
format	string	ບໍ່	ຮູບແບບຜົນອອກ: `mp3` (ລຸ້ນເດີມ), `wav`, `flac`, `ogg`
speed	float	ບໍ່	ຕົວເພີ່ມຄວາມໄວໃນການເວົ້າ. ຕົວອ້າງອີງ: `1.0`. ລະດັບ: `0.5` ເຖິງ `2.0`
language	string	ບໍ່	ລະຫັດພາສາ (ຕົວຢ່າງ, `en`, `es`). ກວດພົບໂດຍອັດຕະໂນມັດຖ້າບໍ່ໃສ່.
instructions	string	ບໍ່	ປະຕິບັດ / ການສົ່ງຂໍ້ຄວາມ (≤500 ຕົວອັກສອນ). ຕົວຢ່າງ < ລະຫັດ>\
pronunciations	object \| array	ບໍ່	ການເວົ້າຕາມຄໍາຮ້ອງຂໍຈະຖືກບິດເບືອນ. ສອງ `{\`
stream	boolean	ບໍ່	ເປີດການຕອບສະໜອງການຖ່າຍທອດ. ແບບປ້ອນແບບເດີມ: `false`

ຕົວຢ່າງຄໍາຮ້ອງຂໍ

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

ແທັກ SSML

ວາງຕົວເລກ, ມື້, ເງິນຕາ, ຕົວເລກໂທລະສັບ ແລະ ຕົວຫຍໍ້ໄວ້ໃນ


                    
                        
                            បកប្រែ ຂໍ້ມູນເຂົ້າ ເວົ້າຄື
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 ເດືອນທັນວາ
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

បកប្រែ	ຂໍ້ມູນເຂົ້າ	ເວົ້າຄື
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ເດືອນທັນວາ
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                ຮູບແບບວັນກຳນົດໄວ້ເປັນ mdy ສຳລັບພາສາອັງກິດ ແລະ dmy ບ່ອນອື່ນ; ບິດເບືອນດ້ວຍ format=\

                
                    
                        ຕົວຢ່າງ
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                ຕອບໂຕ້
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                ຕົວຢ່າງເຕັມ
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                ການເວົ້າເປັນຂໍ້ຄວາມName
                
                    POST /v1/stt/
                
                ແປສຽງເປັນຂໍ້ຄວາມ. ສະໜັບສະໜູນ 99 ພາສາດ້ວຍການກວດພົບອັດຕະໂນມັດ.

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                file
                                file
                                ແມ່ນ
                                ໄຟລ໌ສຽງ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). ສູງສຸດ 100MB.
                            
                            
                                model
                                string
                                ບໍ່
                                ແບບ STT: whisper (ປັ໊ກເດີມ), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                ບໍ່
                                ລະຫັດພາສາ. auto ສຳລັບການກວດພົບດ້ວຍຕົວເອງ (ລຸ້ນເດີມ).
                            
                            
                                timestamps
                                boolean
                                ບໍ່
                                ລວມເອົາສະຖິຕິເວລາໃນລະດັບຄໍາ. ຕົວອ້າງອີງ: false
                            
                            
                                diarize
                                boolean
                                ບໍ່
                                ເປີດການບັນທຶກລາຍວັນຂອງຜູ້ເວົ້າ. ຕົວອ້າງອີງ: false
                            
                        
                    
                

                ຕອບໂຕ້
                
                    
                        ການຕອບໂຕ້ JSON
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                ການກັ່ນຕອງສຽງ
                
                    POST /v1/tts/clone/
                
                ສ້າງການເວົ້າດ້ວຍສຽງທີ່ໄດ້ຖ່າຍທອດມາແລ້ວ. ອັບໂຫລດຂໍ້ຄວາມ ແລະ ສຽງທີ່ໄດ້ອ້າງອີງມາ.

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                reference_audio
                                file
                                ແມ່ນ
                                ສຽງສຽງທີ່ແນະ ນຳ (ແນະ ນຳ 10-30 ວິນາທີ). ສູງສຸດ 20MB.
                            
                            
                                text
                                string
                                ແມ່ນ
                                ຂໍ້ຄວາມທີ່ຈະເວົ້າໃນສຽງທີ່ສ້າງເປັນຄລີນ
                            
                            
                                model
                                string
                                ບໍ່
                                ແບບຟອມແບບຖ່າຍທອດ: chatterbox (ປັ໊ກໄອເດຍ), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                ບໍ່
                                ຮູບແບບຜົນອອກ: mp3 (ປັ໊ກເດີມ), wav, flac
                            
                            
                                language
                                string
                                ບໍ່
                                ລະຫັດພາສາເປົ້າ ໝາຍ. ຕ້ອງໄດ້ຮັບການສະໜັບສະໜູນໂດຍແບບທີ່ເລືອກໄວ້.
                            
                        
                    
                

                ຕອບໂຕ້
                ສົ່ງຄືນເອກະສານສຽງເປັນຂໍ້ມູນແບບສອງຕົວ, ຄືກັນກັບຈຸດສຸດທ້າຍຂອງ TTS.
            

            
            
                កម្មវិធីປ່ຽນສຽງName
                
                    POST /v1/voice-convert/
                
                ປ່ຽນສຽງໃຫ້ມີສຽງຄືກັນກັບສຽງອື່ນ. ອັບໂຫລດແຫຼ່ງສຽງ ແລະ ເລືອກສຽງເປົ້າໝາຍ.

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                file
                                file
                                ແມ່ນ
                                ໄຟລ໌ສຽງແຫຼ່ງ (MP3, WAV, FLAC). ສູງສຸດ 50MB.
                            
                            
                                target_voice
                                string
                                ແມ່ນ
                                ລະຫັດສຽງເປົ້າໝາຍທີ່ຈະປ່ຽນເປັນ (ໃຊ້ /v1/voices/ ເພື່ອລາຍຊື່ສຽງທີ່ມີ)
                            
                            
                                model
                                string
                                ບໍ່
                                ແບບຟອມການປ່ຽນສຽງ: openvoice (ລຸ້ນເດີມ), knn-vc
                            
                            
                                format
                                string
                                ບໍ່
                                ຮູບແບບຜົນອອກ: wav (ລຸ້ນເດີມ), mp3, flac
                            
                        
                    
                

                ຕົວຢ່າງຄໍາຮ້ອງຂໍ
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                ຕອບໂຕ້
                ສົ່ງຄືນໄຟລສຽງທີ່ໄດ້ປ່ຽນເປັນຂໍ້ມູນແບບສອງຫຼ່ຽມ.
            

            
            
                ການແປຄຳເວົ້າ
                
                    POST /v1/speech-translate/
                
                ແປສຽງທີ່ເວົ້າຈາກພາສາໜຶ່ງໄປເປັນພາສາອື່ນ. ລວມເອົາການເວົ້າ-ເປັນ-ຂໍ້ຄວາມ, ການແປ, ແລະ ຂໍ້ຄວາມ-ເປັນ-ການເວົ້າໃນການໂທດຽວ.

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                file
                                file
                                ແມ່ນ
                                ໄຟລ໌ສຽງຕົ້ນຕໍໃນພາສາຕົ້ນຕໍ. ສູງສຸດ 100MB.
                            
                            
                                target_language
                                string
                                ແມ່ນ
                                ລະຫັດພາສາເປົ້າຫມາຍ (ຕົວຢ່າງ, es, fr, de, ja)
                            
                            
                                voice
                                string
                                ບໍ່
                                ສຽງສຳລັບຜົນອອກແບບແປ. ເລືອກໂດຍອັດຕະໂນມັດ ຖ້າບໍ່ໄດ້ລະບຸ.
                            
                            
                                preserve_voice
                                boolean
                                ບໍ່
                                ພະຍາຍາມຮັກສາຄຸນສົມບັດສຽງຂອງຜູ້ເວົ້າຕົ້ນສະບັບ. ແບບປ້ອນເຂົ້າ: false
                            
                        
                    
                

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                ການເວົ້າເປັນການເວົ້າ
                
                    POST /v1/speech-to-speech/
                
                ປ່ຽນແບບເວົ້າ, ອາລົມ, ຫຼື ການສົ່ງຕໍ່ໃນຂະນະທີ່ຮັກສາເນື້ອໃນໄວ້. ມີຄວາມໃຊ້ໄດ້ສຳລັບການປັບສຽງ, ຄວາມໄວ, ແລະ ຄວາມສະແດງອອກ.

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                file
                                file
                                ແມ່ນ
                                ແຫຼ່ງຂອງໄຟລ໌ສຽງເວົ້າ. ສູງສຸດ 50MB.
                            
                            
                                voice
                                string
                                ແມ່ນ
                                ຕົວລະບຸສຽງເປົ້າໝາຍສຳລັບການເວົ້າຜົນອອກມາ
                            
                            
                                model
                                string
                                ບໍ່
                                ແບບ: openvoice (ປັ໊ກໄອເດຍ), chatterbox
                            
                            
                                emotion
                                string
                                ບໍ່
                                ຄວາມຮູ້ສຶກເປົ້າໝາຍ:  neutral,  happy,  sad,  angry,  excited
                            
                            
                                speed
                                float
                                ບໍ່
                                ການປັບຄວາມໄວ. ແບບປ້ອນເຂົ້າ: 1.0. ລະດັບ: 0.5 ຫາ 2.0
                            
                        
                    
                

                ຕອບໂຕ້
                ສົ່ງຄືນເອກະສານສຽງທີ່ໄດ້ປ່ຽນເປັນຂໍ້ມູນແບບສອງຫຼ່ຽມ.
            

            
            
                ເຄື່ອງມືສຽງName
                ຈຸດຈົບການປະມວນຜົນສຽງເພື່ອເພີ່ມປະສິດທິພາບ, ເອົາສຽງອອກ, ແບ່ງແຍກຕົ້ນໄມ້ ແລະ ອື່ນໆ.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        ເພີ່ມຄຸນນະພາບສຽງ: ຫຼຸດສຽງລົບກວນ, ເພີ່ມຄວາມຈະແຈ້ງ, ຄວາມລະອຽດສູງ.
                        
                            
                                
                                    file file ໄຟລ໌ສຽງທີ່ຈະເພີ່ມ
                                    denoise boolean ເປີດການລົບສິ່ງລົບກວນ (ຕົວອ້າງອີງ: ຖືກ)
                                    enhance_clarity boolean ເພີ່ມຄວາມຊັດເຈນຂອງການເວົ້າ (ລຸ້ນເດີມ: ຖືກ)
                                    super_resolution boolean ຍົກລະດັບຄຸນນະພາບສຽງ (ປັ໊ກເດີມ: ບໍ່ເປັນຈິງ)
                                    strength integer 1-3(ເບົາ, ກາງ, ແຮງ). ແບບປ້ອນກ່ອນ: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        ແບ່ງສຽງຮ້ອງອອກຈາກສຽງດົນຕີ (ເອົາສຽງຮ້ອງອອກ) ຫຼື ແບ່ງອອກເປັນສ່ວນຕົ້ນຕໍ.
                        
                            
                                
                                    file file ໄຟລ໌ສຽງທີ່ຈະແຍກ
                                    model string demucs (លំនាំដើម) ឬ spleeter
                                    stems integer ຈໍານວນຕົ້ນໄມ້: 2, 4,5ຫຼື6(ປ້ອນແບບເດີມ: 2)
                                    format string ຮູບແບບຜົນອອກ: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        ເອົາສຽງກະຈາຍ ແລະ ສຽງຟັງຄືນອອກຈາກການບັນທຶກສຽງ
                        
                            
                                
                                    file file ໄຟລ໌ສຽງທີ່ຈະປະມວນຜົນ
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            ຟຣີ
                        
                        ວິເຄາະສຽງເພື່ອກວດພົບປຸ່ມ, BPM ແລະ ສັນຍາລັກເວລາ
                        
                            
                                
                                    file file ໄຟລ໌ສຽງທີ່ຈະວິເຄາະ
                                
                            
                        
                        
                            ຕອບໂຕ້
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            ຟຣີ
                        
                        ປ່ຽນຮູບແບບສຽງລະຫວ່າງຮູບແບບຕ່າງໆ
                        
                            
                                
                                    file file ໄຟລ໌ສຽງທີ່ຈະປ່ຽນ
                                    format string ຮູບແບບເປົ້າຫມາຍ: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer ອັດຕາການສົ່ງອອກເປັນກິບຕໍ່ວິນາທີ: 64, 128, 192, 256, 320
                                    sample_rate integer ອັດຕາຕົວຢ່າງ: 22050, 44100, 48000
                                    channels string mono ឬ stereo
                                
                            
                        
                    
                
            

            
            
                ການສົນທະນາດ້ວຍສຽງ
                
                    POST /v1/voice-chat/
                
                ສົ່ງສຽງ ຫຼື ຂໍ້ຄວາມ ແລະ ຮັບການຕອບໂຕ້ຈາກ AI ໂດຍໃຊ້ການເວົ້າທີ່ໄດ້ສັງເຄາະ

                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data ឬ JSON)
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ຕ້ອງການ ການອະທິບາຍ
                        
                        
                            
                                audio
                                file
                                ບໍ່*
                                ຂໍ້ມູນເຂົ້າສຽງ (ຕ້ອງການ audio ຫຼື text)
                            
                            
                                text
                                string
                                ບໍ່*
                                ຂໍ້ຄວາມເຂົ້າ (ຕ້ອງການ audio ຫຼື text)
                            
                            
                                voice
                                string
                                ບໍ່
                                ສຽງສຳລັບການຕອບໂຕ້ຂອງ AI. ແບບເດີມ: af_bella
                            
                            
                                tts_model
                                string
                                ບໍ່
                                ແບບ TTS ສຳລັບການຕອບໂຕ້. ແບບປ້ອນທຳອິດ: kokoro
                            
                            
                                system_prompt
                                string
                                ບໍ່
                                ແຈ້ງເຕືອນລະບົບແບບຕົວເລືອກສຳລັບ AI
                            
                            
                                conversation_id
                                string
                                ບໍ່
                                ສືບຕໍ່ການສົນທະນາທີ່ມີຢູ່ແລ້ວ
                            
                        
                    
                

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                TTS ຫຼາຍຄັ້ງ
                
                    POST /v1/tts/batch/
                
                ສົ່ງຂໍ້ຄວາມຫຼາຍຂໍ້ເພື່ອສ້າງ TTS ແບບກົງກັນຂ້າມ. ເລືອກທີ່ຈະຮັບການໂທຄືນ webhook ເມື່ອວຽກທັງ ໝົດ ສຳເລັດ.

                ប៉ារ៉ាម៉ែត្រ
                
                    ຕົວເລືອກ ປະເພດ ຄໍາອະທິບາຍ
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string URL ແບບເລືອກທີ່ຈະສົ່ງຜົນການກວດສອບເມື່ອການປະມວນຜົນຊຸດສຳເລັດ
                    
                

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                ຜົນການເລືອກຕັ້ງ ດ້ວຍການ GET /v1/tts/batch/result/?batch_id=abc123
            

            
            
                ສຽງຝັງ
                
                    POST /v1/voice-embed/
                
                ຄິດໄລ່ກ່ອນການຝັງສຽງຈາກສຽງທີ່ອ້າງອີງ. ໃຊ້ embed_id ທີ່ໄດ້ກັບຄືນມາ ໃນການຮ້ອງຂໍການກັ່ນຕອງສຽງຕໍ່ໄປ ເພື່ອສ້າງຂຶ້ນທັນທີ.

                ប៉ារ៉ាម៉ែត្រ
                
                    ຕົວເລືອກ ປະເພດ ຄໍາອະທິບາຍ
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                ກວດເບິ່ງສະພາບ
                
                    GET /v1/health/
                
                ກວດເບິ່ງສະຖານະຂອງເຄື່ອງຮັບ GPU, ແບບທີ່ໄດ້ຮັບການໂຫຼດ ແລະ ຂະໜາດຂອງຄິວ. ບໍ່ມີການຢັ້ງຢືນຄວາມຖືກຕ້ອງທີ່ຕ້ອງການ. ເກັບໄວ້ໃນຄຸກກີ ເປັນເວລາ 30 ວິນາທີ.

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ລາຍຊື່ແບບ
                
                    GET /v1/models/
                
                ສົ່ງຄືນລາຍຊື່ຂອງແບບທີ່ມີທັງໝົດພ້ອມດ້ວຍຄວາມສາມາດຂອງພວກມັນ.

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                ລາຍຊື່ສຽງ
                
                    GET /v1/voices/
                
                ສົ່ງຄືນລາຍຊື່ສຽງທີ່ມີທັງໝົດ, ໂດຍການກັ່ນຕອງແບບ ຫຼື ພາສາ.

                ប៉ារ៉ាម៉ែត្រសំណួរ
                
                    
                        
                            ប៉ារ៉ាម៉ែត្រ ປະເພດ ການອະທິບາຍ
                        
                        
                            
                                model
                                string
                                ຕື່ມຕົວກັ່ນຕອງຕາມລະຫັດຕົວແບບ (ຕົວຢ່າງ kokoro)
                            
                            
                                language
                                string
                                ຕື່ມຕາມລະຫັດພາສາ (ຕົວຢ່າງ en)
                            
                            
                                gender
                                string
                                ການກັ່ນຕອງຕາມເພດ: ຊາຍ, ຍິງ, ສະໝ່ຳສະເໝີ
                            
                        
                    
                

                ຕອບໂຕ້
                
                    ການຕອບໂຕ້ JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                ຊື່ອັກສອນພາຍໃຕ້ (SRT / VTT) ថ្មី
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                ສ້າງບົດກ່າວຕໍ່ບົດທີ່ໄດ້ເຮັດແລ້ວຂອງ TTS ໃດໆ. ແລ່ນການຈັດລຽງ Whisper ເທິງສຽງ ແລະ ສົ່ງຄືນ SRT ຫຼື WebVTT. ຜົນແມ່ນເກັບໄວ້ໃນແຟ້ມຖາວອນຂອງແຟ້ມ ດັ່ງນັ້ນ ການໂທຄັ້ງທີສອງສຳລັບ uuid ດຽວກັນແມ່ນການອ່ານແຟ້ມ.
                ប៉ារ៉ាម៉ែត្រសំណួរ
                
                    
                        ប៉ារ៉ាម៉ែត្រ ຕ້ອງການ ການອະທິບາຍ
                        
                            uuid ແມ່ນ UUID ຂອງວຽກທີ່ກັບມາໂດຍ /v1/tts/ ຫຼື /v1/voice-clone/.
                            format ບໍ່ srt (ປັ໊ກເດີມ) ຫຼື vtt.
                            download ບໍ່ 1 ເພື່ອສົ່ງ Content-Disposition: attachment ເພື່ອໃຫ້ຕົວທ່ອງເວັບເກັບໄວ້ແທນທີ່ຈະສະແດງອອກ.
                            language ບໍ່ ຂໍ້ແນະນຳສຳລັບແບບແບບຈັດລຽງ (ກວດພົບໂດຍອັດຕະໂນມັດ ຖ້າບໍ່ໄດ້ລະບຸ)
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                ພະຍາກອນການອອກສຽງ ថ្មី
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                ແຈ້ງໃຫ້ເຄື່ອງຈັກ TTS ຮູ້ວິທີເວົ້າຄໍາສະເພາະ. ລາຍການທີ່ບັນທຶກໄວ້ຈະຖືກໃຊ້ໂດຍອັດຕະໂນມັດຕໍ່ທຸກໆຄໍາຮ້ອງຂໍ TTS ທີ່ເຈົ້າເຮັດ. ຈໍາກັດລາຍການ 200 ລາຍການຕໍ່ບັນຊີ.
                ທ້ອງຂອງຄໍາຮ້ອງຂໍ (POST)
                
                    
                        ប៉ារ៉ាម៉ែត្រ ປະເພດ ການອະທິບາຍ
                        
                            word string ຄໍາທີ່ຈະບິດເບືອນ (ຕົວຢ່າງ GIF, Anthropic). ຄໍາທີ່ຕິດກັບເຂດຈໍາກັດ.
                            replacement string ວິທີການ spell ມັນສໍາລັບແບບ (ຕົວຢ່າງ jiff, ann THROP ick).
                            language string ລະຫັດ ISO ແບບເລືອກ. ວ່າງ = ໃຊ້ກັບພາສາທັງໝົດ.
                            case_sensitive boolean false ແບບປ້ອນແບບເດີມ. ກົງກັບຕົວອັກສອນໃຫຍ່ນ້ອຍເມື່ອ true.
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                ທ່ານຍັງສາມາດສົ່ງການລົບລ້າງຄໍາຮ້ອງຂໍຕໍ່ຄັ້ງໄດ້ໂດຍບໍ່ຕ້ອງເກັບພວກມັນໄວ້ — ລວມເອົາ pronunciations ໃສ່ /v1/tts/ call ໃດໆ ເຊັ່ນວ່າເປັນສິ່ງ ຫຼື ອາຣາມ (ເບິ່ງ TTS endpoint params).
            

            
            
                កម្មវិធីនិយាយບົດຄວາມ ថ្មី
                ຫຼຸດລົງ

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ຕ້ອງການ	ການອະທິບາຍ
file	file	ແມ່ນ	ໄຟລ໌ສຽງ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). ສູງສຸດ 100MB.
model	string	ບໍ່	ແບບ STT: `whisper` (ປັ໊ກເດີມ), `faster-whisper`, `sensevoice`
language	string	ບໍ່	ລະຫັດພາສາ. `auto` ສຳລັບການກວດພົບດ້ວຍຕົວເອງ (ລຸ້ນເດີມ).
timestamps	boolean	ບໍ່	ລວມເອົາສະຖິຕິເວລາໃນລະດັບຄໍາ. ຕົວອ້າງອີງ: `false`
diarize	boolean	ບໍ່	ເປີດການບັນທຶກລາຍວັນຂອງຜູ້ເວົ້າ. ຕົວອ້າງອີງ: `false`

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ຕ້ອງການ	ການອະທິບາຍ
reference_audio	file	ແມ່ນ	ສຽງສຽງທີ່ແນະ ນຳ (ແນະ ນຳ 10-30 ວິນາທີ). ສູງສຸດ 20MB.
text	string	ແມ່ນ	ຂໍ້ຄວາມທີ່ຈະເວົ້າໃນສຽງທີ່ສ້າງເປັນຄລີນ
model	string	ບໍ່	ແບບຟອມແບບຖ່າຍທອດ: `chatterbox` (ປັ໊ກໄອເດຍ), `cosyvoice2`, `gpt-sovits`
format	string	ບໍ່	ຮູບແບບຜົນອອກ: `mp3` (ປັ໊ກເດີມ), `wav`, `flac`
language	string	ບໍ່	ລະຫັດພາສາເປົ້າ ໝາຍ. ຕ້ອງໄດ້ຮັບການສະໜັບສະໜູນໂດຍແບບທີ່ເລືອກໄວ້.

file file	ໄຟລ໌ສຽງທີ່ຈະເພີ່ມ
denoise boolean	ເປີດການລົບສິ່ງລົບກວນ (ຕົວອ້າງອີງ: ຖືກ)
enhance_clarity boolean	ເພີ່ມຄວາມຊັດເຈນຂອງການເວົ້າ (ລຸ້ນເດີມ: ຖືກ)
super_resolution boolean	ຍົກລະດັບຄຸນນະພາບສຽງ (ປັ໊ກເດີມ: ບໍ່ເປັນຈິງ)
strength integer	1-3(ເບົາ, ກາງ, ແຮງ). ແບບປ້ອນກ່ອນ: 2

file file	ໄຟລ໌ສຽງທີ່ຈະແຍກ
model string	`demucs` (លំនាំដើម) ឬ `spleeter`
stems integer	ຈໍານວນຕົ້ນໄມ້: 2, 4,5ຫຼື6(ປ້ອນແບບເດີມ: 2)
format string	ຮູບແບບຜົນອອກ: `wav`, `mp3`, `flac`

file file	ໄຟລ໌ສຽງທີ່ຈະປະມວນຜົນ
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	ໄຟລ໌ສຽງທີ່ຈະປ່ຽນ
format string	ຮູບແບບເປົ້າຫມາຍ: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	ອັດຕາການສົ່ງອອກເປັນກິບຕໍ່ວິນາທີ: 64, 128, 192, 256, 320
sample_rate integer	ອັດຕາຕົວຢ່າງ: 22050, 44100, 48000
channels string	`mono` ឬ `stereo`

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ຕ້ອງການ	ການອະທິບາຍ
audio	file	ບໍ່*	ຂໍ້ມູນເຂົ້າສຽງ (ຕ້ອງການ `audio` ຫຼື `text`)
text	string	ບໍ່*	ຂໍ້ຄວາມເຂົ້າ (ຕ້ອງການ `audio` ຫຼື `text`)
voice	string	ບໍ່	ສຽງສຳລັບການຕອບໂຕ້ຂອງ AI. ແບບເດີມ: `af_bella`
tts_model	string	ບໍ່	ແບບ TTS ສຳລັບການຕອບໂຕ້. ແບບປ້ອນທຳອິດ: `kokoro`
system_prompt	string	ບໍ່	ແຈ້ງເຕືອນລະບົບແບບຕົວເລືອກສຳລັບ AI
conversation_id	string	ບໍ່	ສືບຕໍ່ການສົນທະນາທີ່ມີຢູ່ແລ້ວ

ຕົວເລືອກ	ປະເພດ	ຄໍາອະທິບາຍ
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	URL ແບບເລືອກທີ່ຈະສົ່ງຜົນການກວດສອບເມື່ອການປະມວນຜົນຊຸດສຳເລັດ

ຕົວເລືອກ	ປະເພດ	ຄໍາອະທິບາຍ
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ການອະທິບາຍ
model	string	ຕື່ມຕົວກັ່ນຕອງຕາມລະຫັດຕົວແບບ (ຕົວຢ່າງ `kokoro`)
language	string	ຕື່ມຕາມລະຫັດພາສາ (ຕົວຢ່າງ `en`)
gender	string	ການກັ່ນຕອງຕາມເພດ: `ຊາຍ`, `ຍິງ`, `ສະໝ່ຳສະເໝີ`

ប៉ារ៉ាម៉ែត្រ	ຕ້ອງການ	ການອະທິບາຍ
uuid	ແມ່ນ	UUID ຂອງວຽກທີ່ກັບມາໂດຍ /v1/tts/ ຫຼື /v1/voice-clone/.
format	ບໍ່	`srt` (ປັ໊ກເດີມ) ຫຼື `vtt`.
download	ບໍ່	`1` ເພື່ອສົ່ງ `Content-Disposition: attachment` ເພື່ອໃຫ້ຕົວທ່ອງເວັບເກັບໄວ້ແທນທີ່ຈະສະແດງອອກ.
language	ບໍ່	ຂໍ້ແນະນຳສຳລັບແບບແບບຈັດລຽງ (ກວດພົບໂດຍອັດຕະໂນມັດ ຖ້າບໍ່ໄດ້ລະບຸ)

ប៉ារ៉ាម៉ែត្រ	ປະເພດ	ການອະທິບາຍ
word	string	ຄໍາທີ່ຈະບິດເບືອນ (ຕົວຢ່າງ `GIF`, `Anthropic`). ຄໍາທີ່ຕິດກັບເຂດຈໍາກັດ.
replacement	string	ວິທີການ spell ມັນສໍາລັບແບບ (ຕົວຢ່າງ `jiff`, `ann THROP ick`).
language	string	ລະຫັດ ISO ແບບເລືອກ. ວ່າງ = ໃຊ້ກັບພາສາທັງໝົດ.
case_sensitive	boolean	`false` ແບບປ້ອນແບບເດີມ. ກົງກັບຕົວອັກສອນໃຫຍ່ນ້ອຍເມື່ອ `true`.

ເອກະສານ API

ເບິ່ງ​ລວມ

គ្រាប់ចុច API

URL ພື້ນຖານ

ອະນຸຍາດ

ການ​ផ្ទៀងផ្ទាត់​ຄວາມ​ຖືກຕ້ອງ

SDKs

Python

JavaScript / Node.js

URL ພື້ນຖານ

ຈໍາກັດ​ອັດຕາ

ຄ່າ​ກູ້ຢືມ

ຂໍ້ຄວາມ​ເປັນ​ການ​ເວົ້າName

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ

ຕົວຢ່າງ​ຄໍາຮ້ອງຂໍ

ແທັກ SSML

ຕອບ​ໂຕ້

Step 1: Submit request

Step 2: Poll for result

Step 3: Download audio

ຕົວຢ່າງ​ເຕັມ

ການ​ເວົ້າ​ເປັນ​ຂໍ້​ຄວາມName

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບ​ໂຕ້

ການ​ກັ່ນຕອງ​ສຽງ

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບ​ໂຕ້

កម្មវិធី​ປ່ຽນ​ສຽງName

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕົວຢ່າງ​ຄໍາຮ້ອງຂໍ

ຕອບ​ໂຕ້

ການ​ແປ​ຄຳ​ເວົ້າ

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບ​ໂຕ້

ການ​ເວົ້າ​ເປັນ​ການ​ເວົ້າ

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບ​ໂຕ້

ເຄື່ອງມື​ສຽງName

ການ​ສົນທະນາ​ດ້ວຍ​ສຽງ

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (multipart/form-data ​ឬ JSON)

ຕອບ​ໂຕ້

TTS ຫຼາຍ​ຄັ້ງ

ប៉ារ៉ាម៉ែត្រ

ຕອບ​ໂຕ້

ສຽງ​ຝັງ

ប៉ារ៉ាម៉ែត្រ

ຕອບ​ໂຕ້

ກວດເບິ່ງ​ສະພາບ

ຕອບ​ໂຕ້

ລາຍ​ຊື່​ແບບ

ຕອບ​ໂຕ້

ລາຍຊື່​ສຽງ

​ប៉ារ៉ាម៉ែត្រ​សំណួរ

ຕອບ​ໂຕ້

ຊື່​ອັກສອນ​ພາຍ​ໃຕ້ (SRT / VTT) ថ្មី

​ប៉ារ៉ាម៉ែត្រ​សំណួរ

ພະ​ຍາ​ກອນ​ການ​ອອກສຽງ ថ្មី

ທ້ອງ​ຂອງ​ຄໍາຮ້ອງຂໍ (POST)

កម្មវិធី​និយាយ​ບົດ​ຄວາມ ថ្មី

ເບິ່ງລວມ

ການផ្ទៀងផ្ទាត់ຄວາມຖືກຕ້ອງ

ຈໍາກັດອັດຕາ

ຄ່າກູ້ຢືມ

ຂໍ້ຄວາມເປັນການເວົ້າName

ທ້ອງຂອງຄໍາຮ້ອງຂໍ

ຕົວຢ່າງຄໍາຮ້ອງຂໍ

ຕອບໂຕ້

ຕົວຢ່າງເຕັມ

ການເວົ້າເປັນຂໍ້ຄວາມName

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບໂຕ້

ການກັ່ນຕອງສຽງ

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບໂຕ້

កម្មវិធីປ່ຽນສຽງName

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕົວຢ່າງຄໍາຮ້ອງຂໍ

ຕອບໂຕ້

ການແປຄຳເວົ້າ

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບໂຕ້

ການເວົ້າເປັນການເວົ້າ

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data)

ຕອບໂຕ້

ເຄື່ອງມືສຽງName

ການສົນທະນາດ້ວຍສຽງ

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (multipart/form-data ឬ JSON)

ຕອບໂຕ້

TTS ຫຼາຍຄັ້ງ

ຕອບໂຕ້

ສຽງຝັງ

ຕອບໂຕ້

ກວດເບິ່ງສະພາບ

ຕອບໂຕ້

ລາຍຊື່ແບບ

ຕອບໂຕ້

ລາຍຊື່ສຽງ

ប៉ារ៉ាម៉ែត្រសំណួរ

ຕອບໂຕ້

ຊື່ອັກສອນພາຍໃຕ້ (SRT / VTT) ថ្មី

ប៉ារ៉ាម៉ែត្រសំណួរ

ພະຍາກອນການອອກສຽງ ថ្មី

ທ້ອງຂອງຄໍາຮ້ອງຂໍ (POST)

កម្មវិធីនិយាយບົດຄວາມ ថ្មី