API စာရွက်စာတမ်း
ကျွန်ုပ်တို့၏ REST API နှင့်အတူသင့် application များထဲသို့ TTS.ai ကိုပေါင်းစပ်ပါ။ လွယ်ကူသောပြောင်းရွှေ့မှုအတွက် OpenAI-ကိုက်ညီသော format ကို။
အကျဉ်းချုပ်
The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request / response bodies.
API ကီး
ကနေသင့်ရဲ့ API key ကိုရယူပါ အကောင့် သတ်မှတ်ချက်များ. Pro နှင့် Enterprise အစီအစဉ်များပေါ်တွင်ရရှိနိုင်သည်။
အခြေခံ URL
https://api.tts.ai/v1/
ခွင့်ပြုချက်
ကိုင်ဆောင်သူ token ကိုမှတဆင့် Authorization ခေါင်းစီး
အတည်ပြုခြင်း
/v1/tts/ မည်သည့် auth မရှိဘဲအလုပ်လုပ်, အထိ 5,000 IP ကိုတစ်နေ့လျှင်စာလုံး /, ကျွန်တော်တို့ရဲ့အခမဲ့မော်ဒယ်များအသုံးပြုခြင်း (piper, vits, melotts, kokoro). 15,000 bonus characters and access to premium models. 15,000 ဘောနပ်စ်စာလုံးများနှင့်ပရီမီယံမော်ဒယ်များသို့ဝင်ရောက်ခွင့်ရရန်အခမဲ့အကောင့်တစ်ခုအတွက်မှတ်ပုံတင်ပါ.
ပရီမီယံမော်ဒယ်များနှင့်အမြင့်ဆုံးနှုန်းကန့်သတ်ချက်များများအတွက်, တွင်တစ်ဦး Bearer token ကိုနှင့်အတူအတည်ပြု Authorization ခေါင်းစီး.
Authorization: Bearer sk-tts-your-api-key-here
SDK များ
တာဝန်ခံ SDKs သင့်ရဲ့ application ကိုသို့ပေါင်းစည်းရန်လွယ်ကူစေသည် TTS.ai. နှစ်ဦးစလုံးအရင်းအမြစ်ဖွင့်နှင့် GitHub ပေါ်တွင်ရရှိနိုင်.
Python
pip install ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
text="Hello world!",
model="kokoro"
)
client.save(audio, "output.wav")
JavaScript / Node.js
npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');
const client = new TTSClient({
apiKey: 'sk-tts-...'
});
const audio = await client.generate({
input: 'Hello world!',
model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
အခြေခံ URL
အားလုံး endpoints သည်ဤအခြေခံ URL ကိုဆက်စပ်နေကြသည်။ ဥပမာအားဖြင့်၊ TTS endpoint သည်:
အမြန်နှုန်း ကနိမ့်ကျမှု
API နှုန်းကန့်သတ်ချက်များစီမံကိန်းအားဖြင့်ကွဲပြားခြားနား:
| စီမံကိန်း | တောင်းဆိုချက်များ/မိနစ် | တပြိုင်နက်တည်း | စာသား အရှည် |
|---|---|---|---|
| လွတ်လပ်မှု | 10 | 2 | အက္ခရာ ၅၀၀ |
| စတင်သူ | 30 | 3 | 1,000,000 အက္ခရာများ |
| ပရော်ဖက်ရှင်နယ် | 60 | 5 | 1,000,000 အက္ခရာများ |
| လုပ်ငန်း | 300 | 20 | 50,000 အက္ခရာများ |
Rate limit headers များကို တုံ့ပြန်ချက်တိုင်းတွင် ထည့်သွင်းထားသည်။ X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.
ခရက်ဒစ်ကုန်ကျစရိတ်
| ဝန်ဆောင်မှု | စျေးနှုန်း | စက် |
|---|---|---|
| TTS (အခမဲ့မော်ဒယ်များ: Piper, VITS, MeloTTS) | အက္ခရာပေါင်း ၁၀၀၀ | per 1,000 စာလုံးများ |
| TTS (စတိုင်လ်မော်ဒယ်များ: Kokoro, CosyVoice 2, စသည်တို့ကို) | အက္ခရာပေါင်း ၂,၀၀၀ | per 1,000 စာလုံးများ |
| TTS (ပရီမီယံမော်ဒယ်များ: Tortoise, Chatterbox, စသည်တို့ကို) | 4,000 အက္ခရာများ | per 1,000 စာလုံးများ |
| စာသားသို့ စကားပြော | အက္ခရာပေါင်း ၂,၀၀၀ | အသံတစ်မိနစ်လျှင် |
| အသံခိုးယူခြင်း | 4,000 အက္ခရာများ | per 1,000 စာလုံးများ |
| အသံပြောင်းစက် | 3,000 အက္ခရာများ | အသံတစ်မိနစ်လျှင် |
| အသံတိုးမြှင့်ခြင်း | အက္ခရာပေါင်း ၂,၀၀၀ | အသံတစ်မိနစ်လျှင် |
| Vocal ထုတ်ပယ် / Stem ခွဲခြမ်းစိတ်ဖြာ | 3,000-4,000 စာလုံးများ | အသံတစ်မိနစ်လျှင် |
| စကားပြော ဘာသာပြန် | 5,000 အက္ခရာများ | အသံတစ်မိနစ်လျှင် |
| အသံစကားပြော | 3,000 အက္ခရာများ | လည်ပတ်မှုတိုင်း |
| Key & BPM ရှာဖွေသူ | လွတ်လပ်မှု | -- |
| အသံပြောင်း | လွတ်လပ်မှု | -- |
စာသားမှစကားပြော
စာသားကိုစကားပြောအသံသို့ပြောင်းပါ။ တောင်းဆိုထားသောပုံစံဖြင့်အသံဖိုင်ကိုပြန်ပေးသည်။
တောင်းဆိုချက်ကိုယ်ထည်
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| model | string | ဟုတ်ကဲ့ | Model ID (ဥပမာ, kokoro, chatterbox, piper). လွတ်သွားလျှင်, ကျနော်တို့တောင်းဆိုထားသော ဘာသာစကား ကိုထောက်ခံတဲ့အလိုအလျောက်-ရွေးကောက်ပွဲတစ်ဦးမော်ဒယ် - kokoro en/ja/zh/ko/fr/de/it/pt/es/hi/ru များအတွက်, piper အခြားထောက်ခံဘာသာစကားများ (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.). |
| text | string | ဟုတ်ကဲ့ | စကားပြောသို့ပြောင်းလဲရန်စာသား. Per-တောင်းဆိုချက်ခေါင်း: 500 chars (အမည်မဲ့), 5,000 (အခမဲ့အကောင့်), 1,000,000 (ပေးဆောင်အစီအစဉ်). |
| voice | string | ဟုတ်ကဲ့ | Voice ID (ရရှိနိုင်သော အသံများကို စာရင်းပြုစုရန် /v1/voices/ ကို အသုံးပြုပါ) |
| format | string | ဟုတ်ကဲ့ | output format: mp3 (အလိုအလျောက်), wav, flac, ogg |
| speed | float | ဟုတ်ကဲ့ | စကားပြောအမြန်နှုန်း multiplier. စံ: 1.0. Range: 0.5 မှ 2.0 |
| language | string | ဟုတ်ကဲ့ | ဘာသာစကားကုဒ် (ဥပမာ, en, es). လွတ်သွားလျှင်အလိုအလျောက်ရှာဖွေတွေ့ရှိ. |
| instructions | string | ဟုတ်ကဲ့ | လုပ်ဆောင်နေ / ပေးပို့ cues (≤500 chars) ။ ဥပမာ \ |
| pronunciations | object | array | ဟုတ်ကဲ့ | လျှင်-တောင်းဆိုချက်အသံထွက် overrides ။ သို့မဟုတ် {\ |
| stream | boolean | ဟုတ်ကဲ့ | လွှင့်တင်မှု တုံ့ပြန်မှုကို ခွင့်ပြုပါ။ အလိုအလျောက်: false |
နမူနာ တောင်းဆိုချက်
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"text": "Hello from TTS.ai! This is a test.",
"voice": "af_bella",
"format": "mp3"
}' \
--output output.mp3
SSML အမှတ်အသားများ
နံပါတ်များ Wrap, နေ့စွဲများ, ငွေကြေး, ဖုန်းနံပါတ်များ, နှင့် နေ့စွဲပုံစံ defaults The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result. Poll this endpoint every 1-2 seconds until Fetch the Streaming alternative: For supported models (Kokoro, MeloTTS), use
ဘာသာပြန် သွင်းယူမှု အဖြစ်ပြောဆို cardinal1234one thousand two hundred thirty-four ordinal21twenty-first date1999-12-31ဒီဇင်ဘာလဆယ့်တစ်, ဆယ့်ကိုးဆယ့်ကိုး-၉ time14:30two thirty PM telephone+1-555-867-5309plus one five five five eight six seven… currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents spell-outNASAN A S A mdy အင်္ဂလိပ်နှင့် dmy အခြားနေရာများတွင်များအတွက်; format = \ ဖြင့် override{
"model": "kokoro",
"voice": "af_bella",
"text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}တုံ့ပြန်မှု
Step 1: Submit request
{
"uuid": "77b71db532874ce98e84a69a2d740d4c",
"job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
"status": "queued",
"credits_used": 11,
"credits_remaining": 15000
}Step 2: Poll for result
status is completed or failed.{
"status": "completed",
"result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}{
"status": "processing"
}Step 3: Download audio
result_url from the completed response to download the audio file.ဥပမာအပြည့်အစုံ
import requests, time
API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"
# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]
# 2. Poll for result
while True:
result = requests.get(f"{BASE}/v1/speech/results/",
params={"uuid": uuid}).json()
if result["status"] == "completed":
# 3. Download audio
audio = requests.get(result["result_url"])
with open("output.mp3", "wb") as f:
f.write(audio.content)
break
elif result["status"] == "failed":
raise Exception(result.get("error", "Generation failed"))
time.sleep(1.5)POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.
စာသားသို့ စကားပြော
စာသားသို့အသံ transcribe ။ auto-ရှာဖွေတွေ့ရှိခြင်းနှင့်အတူ 99 ဘာသာစကားများထောက်ခံသည်။
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| file | file | ဟုတ်ကဲ့ | အသံဖိုင် (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Max 100MB. |
| model | string | ဟုတ်ကဲ့ | STT ပုံစံ: whisper (စံ), မြန်-whisper, sensevoice |
| language | string | ဟုတ်ကဲ့ | ဘာသာစကားကုဒ်။ auto အလိုအလျောက်-ရှာဖွေတွေ့ရှိ (စံ) အတွက်။ |
| timestamps | boolean | ဟုတ်ကဲ့ | စကားလုံး-အဆင့် အချိန်တံဆိပ်များကို ထည့်သွင်းပါ။ စံ: false |
| diarize | boolean | ဟုတ်ကဲ့ | အလိုအလျောက်: false |
တုံ့ပြန်မှု
{
"text": "Hello, this is a transcription test.",
"language": "en",
"duration": 3.5,
"segments": [
{
"start": 0.0,
"end": 1.8,
"text": "Hello, this is",
"speaker": "SPEAKER_00"
},
{
"start": 1.8,
"end": 3.5,
"text": "a transcription test.",
"speaker": "SPEAKER_00"
}
]
}
အသံခိုးယူခြင်း
ကူးယူထားသော အသံဖြင့် စကားပြောခြင်း၊ အသံနှင့် စာသားကို တင်သွင်းခြင်း
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| reference_audio | file | ဟုတ်ကဲ့ | ရည်ညွှန်းအသံအသံ (10-30 စက္ကန့်အကြံပြု). Max 20MB. |
| text | string | ဟုတ်ကဲ့ | ကူးယူထားသော အသံဖြင့် ပြောရန် စာသား |
| model | string | ဟုတ်ကဲ့ | မျိုးပွားမော်ဒယ်: chatterbox (စံ), cosyvoice2, gpt-sovits |
| format | string | ဟုတ်ကဲ့ | ထွက်ရှိမှုပုံစံ: mp3 (စံ), wav, flac |
| language | string | ဟုတ်ကဲ့ | ရည်ရွယ်ချက်ဘာသာစကားကုဒ်။ ရွေးချယ်ထားသောမော်ဒယ်မှထောက်ခံမှုရှိရမည်။ |
တုံ့ပြန်မှု
အသံဖိုင်ကို TTS ၏ အဆုံးအဖြတ်နှင့်တူသော ဘိုင်နရီဒေတာအဖြစ်ပြန်ပေးသည်
အသံပြောင်းစက်
ကွဲပြားခြားနားသောအသံလိုအသံကိုအသံပြောင်းပါ။ ရင်းမြစ်အသံကို upload လုပ်ပြီးရည်မှန်းချက်အသံကိုရွေးချယ်ပါ။
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| file | file | ဟုတ်ကဲ့ | အရင်းအမြစ်အသံဖိုင် (MP3, WAV, FLAC). Max 50MB. |
| target_voice | string | ဟုတ်ကဲ့ | ပြောင်းရန်ရည်ရွယ်ချက်အသံအမည် (/v1/voices/ ကိုအသုံးပြုပြီးရရှိနိုင်သောအသံများကိုစာရင်းပြုစုပါ) |
| model | string | ဟုတ်ကဲ့ | အသံပြောင်းလဲမှုမော်ဒယ်: openvoice (စံ), knn-vc |
| format | string | ဟုတ်ကဲ့ | output format: wav (အလိုအလျောက်), mp3, flac |
နမူနာ တောင်းဆိုချက်
curl -X POST https://api.tts.ai/v1/voice-convert/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@source_audio.mp3" \
-F "target_voice=af_bella" \
-F "model=openvoice" \
-o converted.wav
တုံ့ပြန်မှု
ပြောင်းပြန်အသံဖိုင်ကို ဘိုင်နရီဒေတာအဖြစ်ပြန်ပေးသည်
စကားပြော ဘာသာပြန်
ဘာသာပြန်ဆိုတစ်ဘာသာစကားမှအခြားပြောဆိုအသံ. စကားပြော-to-စာသားကိုပေါင်းစပ်, ဘာသာပြန်ချက်, နှင့်တစ်ဦးတည်းခေါ်ဆိုမှုတွင်စာသား-to-စကားပြော.
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| file | file | ဟုတ်ကဲ့ | မူရင်းဘာသာစကားဖြင့်အသံဖိုင်ကို source. Max 100MB. |
| target_language | string | ဟုတ်ကဲ့ | ရည်ရွယ်ချက်ဘာသာစကားကုဒ် (ဥပမာ, es, fr, de, ja) |
| voice | string | ဟုတ်ကဲ့ | ဘာသာပြန်ထုတ်ထွက်အတွက် အသံ။ လွတ်သွားလျှင် အလိုအလျောက်ရွေးသည်။ |
| preserve_voice | boolean | ဟုတ်ကဲ့ | မူရင်းပြောသူ၏ အသံအရည်အသွေးများကို ထိန်းသိမ်းရန် ကြိုးစားပါ |
တုံ့ပြန်မှု
{
"original_text": "Hello, how are you?",
"translated_text": "Hola, como estas?",
"source_language": "en",
"target_language": "es",
"audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
"credits_used": 5
}
စကားပြောမှစကားပြော
စကားပြောစတိုင်ပြောင်းလဲ, ခံစားချက်, သို့မဟုတ်အကြောင်းအရာကိုထိန်းသိမ်းထားစဉ်ပေးပို့. အသံကိုချိန်ညှိဖို့အသုံးဝင်, pacing, နှင့် expressionness.
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| file | file | ဟုတ်ကဲ့ | အရင်းအမြစ်စကားပြောအသံဖိုင်. Max 50MB. |
| voice | string | ဟုတ်ကဲ့ | ထွက်လာသော စကားအတွက် ရည်ရွယ်ချက် အသံအမည် |
| model | string | ဟုတ်ကဲ့ | ပုံစံ: openvoice (စံ), chatterbox |
| emotion | string | ဟုတ်ကဲ့ | ရည်မှန်းချက်စိတ်ခံစားမှု: အလိုအလျောက်, ပျော်ရွှင်, ဝမ်းနည်း, ဒေါသ, စိတ်လှုပ်ရှား |
| speed | float | ဟုတ်ကဲ့ | အမြန်နှုန်းကိုချိန်ညှိခြင်း။ စံ: 1.0။ အမျိုးအစား: 0.5 မှ 2.0 |
တုံ့ပြန်မှု
အသံဖိုင်ကို ဘိုင်နရီ ဒေတာအဖြစ် ပြောင်းလဲပေးသည်
အသံကိရိယာများ
တိုးမြှင့်, အသံဖယ်ရှားရေး, stem splitting, နှင့်ပိုမိုများအတွက်အသံ processing endpoints ။
အသံအရည်အသွေးကိုတိုးမြှင့်: denoise, ရှင်းလင်းပြတ်သားမှုတိုးတက်ကောင်းမွန်, super resolution ကို။
| file file | တိုးမြှင့်ရန် အသံဖိုင် |
| denoise boolean | အသံလျှော့ချခြင်းကို ခွင့်ပြုပါ (စံ: အမှန်) |
| enhance_clarity boolean | ပြောဆိုမှု ရှင်းလင်းမှုကို တိုးမြှင့်ပါ (စံ: အမှန်) |
| super_resolution boolean | အသံအရည်အသွေးကို မြှင့်တင်ပါ (စံ: မှားသည်) |
| strength integer | 1-3 (အလင်း, အလတ်စား, ခိုင်မာတဲ့). မူလ: 2 |
ကွဲပြားခြားနားသော instrumentals မှအဆိုတော်များ (အဆိုတော်များဖယ်ရှားရေး) သို့မဟုတ် stems များသို့ခွဲခြား။
| file file | ခွဲထုတ်ရန် အသံဖိုင် |
| model string | demucs (အလိုအလျောက်) သို့မဟုတ် spleeter |
| stems integer | ပင်အရေအတွက်: 2,4,5, သို့မဟုတ်6(စံ: 2) |
| format string | output format: wav, mp3, flac |
အသံမှတ်တမ်းများမှ တုံ့ပြန်သံနှင့် ပြန်ကြားသံကို ဖယ်ရှားပါ
| file file | စီမံရန် အသံဖိုင် |
| type string | echo or reverb (default: both) |
| intensity integer | 1-5 (default: 3) |
key, BPM, နှင့်အချိန်လက်မှတ်ကိုရှာဖွေတွေ့ရှိရန်အသံကိုခွဲခြမ်းစိတ်ဖြာပါ။
| file file | ဆန်းစစ်ရန် အသံဖိုင် |
{
"key": "C",
"scale": "Major",
"bpm": 120.0,
"time_signature": "4/4",
"camelot": "8B",
"compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
အသံဖိုင်များကို အမျိုးအစားများအကြား ပြောင်းပါ
| file file | ပြောင်းရန် အသံဖိုင် |
| format string | ရည်ရွယ်ချက်ပုံစံ: mp3, wav, flac, ogg, m4a, aac |
| bitrate integer | kbps တွင် output ကို bitrate: 64, 128, 192, 256, 320 |
| sample_rate integer | နမူနာနှုန်း: 22050, 44100, 48000 |
| channels string | mono သို့မဟုတ် stereo |
အသံစကားပြော
အသံသို့မဟုတ်စာသားကိုပို့ပြီး synthesized စကားပြောနှင့်အတူ AI ကိုတုံ့ပြန်ချက်ကိုလက်ခံရရှိ။
တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data သို့မဟုတ် JSON)
| အညွှန်းကိန်း | အမျိုးအစား | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|---|
| audio | file | ဟုတ်ကဲ့* | အသံသွင်း (audio သို့မဟုတ် text လိုအပ်သည်) |
| text | string | ဟုတ်ကဲ့* | စာသားထည့်သွင်းခြင်း (audio သို့မဟုတ် text လိုအပ်သည်) |
| voice | string | ဟုတ်ကဲ့ | AI တုံ့ပြန်မှုအတွက် အသံ။ အလိုအလျောက်: af_bella |
| tts_model | string | ဟုတ်ကဲ့ | တုံ့ပြန်မှုအတွက် TTS မော်ဒယ်။ စံ: kokoro |
| system_prompt | string | ဟုတ်ကဲ့ | AI အတွက် သတ်မှတ်ထားသော စနစ်မေးခွန်း |
| conversation_id | string | ဟုတ်ကဲ့ | ရှိပြီးသား စကားပြောခြင်းကို ဆက်လုပ်ပါ |
တုံ့ပြန်မှု
{
"conversation_id": "conv_abc123",
"user_text": "What is the capital of France?",
"ai_text": "The capital of France is Paris.",
"audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
"credits_used": 3
}
အုပ်စုလိုက် TTS
တူညီ TTS မျိုးဆက်အတွက်စာသားများစွာကိုတင်သွင်း. အားလုံးအလုပ်အကိုင်များပြီးစီးတဲ့အခါ optionally တစ် webhook callback ကိုလက်ခံရရှိ.
သတ်မှတ်ချက်များ
| သတ်မှတ်ချက် | အမျိုးအစား | ဖော်ပြချက် |
|---|---|---|
| texts | array | Array of objects: {text, model, voice}. Max 50 items. |
| webhook_url | string | batch ပြီးဆုံးတဲ့အခါ POST ရလဒ်များကို optional URL ကို။ |
တုံ့ပြန်မှု
{
"batch_id": "abc123",
"total": 3,
"completed": 0,
"status": "processing"
}
GET /v1/tts/batch/result/?batch_id=abc123 နှင့်အတူ Poll တိုးတက်မှု
အသံထည့်သွင်းခြင်း
ရည်ညွှန်းအသံမှအသံထည့်သွင်းခြင်းကိုကြိုတင်တွက်ချက်ပါ။ နီးနီးကပ်ကပ်အရှိန်အဟုန်မျိုးဆက်အတွက်နောက်ဆက်တွဲအသံကူးယူတောင်းဆိုမှုတွင်ပြန်လာသော embed_id ကိုအသုံးပြုပါ။
သတ်မှတ်ချက်များ
| သတ်မှတ်ချက် | အမျိုးအစား | ဖော်ပြချက် |
|---|---|---|
| file | file | Reference audio file (WAV, MP3, FLAC). |
| model | string | Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts. |
တုံ့ပြန်မှု
{
"embed_id": "emb_abc123",
"model": "chatterbox",
"duration_ms": 450
}
ကျန်းမာရေးစစ်ဆေးခြင်း
GPU ဆာဗာအခြေအနေကိုစစ်ဆေးပါ, loaded မော်ဒယ်များ, နှင့်တန်းအရွယ်အစား. အတည်ပြုချက်လိုအပ်ပါတယ်မဟုတ်. 30 စက္ကန့်များအတွက် cached.
တုံ့ပြန်မှု
{
"status": "online",
"latency_ms": 45,
"queue_size": 3,
"models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
မော်ဒယ်များစာရင်း
သူတို့ရဲ့စွမ်းဆောင်ရည်များနှင့်အတူရရှိနိုင်မော်ဒယ်များအားလုံး၏စာရင်းကိုပြန်ပေးသည်။
တုံ့ပြန်မှု
{
"models": [
{
"id": "kokoro",
"name": "Kokoro",
"type": "tts",
"tier": "standard",
"languages": ["en", "ja", "ko", "zh", "fr"],
"supports_cloning": false,
"supports_streaming": true,
"credits_per_1k_chars": 2
},
{
"id": "chatterbox",
"name": "Chatterbox",
"type": "tts",
"tier": "premium",
"languages": ["en"],
"supports_cloning": true,
"supports_streaming": true,
"credits_per_1k_chars": 4
}
]
}
အသံစာရင်း
ရရှိနိုင်သော အသံအားလုံး၏ စာရင်းကို ပြန်ပေးသည်၊ မော်ဒယ် သို့မဟုတ် ဘာသာစကားဖြင့် ရွေးချယ်၍ စစ်ထုတ်သည်။
မေးမြန်းချက် သတ်မှတ်ချက်
| အညွှန်းကိန်း | အမျိုးအစား | ဖော်ပြချက် |
|---|---|---|
| model | string | မော်ဒယ် ID ဖြင့်စစ်ထုတ်ပါ (ဥပမာ kokoro) |
| language | string | ဘာသာစကားကုဒ်ဖြင့်စစ်ထုတ်ပါ (ဥပမာ - en) |
| gender | string | လိင်အလိုက် filter လုပ်ပါ: male, female, neutral |
တုံ့ပြန်မှု
{
"voices": [
{
"id": "af_bella",
"name": "Bella",
"model": "kokoro",
"language": "en",
"gender": "female",
"preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
}
],
"total": 142
}
စာတန်းထိုး (SRT / VTT) အသစ်
မည်သည့်ပြီးစီး TTS အလုပ်အတွက် synced ဇာတ်ညွှန်းများထုတ်လုပ်. အသံထက် Whisper alignment ကို runs နှင့် SRT သို့မဟုတ် WebVTT ပြန်လာ. ရလဒ်ကိုတူညီ uuid အတွက်ဒုတိယခေါ်ဆိုမှုတစ်ဦးဒစ်ကက်ဖတ်ဖို့ဖြစ်ပါတယ်ဒါကြောင့်ဒီစ်ကက်ပေါ်တွင် cached ထားသည်။
မေးမြန်းချက် သတ်မှတ်ချက်
| အညွှန်းကိန်း | လိုအပ်သည် | ဖော်ပြချက် |
|---|---|---|
| uuid | ဟုတ်ကဲ့ | /v1/tts/ သို့မဟုတ် /v1/voice-clone/ မှပြန်လာသောအလုပ် UUID။ |
| format | ဟုတ်ကဲ့ | srt (စံ) သို့မဟုတ် vtt။ |
| download | ဟုတ်ကဲ့ | 1 Content-Disposition: attachment ပို့ရန်အတွက် browser ကို displays ထက်ပိုပြီးသိမ်းဆည်းထားသည်။ |
| language | ဟုတ်ကဲ့ | တန်းတူပြုမှု မော်ဒယ်ကို ထောက်ပြပါ (မပါရင် အလိုအလျောက် ရှာဖွေ)။ |
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
အသံထွက် အဘိဓာန် အသစ်
တိကျတဲ့စကားလုံးများကိုထုတ်ဖော်ပြောဆိုရန် TTS အင်ဂျင်ကိုပြောပြပါ. Saved entries auto-apply to every TTS request you make. 200-entry per-account limit.
တောင်းဆိုချက်ကိုယ်ထည် (POST)
| အညွှန်းကိန်း | အမျိုးအစား | ဖော်ပြချက် |
|---|---|---|
| word | string | အစားထိုးဖို့ စကားလုံး (ဥပမာ GIF, Anthropic)။ စကားလုံး နယ်နိမိတ် တူညီတယ်။ |
| replacement | string | ပုံစံအတွက်ဘယ်လို spell (ဥပမာ jiff, ann THROP ick). |
| language | string | ရွေးချယ်စရာ ISO code ကို။ Empty = ဘာသာစကားအားလုံးကိုသက်ရောက်သည်။ |
| case_sensitive | boolean | စံ false. true အခါအမှန်တကယ်အမှုလိုက်. |
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
-H "Authorization: Bearer sk-tts-..." \
-H "Content-Type: application/json" \
-d '{"word": "GIF", "replacement": "jiff"}'
# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."
# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
သင်သည်လည်းသူတို့ကိုကယ်တင်ခြင်းမရှိဘဲတစ်ဦးချင်းစီ-တောင်းဆိုချက် overrides ပေးပို့နိုင်ပါတယ် — တစ်ခုခု object တစ်ခုသို့မဟုတ်အစုလိုက်အဖြစ်မည်သည့် / v1 / tts / call အပေါ် pronunciations ပါဝင်သည် (TTS endpoint params ကြည့်ရှု).
ဆောင်းပါး ပြောပြသူ အသစ်
မည်သည့်ဆောင်းပါးစာမျက်နှာပေါ်တွင်တစ်ဦးတည်း tag ကို Drop နှင့်ဧည့်သည်များကလစ်အပေါ်စာမျက်နှာကို narrates သောခိုင်မာတဲ့ဖတ်သူဘုတ်အဖွဲ့ရ. ဆောင်းပါးကိုယ်ခန္ဓာ Auto-detects, custom voice / model / position / accent color ကိုထောက်ခံ.
<script src="https://tts.ai/narrator.js"
data-pk="pk-tts-your-publishable-key"
data-voice="af_bella"
data-model="kokoro"
data-extract="auto"
data-position="bottom"
data-color="#e60000"
data-locale="en"></script>
ရွေးချယ်စရာများ
| အညွှန်းကိန်း | ဖော်ပြချက် |
|---|---|
data-pk | ထုတ်ဝေနိုင်သော ကီး (pk-tts-...). ကီး၏ allowed_domains ဧရိယာမှတဆင့် ထိန်းချုပ်ထားသော ဒိုမိန်း စည်းမျဉ်းများ။ |
data-voice | အသံအမည်။ စံ af_bella။ |
data-model | TTS ပုံစံအမည်။ စံ kokoro။ |
data-extract | auto (default) — ဆောင်းပါး / အဓိက /.post-content /.entry-content selectors ကိုကြိုးစားပါ, သိပ်သည်းဆုံးပုဒ်မ cluster ကိုပြန်ဆင်းသက်. သို့မဟုတ်တိကျတဲ့ element ကိုရည်မှန်းချက်ပန်းတိုင်ကိုမည်သည့် CSS ကို selector ကိုပေးပို့. |
data-position | bottom (စံ) သို့မဟုတ် top. |
data-color | အရောင်အသားပေး (မည်သည့် CSS အရောင်). စံ #e60000. |
data-min-chars / data-max-chars | ဆောင်းပါး min-chars ထက်တိုတောင်းလျှင်ဘားကျော်လွန် (default 200) ။ max-chars မှာ Cap input ကို (default 50,000) ။ |
နားထောင်ရန် ခလုတ် ကိရိယာ
Inline button-style embed. ၎င်း၏