API စာရွက်စာတမ်း

ကျွန်ုပ်တို့၏ REST API နှင့်အတူသင့် application များထဲသို့ TTS.ai ကိုပေါင်းစပ်ပါ။ လွယ်ကူသောပြောင်းရွှေ့မှုအတွက် OpenAI-ကိုက်ညီသော format ကို။

REST API OpenAI နှင့်ကိုက်ညီသည် JSON တုံ့ပြန်ချက် စီးဆင်းမှုထောက်ပံ့မှု

အကျဉ်းချုပ်

The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request / response bodies.

API ကီး

ကနေသင့်ရဲ့ API key ကိုရယူပါ အကောင့် သတ်မှတ်ချက်များ. Pro နှင့် Enterprise အစီအစဉ်များပေါ်တွင်ရရှိနိုင်သည်။

အခြေခံ URL

https://api.tts.ai/v1/

ခွင့်ပြုချက်

ကိုင်ဆောင်သူ token ကိုမှတဆင့် Authorization ခေါင်းစီး

အတည်ပြုခြင်း

အခမဲ့အဆင့် - လိုအပ်သော key ကိုမရှိပါ။ နာမည်မဲ့ POST များ /v1/tts/ မည်သည့် auth မရှိဘဲအလုပ်လုပ်, အထိ 5,000 IP ကိုတစ်နေ့လျှင်စာလုံး /, ကျွန်တော်တို့ရဲ့အခမဲ့မော်ဒယ်များအသုံးပြုခြင်း (piper, vits, melotts, kokoro). 15,000 bonus characters and access to premium models. 15,000 ဘောနပ်စ်စာလုံးများနှင့်ပရီမီယံမော်ဒယ်များသို့ဝင်ရောက်ခွင့်ရရန်အခမဲ့အကောင့်တစ်ခုအတွက်မှတ်ပုံတင်ပါ.

ပရီမီယံမော်ဒယ်များနှင့်အမြင့်ဆုံးနှုန်းကန့်သတ်ချက်များများအတွက်, တွင်တစ်ဦး Bearer token ကိုနှင့်အတူအတည်ပြု Authorization ခေါင်းစီး.

HTTP ခေါင်းစီး
Authorization: Bearer sk-tts-your-api-key-here
သင့်ရဲ့ API key ကိုလျှို့ဝှက်ထားပါ။ Do not share it in client-side code, အများပြည်သူ repositories, or logs. သင့်ရဲ့အကောင့် setting များမှပုံမှန်အားဖြင့်ခလုတ်များကိုလှည့်.

SDK များ

တာဝန်ခံ SDKs သင့်ရဲ့ application ကိုသို့ပေါင်းစည်းရန်လွယ်ကူစေသည် TTS.ai. နှစ်ဦးစလုံးအရင်းအမြစ်ဖွင့်နှင့် GitHub ပေါ်တွင်ရရှိနိုင်.

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

အခြေခံ URL

အခြေခံ URL: https://api.tts.ai/v1/

အားလုံး endpoints သည်ဤအခြေခံ URL ကိုဆက်စပ်နေကြသည်။ ဥပမာအားဖြင့်၊ TTS endpoint သည်:

POST https://api.tts.ai/v1/tts/

အမြန်နှုန်း ကနိမ့်ကျမှု

API နှုန်းကန့်သတ်ချက်များစီမံကိန်းအားဖြင့်ကွဲပြားခြားနား:

စီမံကိန်း တောင်းဆိုချက်များ/မိနစ် တပြိုင်နက်တည်း စာသား အရှည်
လွတ်လပ်မှု 10 2 အက္ခရာ ၅၀၀
စတင်သူ 30 3 1,000,000 အက္ခရာများ
ပရော်ဖက်ရှင်နယ် 60 5 1,000,000 အက္ခရာများ
လုပ်ငန်း 300 20 50,000 အက္ခရာများ

Rate limit headers များကို တုံ့ပြန်ချက်တိုင်းတွင် ထည့်သွင်းထားသည်။ X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ခရက်ဒစ်ကုန်ကျစရိတ်

ဝန်ဆောင်မှု စျေးနှုန်း စက်
TTS (အခမဲ့မော်ဒယ်များ: Piper, VITS, MeloTTS) အက္ခရာပေါင်း ၁၀၀၀ per 1,000 စာလုံးများ
TTS (စတိုင်လ်မော်ဒယ်များ: Kokoro, CosyVoice 2, စသည်တို့ကို) အက္ခရာပေါင်း ၂,၀၀၀ per 1,000 စာလုံးများ
TTS (ပရီမီယံမော်ဒယ်များ: Tortoise, Chatterbox, စသည်တို့ကို) 4,000 အက္ခရာများ per 1,000 စာလုံးများ
စာသားသို့ စကားပြော အက္ခရာပေါင်း ၂,၀၀၀ အသံတစ်မိနစ်လျှင်
အသံခိုးယူခြင်း 4,000 အက္ခရာများ per 1,000 စာလုံးများ
အသံပြောင်းစက် 3,000 အက္ခရာများ အသံတစ်မိနစ်လျှင်
အသံတိုးမြှင့်ခြင်း အက္ခရာပေါင်း ၂,၀၀၀ အသံတစ်မိနစ်လျှင်
Vocal ထုတ်ပယ် / Stem ခွဲခြမ်းစိတ်ဖြာ 3,000-4,000 စာလုံးများ အသံတစ်မိနစ်လျှင်
စကားပြော ဘာသာပြန် 5,000 အက္ခရာများ အသံတစ်မိနစ်လျှင်
အသံစကားပြော 3,000 အက္ခရာများ လည်ပတ်မှုတိုင်း
Key & BPM ရှာဖွေသူ လွတ်လပ်မှု --
အသံပြောင်း လွတ်လပ်မှု --

စာသားမှစကားပြော

POST /v1/tts/

စာသားကိုစကားပြောအသံသို့ပြောင်းပါ။ တောင်းဆိုထားသောပုံစံဖြင့်အသံဖိုင်ကိုပြန်ပေးသည်။

တောင်းဆိုချက်ကိုယ်ထည်

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
model string ဟုတ်ကဲ့ Model ID (ဥပမာ, kokoro, chatterbox, piper). လွတ်သွားလျှင်, ကျနော်တို့တောင်းဆိုထားသော ဘာသာစကား ကိုထောက်ခံတဲ့အလိုအလျောက်-ရွေးကောက်ပွဲတစ်ဦးမော်ဒယ် - kokoro en/ja/zh/ko/fr/de/it/pt/es/hi/ru များအတွက်, piper အခြားထောက်ခံဘာသာစကားများ (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.).
text string ဟုတ်ကဲ့ စကားပြောသို့ပြောင်းလဲရန်စာသား. Per-တောင်းဆိုချက်ခေါင်း: 500 chars (အမည်မဲ့), 5,000 (အခမဲ့အကောင့်), 1,000,000 (ပေးဆောင်အစီအစဉ်).
voice string ဟုတ်ကဲ့ Voice ID (ရရှိနိုင်သော အသံများကို စာရင်းပြုစုရန် /v1/voices/ ကို အသုံးပြုပါ)
format string ဟုတ်ကဲ့ output format: mp3 (အလိုအလျောက်), wav, flac, ogg
speed float ဟုတ်ကဲ့ စကားပြောအမြန်နှုန်း multiplier. စံ: 1.0. Range: 0.5 မှ 2.0
language string ဟုတ်ကဲ့ ဘာသာစကားကုဒ် (ဥပမာ, en, es). လွတ်သွားလျှင်အလိုအလျောက်ရှာဖွေတွေ့ရှိ.
instructions string ဟုတ်ကဲ့ လုပ်ဆောင်နေ / ပေးပို့ cues (≤500 chars) ။ ဥပမာ \
pronunciations object | array ဟုတ်ကဲ့ လျှင်-တောင်းဆိုချက်အသံထွက် overrides ။ သို့မဟုတ် {\
stream boolean ဟုတ်ကဲ့ လွှင့်တင်မှု တုံ့ပြန်မှုကို ခွင့်ပြုပါ။ အလိုအလျောက်: false

နမူနာ တောင်းဆိုချက်

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML အမှတ်အသားများ

နံပါတ်များ Wrap, နေ့စွဲများ, ငွေကြေး, ဖုန်းနံပါတ်များ, နှင့်

ဘာသာပြန်သွင်းယူမှုအဖြစ်ပြောဆို
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31ဒီဇင်ဘာလဆယ့်တစ်, ဆယ့်ကိုးဆယ့်ကိုး-၉
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

နေ့စွဲပုံစံ defaults mdy အင်္ဂလိပ်နှင့် dmy အခြားနေရာများတွင်များအတွက်; format = \ ဖြင့် override

နမူနာ
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

တုံ့ပြန်မှု

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

ဥပမာအပြည့်အစုံ

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

စာသားသို့ စကားပြော

POST /v1/stt/

စာသားသို့အသံ transcribe ။ auto-ရှာဖွေတွေ့ရှိခြင်းနှင့်အတူ 99 ဘာသာစကားများထောက်ခံသည်။

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
file file ဟုတ်ကဲ့ အသံဖိုင် (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Max 100MB.
model string ဟုတ်ကဲ့ STT ပုံစံ: whisper (စံ), မြန်-whisper, sensevoice
language string ဟုတ်ကဲ့ ဘာသာစကားကုဒ်။ auto အလိုအလျောက်-ရှာဖွေတွေ့ရှိ (စံ) အတွက်။
timestamps boolean ဟုတ်ကဲ့ စကားလုံး-အဆင့် အချိန်တံဆိပ်များကို ထည့်သွင်းပါ။ စံ: false
diarize boolean ဟုတ်ကဲ့ အလိုအလျောက်: false

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

အသံခိုးယူခြင်း

POST /v1/tts/clone/

ကူးယူထားသော အသံဖြင့် စကားပြောခြင်း၊ အသံနှင့် စာသားကို တင်သွင်းခြင်း

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
reference_audio file ဟုတ်ကဲ့ ရည်ညွှန်းအသံအသံ (10-30 စက္ကန့်အကြံပြု). Max 20MB.
text string ဟုတ်ကဲ့ ကူးယူထားသော အသံဖြင့် ပြောရန် စာသား
model string ဟုတ်ကဲ့ မျိုးပွားမော်ဒယ်: chatterbox (စံ), cosyvoice2, gpt-sovits
format string ဟုတ်ကဲ့ ထွက်ရှိမှုပုံစံ: mp3 (စံ), wav, flac
language string ဟုတ်ကဲ့ ရည်ရွယ်ချက်ဘာသာစကားကုဒ်။ ရွေးချယ်ထားသောမော်ဒယ်မှထောက်ခံမှုရှိရမည်။

တုံ့ပြန်မှု

အသံဖိုင်ကို TTS ၏ အဆုံးအဖြတ်နှင့်တူသော ဘိုင်နရီဒေတာအဖြစ်ပြန်ပေးသည်

အသံပြောင်းစက်

POST /v1/voice-convert/

ကွဲပြားခြားနားသောအသံလိုအသံကိုအသံပြောင်းပါ။ ရင်းမြစ်အသံကို upload လုပ်ပြီးရည်မှန်းချက်အသံကိုရွေးချယ်ပါ။

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
file file ဟုတ်ကဲ့ အရင်းအမြစ်အသံဖိုင် (MP3, WAV, FLAC). Max 50MB.
target_voice string ဟုတ်ကဲ့ ပြောင်းရန်ရည်ရွယ်ချက်အသံအမည် (/v1/voices/ ကိုအသုံးပြုပြီးရရှိနိုင်သောအသံများကိုစာရင်းပြုစုပါ)
model string ဟုတ်ကဲ့ အသံပြောင်းလဲမှုမော်ဒယ်: openvoice (စံ), knn-vc
format string ဟုတ်ကဲ့ output format: wav (အလိုအလျောက်), mp3, flac

နမူနာ တောင်းဆိုချက်

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

တုံ့ပြန်မှု

ပြောင်းပြန်အသံဖိုင်ကို ဘိုင်နရီဒေတာအဖြစ်ပြန်ပေးသည်

စကားပြော ဘာသာပြန်

POST /v1/speech-translate/

ဘာသာပြန်ဆိုတစ်ဘာသာစကားမှအခြားပြောဆိုအသံ. စကားပြော-to-စာသားကိုပေါင်းစပ်, ဘာသာပြန်ချက်, နှင့်တစ်ဦးတည်းခေါ်ဆိုမှုတွင်စာသား-to-စကားပြော.

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
file file ဟုတ်ကဲ့ မူရင်းဘာသာစကားဖြင့်အသံဖိုင်ကို source. Max 100MB.
target_language string ဟုတ်ကဲ့ ရည်ရွယ်ချက်ဘာသာစကားကုဒ် (ဥပမာ, es, fr, de, ja)
voice string ဟုတ်ကဲ့ ဘာသာပြန်ထုတ်ထွက်အတွက် အသံ။ လွတ်သွားလျှင် အလိုအလျောက်ရွေးသည်။
preserve_voice boolean ဟုတ်ကဲ့ မူရင်းပြောသူ၏ အသံအရည်အသွေးများကို ထိန်းသိမ်းရန် ကြိုးစားပါ

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

စကားပြောမှစကားပြော

POST /v1/speech-to-speech/

စကားပြောစတိုင်ပြောင်းလဲ, ခံစားချက်, သို့မဟုတ်အကြောင်းအရာကိုထိန်းသိမ်းထားစဉ်ပေးပို့. အသံကိုချိန်ညှိဖို့အသုံးဝင်, pacing, နှင့် expressionness.

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
file file ဟုတ်ကဲ့ အရင်းအမြစ်စကားပြောအသံဖိုင်. Max 50MB.
voice string ဟုတ်ကဲ့ ထွက်လာသော စကားအတွက် ရည်ရွယ်ချက် အသံအမည်
model string ဟုတ်ကဲ့ ပုံစံ: openvoice (စံ), chatterbox
emotion string ဟုတ်ကဲ့ ရည်မှန်းချက်စိတ်ခံစားမှု: အလိုအလျောက်, ပျော်ရွှင်, ဝမ်းနည်း, ဒေါသ, စိတ်လှုပ်ရှား
speed float ဟုတ်ကဲ့ အမြန်နှုန်းကိုချိန်ညှိခြင်း။ စံ: 1.0။ အမျိုးအစား: 0.5 မှ 2.0

တုံ့ပြန်မှု

အသံဖိုင်ကို ဘိုင်နရီ ဒေတာအဖြစ် ပြောင်းလဲပေးသည်

အသံကိရိယာများ

တိုးမြှင့်, အသံဖယ်ရှားရေး, stem splitting, နှင့်ပိုမိုများအတွက်အသံ processing endpoints ။

POST /v1/audio/enhance/

အသံအရည်အသွေးကိုတိုးမြှင့်: denoise, ရှင်းလင်းပြတ်သားမှုတိုးတက်ကောင်းမွန်, super resolution ကို။

file fileတိုးမြှင့်ရန် အသံဖိုင်
denoise booleanအသံလျှော့ချခြင်းကို ခွင့်ပြုပါ (စံ: အမှန်)
enhance_clarity booleanပြောဆိုမှု ရှင်းလင်းမှုကို တိုးမြှင့်ပါ (စံ: အမှန်)
super_resolution booleanအသံအရည်အသွေးကို မြှင့်တင်ပါ (စံ: မှားသည်)
strength integer1-3 (အလင်း, အလတ်စား, ခိုင်မာတဲ့). မူလ: 2
POST /v1/audio/separate/

ကွဲပြားခြားနားသော instrumentals မှအဆိုတော်များ (အဆိုတော်များဖယ်ရှားရေး) သို့မဟုတ် stems များသို့ခွဲခြား။

file fileခွဲထုတ်ရန် အသံဖိုင်
model stringdemucs (အလိုအလျောက်) သို့မဟုတ် spleeter
stems integerပင်အရေအတွက်: 2,4,5, သို့မဟုတ်6(စံ: 2)
format stringoutput format: wav, mp3, flac
POST /v1/audio/dereverb/

အသံမှတ်တမ်းများမှ တုံ့ပြန်သံနှင့် ပြန်ကြားသံကို ဖယ်ရှားပါ

file fileစီမံရန် အသံဖိုင်
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ အခမဲ့

key, BPM, နှင့်အချိန်လက်မှတ်ကိုရှာဖွေတွေ့ရှိရန်အသံကိုခွဲခြမ်းစိတ်ဖြာပါ။

file fileဆန်းစစ်ရန် အသံဖိုင်
တုံ့ပြန်မှု
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ အခမဲ့

အသံဖိုင်များကို အမျိုးအစားများအကြား ပြောင်းပါ

file fileပြောင်းရန် အသံဖိုင်
format stringရည်ရွယ်ချက်ပုံစံ: mp3, wav, flac, ogg, m4a, aac
bitrate integerkbps တွင် output ကို bitrate: 64, 128, 192, 256, 320
sample_rate integerနမူနာနှုန်း: 22050, 44100, 48000
channels stringmono သို့မဟုတ် stereo

အသံစကားပြော

POST /v1/voice-chat/

အသံသို့မဟုတ်စာသားကိုပို့ပြီး synthesized စကားပြောနှင့်အတူ AI ကိုတုံ့ပြန်ချက်ကိုလက်ခံရရှိ။

တောင်းဆိုချက်ကိုယ်ထည် (multipart/form-data သို့မဟုတ် JSON)

အညွှန်းကိန်းအမျိုးအစားလိုအပ်သည်ဖော်ပြချက်
audio file ဟုတ်ကဲ့* အသံသွင်း (audio သို့မဟုတ် text လိုအပ်သည်)
text string ဟုတ်ကဲ့* စာသားထည့်သွင်းခြင်း (audio သို့မဟုတ် text လိုအပ်သည်)
voice string ဟုတ်ကဲ့ AI တုံ့ပြန်မှုအတွက် အသံ။ အလိုအလျောက်: af_bella
tts_model string ဟုတ်ကဲ့ တုံ့ပြန်မှုအတွက် TTS မော်ဒယ်။ စံ: kokoro
system_prompt string ဟုတ်ကဲ့ AI အတွက် သတ်မှတ်ထားသော စနစ်မေးခွန်း
conversation_id string ဟုတ်ကဲ့ ရှိပြီးသား စကားပြောခြင်းကို ဆက်လုပ်ပါ

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

အုပ်စုလိုက် TTS

POST /v1/tts/batch/

တူညီ TTS မျိုးဆက်အတွက်စာသားများစွာကိုတင်သွင်း. အားလုံးအလုပ်အကိုင်များပြီးစီးတဲ့အခါ optionally တစ် webhook callback ကိုလက်ခံရရှိ.

သတ်မှတ်ချက်များ

သတ်မှတ်ချက်အမျိုးအစားဖော်ပြချက်
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringbatch ပြီးဆုံးတဲ့အခါ POST ရလဒ်များကို optional URL ကို။

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

GET /v1/tts/batch/result/?batch_id=abc123 နှင့်အတူ Poll တိုးတက်မှု

အသံထည့်သွင်းခြင်း

POST /v1/voice-embed/

ရည်ညွှန်းအသံမှအသံထည့်သွင်းခြင်းကိုကြိုတင်တွက်ချက်ပါ။ နီးနီးကပ်ကပ်အရှိန်အဟုန်မျိုးဆက်အတွက်နောက်ဆက်တွဲအသံကူးယူတောင်းဆိုမှုတွင်ပြန်လာသော embed_id ကိုအသုံးပြုပါ။

သတ်မှတ်ချက်များ

သတ်မှတ်ချက်အမျိုးအစားဖော်ပြချက်
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

ကျန်းမာရေးစစ်ဆေးခြင်း

GET /v1/health/

GPU ဆာဗာအခြေအနေကိုစစ်ဆေးပါ, loaded မော်ဒယ်များ, နှင့်တန်းအရွယ်အစား. အတည်ပြုချက်လိုအပ်ပါတယ်မဟုတ်. 30 စက္ကန့်များအတွက် cached.

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

မော်ဒယ်များစာရင်း

GET /v1/models/

သူတို့ရဲ့စွမ်းဆောင်ရည်များနှင့်အတူရရှိနိုင်မော်ဒယ်များအားလုံး၏စာရင်းကိုပြန်ပေးသည်။

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

အသံစာရင်း

GET /v1/voices/

ရရှိနိုင်သော အသံအားလုံး၏ စာရင်းကို ပြန်ပေးသည်၊ မော်ဒယ် သို့မဟုတ် ဘာသာစကားဖြင့် ရွေးချယ်၍ စစ်ထုတ်သည်။

မေးမြန်းချက် သတ်မှတ်ချက်

အညွှန်းကိန်းအမျိုးအစားဖော်ပြချက်
model string မော်ဒယ် ID ဖြင့်စစ်ထုတ်ပါ (ဥပမာ kokoro)
language string ဘာသာစကားကုဒ်ဖြင့်စစ်ထုတ်ပါ (ဥပမာ - en)
gender string လိင်အလိုက် filter လုပ်ပါ: male, female, neutral

တုံ့ပြန်မှု

JSON တုံ့ပြန်မှု
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

စာတန်းထိုး (SRT / VTT) အသစ်

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

မည်သည့်ပြီးစီး TTS အလုပ်အတွက် synced ဇာတ်ညွှန်းများထုတ်လုပ်. အသံထက် Whisper alignment ကို runs နှင့် SRT သို့မဟုတ် WebVTT ပြန်လာ. ရလဒ်ကိုတူညီ uuid အတွက်ဒုတိယခေါ်ဆိုမှုတစ်ဦးဒစ်ကက်ဖတ်ဖို့ဖြစ်ပါတယ်ဒါကြောင့်ဒီစ်ကက်ပေါ်တွင် cached ထားသည်။

မေးမြန်းချက် သတ်မှတ်ချက်

အညွှန်းကိန်းလိုအပ်သည်ဖော်ပြချက်
uuidဟုတ်ကဲ့/v1/tts/ သို့မဟုတ် /v1/voice-clone/ မှပြန်လာသောအလုပ် UUID။
formatဟုတ်ကဲ့srt (စံ) သို့မဟုတ် vtt
downloadဟုတ်ကဲ့1 Content-Disposition: attachment ပို့ရန်အတွက် browser ကို displays ထက်ပိုပြီးသိမ်းဆည်းထားသည်။
languageဟုတ်ကဲ့တန်းတူပြုမှု မော်ဒယ်ကို ထောက်ပြပါ (မပါရင် အလိုအလျောက် ရှာဖွေ)။
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

အသံထွက် အဘိဓာန် အသစ်

GET POST DELETE /api/v1/pronunciations/

တိကျတဲ့စကားလုံးများကိုထုတ်ဖော်ပြောဆိုရန် TTS အင်ဂျင်ကိုပြောပြပါ. Saved entries auto-apply to every TTS request you make. 200-entry per-account limit.

တောင်းဆိုချက်ကိုယ်ထည် (POST)

အညွှန်းကိန်းအမျိုးအစားဖော်ပြချက်
wordstringအစားထိုးဖို့ စကားလုံး (ဥပမာ GIF, Anthropic)။ စကားလုံး နယ်နိမိတ် တူညီတယ်။
replacementstringပုံစံအတွက်ဘယ်လို spell (ဥပမာ jiff, ann THROP ick).
languagestringရွေးချယ်စရာ ISO code ကို။ Empty = ဘာသာစကားအားလုံးကိုသက်ရောက်သည်။
case_sensitivebooleanစံ false. true အခါအမှန်တကယ်အမှုလိုက်.
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

သင်သည်လည်းသူတို့ကိုကယ်တင်ခြင်းမရှိဘဲတစ်ဦးချင်းစီ-တောင်းဆိုချက် overrides ပေးပို့နိုင်ပါတယ် — တစ်ခုခု object တစ်ခုသို့မဟုတ်အစုလိုက်အဖြစ်မည်သည့် / v1 / tts / call အပေါ် pronunciations ပါဝင်သည် (TTS endpoint params ကြည့်ရှု).

ဆောင်းပါး ပြောပြသူ အသစ်

မည်သည့်ဆောင်းပါးစာမျက်နှာပေါ်တွင်တစ်ဦးတည်း