API ලේඛන

අපගේ REST API සමඟ ඔබේ යෙදුම් වලට TTS.ai ඒකාබද්ධ කරන්න. පහසු සංක්රමණය සඳහා OpenAI අනුකූල ආකෘතිය.

REST API OpenAI අනුකූල JSON ප්රතිචාර විකාශන සහාය

දර්ශකය

TTS.ai API සියලු වේදිකාවේ විශේෂාංග සඳහා වැඩසටහන්ගත ප්රවේශයක් සපයයි: පෙළ-කතා සංස්ලේෂණය, කථා-පෙළ පරිවර්තනය, හඬ ක්ලෝන, ශ්රව්ය වැඩිදියුණු කිරීම, සහ තවත්. API JSON ඉල්ලීම / ප්රතිචාර ශරීර සමඟ සම්මත REST සම්මුති භාවිතා කරයි.

API යතුර

ඔබගේ API යතුර ලබා ගන්න ගිණුම් සැකසුම්. Pro සහ Enterprise සැලසුම් මත ලබා ගත හැක.

මූලික URL

https://api.tts.ai/v1/

අවසරදීම

දරන්නා ටෝකනය හරහා Authorization ශීර්ෂකය

අවසරදීම

නිදහස් තලය - යතුර අවශ්ය නැත. නිශ්චිතව පෝස්ට් /v1/tts/ කිසිදු auth තොරව වැඩ, දක්වා 5,000 අක්ෂර / දින IP එක්, අපගේ නිදහස් ආකෘති ඕනෑම භාවිතා (piper, vits, melotts, kokoro). ලබා ගැනීමට නොමිලේ ගිණුමක් සඳහා ලියාපදිංචි වන්න 15,000 බෝනස් අක්ෂර සහ වාරික ආකෘති වෙත ප්රවේශය.

වාරික ආකෘති හා ඉහළ අනුපාත සීමා සඳහා, මෙම දරන්නා ටෝකනය සමග සහතික Authorization ශීර්ෂකය.

HTTP ශීර්ෂකය
Authorization: Bearer sk-tts-your-api-key-here
ඔබේ API යතුර රහසක් ලෙස තබා ගන්න. සේවාදායකයා-පැත්තේ කේතය එය හුවමාරු කරන්න එපා, පොදු කෞතුකාගාර, හෝ ලඝු-සටහන්. ඔබේ ගිණුම සැකසුම් සිට නිතිපතා යතුරු භ්රමණය.

SDKs

නිල SDKs ඔබේ අයදුම්පතට ඒකාබද්ධ කිරීමට පහසු කරයි TTS.ai. දෙකම විවෘත මූලාශ්රය සහ GitHub හි ලබා ගත හැකිය.

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

මූලික URL

මූලික URL: https://api.tts.ai/v1/

සියලු අවසන් ස්ථානයන් මෙම මූලික URL ලිපිනයට සාපේක්ෂ වේ. උදාහරණයක් ලෙස, TTS අවසන් ස්ථානය:

POST https://api.tts.ai/v1/tts/

අනුපාත සීමා

API අනුපාත සීමා සැලැස්ම අනුව වෙනස් වේ:

සැලැස්ම ඉල්ලීම් / මිනි සමාන්තර උපරිම පෙළ දිග
නිදහස් 10 2 අකුරු 500
ආරම්භකයා 30 3 අකුරු 1,000,000
ප්‍රො 60 5 අකුරු 1,000,000
එන්ටර්ප්‍රයිස් 300 20 අකුරු 50,000

අනුපාතය සීමා ශීර්ෂ සෑම ප්රතිචාරයක් ඇතුළත් වේ: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ණය පිරිවැය

සේවාව පිරිවැය ඒකකය
TTS (නිදහස් ආකෘති: Piper, VITS, MeloTTS) අකුරු 1,000 අකුරු 1,000 කට
TTS (සම්මත ආකෘති: Kokoro, CosyVoice 2, ආදිය) අකුරු 2,000 අකුරු 1,000 කට
TTS (විකල්ප ආකෘති: කටුස්සන්, Chatterbox, ආදිය) අකුරු 4,000 අකුරු 1,000 කට
කථාව පෙළටName අකුරු 2,000 මිනිත්තුවට ශ්‍රව්‍ය
හඬ ක්ලෝන කිරීම අකුරු 4,000 අකුරු 1,000 කට
හඬ වෙනස් කරන්නName 3 ණය මිනිත්තුවට ශ්‍රව්‍ය
ශ්‍රව්‍ය වැඩිදියුණු කිරීම අකුරු 2,000 මිනිත්තුවට ශ්‍රව්‍ය
ශ්රව්ය ඉවත් කිරීම / ශාක බෙදීම අකුරු 3,000-4,000 මිනිත්තුවට ශ්‍රව්‍ය
කථා පරිවර්තනයName අකුරු 5,000 මිනිත්තුවට ශ්‍රව්‍ය
හඬ සංවාදය 3 ණය වරකට
යතුරු සහ BPM සොයන්නා නිදහස් --
ශ්‍රව්‍ය පරිවර්තකය නිදහස් --

පෙළ සිට කථාවName

POST /v1/tts/

පෙළ කටහඬ ශ්‍රව්‍ය බවට පරිවර්තනය කරන්න. ඉල්ලා ඇති සංයුතියේ ශ්‍රව්‍ය ගොනුව ආපසු ලබාදේ.

ඉල්ලුම් ශරීරය

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
model string නෑ ආකෘති අංකය (උදා, kokoro, chatterbox, piper). අතහැර දැමූ විට, අපි ඉල්ලා language සහාය වන ආකෘතිය ස්වයංක්රීයව තෝරා — en/ja/zh/ko/fr/de/it/pt/es/hi/ru සඳහා kokoro, අනෙකුත් සහාය වන භාෂා සඳහා piper (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.).
text string ඔව් කටහඬ බවට පරිවර්තනය කිරීමට පෙළ. ප්රති-අවශ්යතා කැප්: 500 අක්ෂර (නිශ්චිත), 5,000 (නිදහස් ගිණුම), 1,000,000 (ගෙවුම් සැලැස්ම). දිගු ආදාන ස්වයංක්රීය-chunked සේවාදායක පැත්තේ වේ.
voice string ඔව් හඬ ID (පවතින හඬ ලැයිස්තුගත කිරීමට /v1/voices/ භාවිතා කරන්න)
format string නෑ ප්‍රථිදානය සංයුතිය: mp3 (පෙරනිමි), wav, flac, ogg
speed float නෑ කතාබහ කිරීමේ වේග ගුණකය. පෙරනිමි: 1.0. පරාසය: 0.5 සිට 2.0 දක්වා
language string නෑ භාෂා කේතය (උදා, en, es). අතහැර දැමුවහොත් ස්වයංක්‍රීයව හඳුනාගනී.
instructions string නෑ ක්රියා / භාරදීමේ ලකුණු (අක්ෂර ≤500). උදාහරණයක් ලෙස <කේතය> \
pronunciations object | array නෑ ඉල්ලීමකට අනුව උච්චාරණය අභිබවා යයි. {\
stream boolean නෑ ප්‍රවාහ පිලිතුර සක්‍රීය කරන්න. පෙරනිමිය: false

උදාහරණ ඉල්ලීම

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ටැග

අංක, දින, මුදල්, දුරකථන අංක, සහ

විග්‍රහ කරන්නආදානකතා කරන ආකාරය
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31December thirty-first, nineteen ninety-nine
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

දිනය ආකෘතිය mdy ඉංග්‍රීසි සඳහා සහ dmy වෙනත් තැනක පෙරනිමි; format=\ සමඟ අභිබවා

උදාහරණය
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

ප්‍රතිචාරය

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

Full example

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

කථාව පෙළටName

POST /v1/stt/

පෙළට ශ්රව්ය පරිවර්තනය. ස්වයංක්රීය අනාවරණය සමග 99 භාෂා සහාය.

ඉල්ලුම් ශරීරය (multipart/form-data)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
file file ඔව් ශ්රව්ය ගොනුව (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). මැක්ස් 100MB.
model string නෑ STT ආකෘතිය: whisper (පෙරනිමි), faster-whisper, sensevoice
language string නෑ භාෂා කේතය. auto ස්වයංක්‍රීය හඳුනාගැනීම සඳහා (පෙරනිමි).
timestamps boolean නෑ වචන මට්ටමේ කාල මුද්‍රා ඇතුළත් කරන්න. පෙරනිමි: false
diarize boolean නෑ කථික දිනදර්ශනය සක්‍රීය කරන්න. පෙරනිමිය: false

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

හඬ ක්ලෝන කිරීම

POST /v1/tts/clone/

ක්ලෝන හඬ කථාව ජනනය කරන්න. උපුටා ශ්‍රව්‍ය හා පෙළ උඩුගත කරන්න.

ඉල්ලුම් ශරීරය (multipart/form-data)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
reference_audio file ඔව් උපුටා හඬ ශ්රව්ය (10-30 තත්පර නිර්දේශ). මැක්ස් 20MB.
text string ඔව් ක්ලෝන හඬින් කතා කිරීමට පෙළ.
model string නෑ ක්ලෝන් ආකෘතිය: chatterbox (පෙරනිමි), cosyvoice2, gpt-sovits
format string නෑ ප්‍රථිදානය සංයුතිය: mp3 (පෙරනිමි), wav, flac
language string නෑ ඉලක්ක භාෂා කේතය. තෝරාගත් ආකෘතිය විසින් සහාය විය යුතුය.

ප්‍රතිචාරය

ද්විමය දත්ත ලෙස ශ්‍රව්‍ය ගොනුව ආපසු ලබාදේ, TTS අවසාන ස්ථානය ලෙසම.

හඬ වෙනස් කරන්නName

POST /v1/voice-convert/

වෙනත් හඬක් මෙන් ශබ්ද කිරීමට ශ්රව්ය පරිවර්තනය. මූලාශ්රය ශ්රව්ය උඩුගත හා ඉලක්ක හඬ තෝරන්න.

ඉල්ලුම් ශරීරය (multipart/form-data)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
file file ඔව් මූලාශ්රය ශ්රව්ය ගොනුව (MP3, WAV, FLAC). මැක්ස් 50MB.
target_voice string ඔව් පරිවර්තනය කිරීමට ඉලක්ක හඬ ID (පවතින හඬ ලැයිස්තුගත කිරීමට /v1/voices/ භාවිතා කරන්න)
model string නෑ හඬ පරිවර්තන ආකෘතිය: openvoice (පෙරනිමි), knn-vc
format string නෑ ප්‍රථිදාන සංයුතිය: wav (පෙරනිමි), mp3, flac

උදාහරණ ඉල්ලීම

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

ප්‍රතිචාරය

පරිවර්තනය කල ශ්‍රව්‍ය ගොනුව ද්විමය දත්ත ලෙස ආපසු ලබාදේ.

කථා පරිවර්තනයName

POST /v1/speech-translate/

එක් භාෂාවකින් තවත් කතා ශ්රව්ය පරිවර්තනය. එක් ඇමතුමක් දී, පෙළ-කතා, පරිවර්තනය, සහ පෙළ-කතා ඒකාබද්ධ.

ඉල්ලුම් ශරීරය (multipart/form-data)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
file file ඔව් මූලික භාෂාවෙන් මූලාශ්රය ශ්රව්ය ගොනුව. මැක්ස් 100MB.
target_language string ඔව් ඉලක්ක භාෂා කේතය (උදා, es, fr, de, ja)
voice string නෑ පරිවර්තනය සඳහා හඬ. අතහැර දැමූ විට ස්වයංක්‍රීයව තෝරාගැනේ.
preserve_voice boolean නෑ මුල් කථාකරන්නාගේ හඬ ලක්ෂණ රැකගැනීමට උත්සාහ කරන්න. පෙරනිමි: false

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

කථාවෙන් කථාවName

POST /v1/speech-to-speech/

භාෂා ශෛලිය පරිවර්තනය, හැඟීම්, අන්තර්ගතය තබා ගැනීමේදී හෝ බෙදා හැරීම. කටහඬ වෙනස් කිරීම සඳහා ප්රයෝජනවත්, pacing, හා expressionness.

ඉල්ලුම් ශරීරය (multipart/form-data)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
file file ඔව් මූල කථාව ශ්‍රව්‍ය ගොනුව. උපරිම 50MB.
voice string ඔව් ප්‍රථිදානය සඳහා ඉලක්ක හඬ ID
model string නෑ ආකෘතිය: openvoice (පෙරනිමි), chatterbox
emotion string නෑ ඉලක්ක හැඟීම: සමතුලිත, සතුටින්, සතුටින්, කෝපයෙන්, සතුටින්
speed float නෑ වේග ගැලපුම. පෙරනිමි: 1.0. පරාසය: 0.5 සිට 2.0

ප්‍රතිචාරය

පරිවර්තනය කල ශ්‍රව්‍ය ගොනුව ද්විමය දත්ත ලෙස ආපසු ලබාදේ.

ශ්‍රව්‍ය මෙවලම්Name

වැඩි දියුණු කිරීම සඳහා ශ්‍රව්‍ය සැකසුම් අවසාන ස්ථානයන්, කටහඬ ඉවත් කිරීම, ශාක බෙදීම, සහ තවත් බොහෝ දේ.

POST /v1/audio/enhance/

ශ්රව්ය ගුණාත්මකභාවය වැඩි දියුණු: denoise, පැහැදිලිභාවය වැඩි දියුණු, සුපිරි විභේදනය.

file fileවැඩිදියුණු කිරීමට ශ්‍රව්‍ය ගොනුව
denoise booleanශබ්ද ඉවත් කිරීම සක්‍රීය කරන්න (පෙරනිමි: සත්‍ය)
enhance_clarity booleanකථන පැහැදිලිතාව වැඩිදියුණු කරන්න (පෙරනිමි: සත්‍ය)
super_resolution booleanශ්‍රව්‍ය ගුණාත්මකභාවය වැඩි කරන්න (පෙරනිමි: අසත්‍ය)
strength integer1-3 (ආලෝකය, මධ්යම, ශක්තිමත්). පෙරනිමි: 2
POST /v1/audio/separate/

ද්විත්ව ස්ථර (ද්විත්ව ස්ථර) හෝ ද්විත්ව ස්ථර ද්විත්ව ස්ථර ලෙසද හැඳින්වේ.

file fileවෙන් කළ යුතු ශ්‍රව්‍ය ගොනුව
model stringdemucs (පෙරනිමිය) හෝ spleeter
stems integerශාක අංකය: 2, 4, 5, හෝ6(පෙරනිමි: 2)
format stringප්‍රථිදානය සංයුතිය: wav, mp3, flac
POST /v1/audio/dereverb/

ශ්‍රව්‍ය පටිගත කිරීම් වලින් ප්‍රතිබිම්බය සහ ප්‍රතිබිම්බය ඉවත් කරන්න.

file fileසැකසීමට ශ්‍රව්‍ය ගොනුව
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ නිදහස්

ප්රධාන හඳුනා ගැනීමට ශ්රව්ය විශ්ලේෂණය, BPM, සහ කාලය අත්සන්.

file fileවිශ්ලේෂණයට ශ්‍රව්‍ය ගොනුව
ප්‍රතිචාරය
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ නිදහස්

ආකෘති අතර ශ්‍රව්‍ය පරිවර්තනය කරන්න.

file fileපරිවර්තනය කළයුතු ශ්‍රව්‍ය ගොනුව
format stringඉලක්කගත සංයුතිය: mp3, wav, flac, ogg, m4a, aac
bitrate integerkbps හි ප්‍රථිදාන බිට් අනුපාතය: 64, 128, 192, 256, 320
sample_rate integerසාම්පල අනුපාතය: 22050, 44100, 48000
channels stringmono හෝ stereo

හඬ සංවාදය

POST /v1/voice-chat/

ශ්රව්ය හෝ පෙළ යැවීමට හා සංස්ලේෂණය කථාව සමග AI ප්රතිචාරයක් ලබා ගන්න.

ඉල්ලුම් ශරීරය (multipart/form-data හෝ JSON)

පරාමිතීන්වර්ගයඅවශ්යවිස්තරය
audio file නෑ* ශබ්ද ආදාන (audio හෝ text අවශ්යයි)
text string නෑ* පෙළ ආදාන (audio හෝ text අවශ්ය වේ)
voice string නෑ AI ප්‍රතිචාර සඳහා හඬ. පෙරනිමි: af_bella
tts_model string නෑ පිලිතුර සඳහා TTS ආකෘතිය. පෙරනිමි: kokoro
system_prompt string නෑ AI සඳහා රුචි පද්ධති ප්‍රාප්තිය
conversation_id string නෑ පවතින සංවාදයක් දිගටම කරගෙන යන්න

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

කාණ්ඩ TTS

POST /v1/tts/batch/

සමාන්තර TTS ජනනය සඳහා බහු පෙළ ඉදිරිපත්. සියලු වැඩ අවසන් වූ විට webhook callback ලබා ගැනීමට විකල්ප.

පරාමිතීන්

පරාමිතීන්වර්ගයවිස්තරය
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringOptional URL to POST results when batch completes.

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

GET /v1/tts/batch/result/?batch_id=abc123 සමග ඡන්ද ප්රගතිය

හඬ තිළැලි කිරීම

POST /v1/voice-embed/

උපුටා ගැනීම් ශ්රව්ය සිට හඬ embedding පෙර-ගණනය. ආසන්න ක්ෂණික ජනනය සඳහා පසු හඬ ක්ලෝන ඉල්ලීම් තුළ ආපසු embed_id භාවිතා කරන්න.

පරාමිතීන්

පරාමිතීන්වර්ගයවිස්තරය
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

සෞඛ්ය පරීක්ෂාව

GET /v1/health/

GPU සේවාදායක තත්වය, පූර්ණය කළ ආකෘති, සහ පෝලිම් ප්‍රමාණය පරීක්ෂා කරන්න. තහවුරු කිරීමක් අවශ්ය නොවේ. තත්පර 30 ක් සඳහා කැච් කර ඇත.

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

ආකෘති ලැයිස්තුව

GET /v1/models/

ඔවුන්ගේ හැකියාවන් සමග සියලු ලබා ගත හැකි ආකෘති ලැයිස්තුවක් ලබා දෙයි.

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

ශබ්ද ලැයිස්තුව

GET /v1/voices/

ආකෘතිය හෝ භාෂාව මඟින් විකල්ප ලෙස පෙරහන් කරන ලද සියලු භාවිතයට ඇති හඬ ලැයිස්තුවක් ලබා දෙයි.

විමසුම් පරාමිති

පරාමිතීන්වර්ගයවිස්තරය
model string ආකෘති ID මගින් පෙරහන් කරන්න (උදා. kokoro)
language string භාෂා කේතය අනුව පෙරහන් කරන්න (උදා. en)
gender string ලිංගිකත්වය අනුව පෙරහන්: male, female, neutral

ප්‍රතිචාරය

JSON ප්‍රතිචාරය
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

උපසිරැසි (SRT / VTT) නව

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

ඕනෑම සම්පූර්ණ TTS වැඩ සඳහා සමමුහුර්ත උපසිරැසි ජනනය. ශ්රව්ය මත Whisper සකස් කිරීම ධාවනය හා SRT හෝ WebVTT ආපසු. ප්රතිඵලය එම uuid සඳහා දෙවන ඇමතුමක් තැටිය කියවීමට නිසා තැටිය මත කැච් කර ඇත.

විමසුම් පරාමිති

පරාමිතීන්අවශ්යවිස්තරය
uuidඔව්/v1/tts/ හෝ /v1/voice-clone/ මගින් ලැබුණු කාර්ය UUID.
formatනෑsrt (පෙරනිමි) හෝ vtt.
downloadනෑ1 Content-Disposition: attachment යැවීමට බ්‍රව්සරය වඩා දර්ශන සුරැකීමට.
languageනෑසකස් කිරීම ආකෘතිය සඳහා ඉඟියක් (අතුරුදහන් නම් ස්වයංක්රීයව හඳුනා).
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

උච්චාරණ ශබ්දකෝෂය නව

GET POST DELETE /api/v1/pronunciations/

විශේෂිත වචන උච්චාරණය කරන ආකාරය TTS එන්ජිම කියන්න. සුරකින ලද ඇතුළත් කිරීම් ඔබ කරන සෑම TTS ඉල්ලීම ස්වයංක්රීයව අදාළ. 200-එකතුවකට-අනුපාත සීමාව.

ඉල්ලුම් ශරීරය (POST)

පරාමිතීන්වර්ගයවිස්තරය
wordstringඅභිප්‍රේත වචනය (උදා. GIF, Anthropic). වචන-සීමාව ගැලපේ.
replacementstringඋදාහරණයක් ලෙස, jiff, ann THROP ick යනාදී ලෙසින් යෙදිය හැක.
languagestringවිකල්ප ISO කේතය. හිස් = සියලු භාෂා සඳහා අදාළ වේ.
case_sensitivebooleanපෙරනිමි false. true විට හරියටම අකුරු ගැලපෙන.
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

ඔබ ද ඔවුන් සුරැකීම තොරව ඉල්ලා අස්කර හැරීම සඳහා ලකුණු ලබා ගත හැකිය - වස්තුව හෝ ආකෘතිය ලෙස ඕනෑම /v1/tts / ඇමතුමක් මත pronunciations ඇතුළත් (TTS අවසාන ලකුණ params බලන්න).

ලිපිය කියවන්නා නව

ඕනෑම ලිපියක් පිටුව මත තනි