මම කොහොමද API යතුරක් ලබා ගන්නේ?

නොමිලේ TTS.ai ගිණුමක් සඳහා ලියාපදිංචි වන්න, ඉන්පසු ඔබේ ගිණුම දර්ශක පුවරුව වෙත ගමන් කර "API යතුර ජනනය කරන්න" ක්ලික් කරන්න. ඔබේ යතුර sk-tts- සමඟ පෙරනිමිති කරනු ලබන අතර වහාම භාවිතා කළ හැකිය. නොමිලේ ගිණුම් ආරම්භ කිරීමට 15,000 අක්ෂර ලැබේ.

API OpenAI ආකෘතිය සමග අනුකූලද?

ඔව්, අපගේ API OpenAI අනුකූල ඉල්ලීම සහ ප්රතිචාර ආකෘති අනුගමනය කරයි. ඔබ OpenAI TTS API භාවිතා කරන දැනට පවතින කේතය තිබේ නම්, ඔබ අවම කේත වෙනස්කම් සමග මූලික URL සහ API යතුර වෙනස් කිරීමෙන් TTS.ai මාරු කළ හැකිය.

කුමන ක්රමලේඛන භාෂා සහාය දක්වයි?

මෙම REST API HTTP ඉල්ලීම් කළ හැකි ඕනෑම භාෂාවක් සමඟ වැඩ. අපි Python, JavaScript (Node.js සහ බ්රවුසරයක්), cURL, සහ තවත් කේත උදාහරණ ලබා. HTTP සේවාදායක පුස්තකාලයක් (යන්න, රූබි, ජාවා, C #, PHP, ආදිය) සමඟ ඕනෑම භාෂාවක් API භාවිතා කළ හැකිය.

API අනුපාත සීමාවන් මොනවාද?

නොමිලේ ගිණුම්3පැයකට ඉල්ලීම් සීමා කර ඇත. ගෙවන සැලසුම් ඔබේ දායකත්ව මට්ටම මත පදනම්ව ඉහළ සීමා ඇත: ආරම්භක (60 / පැය), වෘත්තීය (300 / පැය), ව්යවසාය (සීමා රහිත). අනුපාතය සීමා ශීර්ෂ සෑම API ප්රතිචාරය ඇතුළත් වේ.

API මිල ක්රියා කරන්නේ කෙසේද?

API භාවිතය ආකෘතිය ස්ථරය හා පෙළ දිග මත පදනම්ව අක්ෂර පරිභෝජනය. නිදහස් ආකෘති භාවිතා0අක්ෂර, සම්මත ආකෘති 2x අක්ෂර භාවිතා, සහ වාරික ආකෘති 4x අක්ෂර භාවිතා. අක්ෂර සියලු ගෙවන සැලසුම් ඇතුළත් වන අතර, ද අක්ෂර පැකේජ ලෙස වෙන් වෙන් වශයෙන් මිලදී ගත හැක.

කුමන අවසාන ලකුණු ලබා ගත හැකිද?

මෙම API අන්තර්ගත වන්නේ text-to-speech (POST /v1/tts/), speech-to-text (POST /v1/transcribe/), voice cloning (POST /v1/voice-clone/), voice conversion (POST /v1/voice-convert/), speech translation (POST /v1/speech-translate/), audio enhancement (POST /v1/audio-enhance/), vocal removal, stem splitting, key and BPM analysis, and more.

කුමන ශ්රව්ය ආකෘති API ආපසු කරන්නේ?

මෙම API පෙරනිමියෙන් WAV සංයුතියෙන් ශ්රව්ය ආපසු ලබා දෙයි. ඔබට response_format පරාමිතිය භාවිතා කරමින් ප්රතිදාන සංයුතිය (mp3, wav, ogg, flac) සඳහන් කළ හැක. වෙබ් යෙදුම් සඳහා MP3 නිර්දේශ කෙරේ, තවදුරටත් ශ්රව්ය සැකසුම් සඳහා WAV.

තත්කාලීන TTS සඳහා ප්රවාහනය API තිබේද?

ඔව්, අපගේ async API ඔබ ප්රතිඵල සඳහා ඡන්ද විමසීම කළ හැකි බව රැකියා UUID ආපසු. Kokoro වැනි සහාය ආකෘති සඳහා, ශ්රව්ය ජනනය සමීප-සත්ය කාලීන යෙදුම් සඳහා ප්රමාණවත් තරම් වේගවත් වේ. ඡන්ද විමසීම අවසන් ස්ථානය සැකසීම සම්පූර්ණ වූ විට ශ්රව්ය URL ආපසු.

මම කොහොමද API දෝෂ හැසිරවීම?

API JSON දෝෂ පණිවිඩ සමග සම්මත HTTP තත්වය කේත (නරක ඉල්ලීම් සඳහා 400, auth දෝෂ සඳහා 401, අනුපාතය සීමා සඳහා 429, සේවාදායක දෝෂ සඳහා 500) ආපසු. නිසි දෝෂ හැසිරවීම සඳහා ප්රතිචාරවල තත්වය කේතය සහ දෝෂ ක්ෂේත්රය සෑම විටම පරීක්ෂා කරන්න.

මට වාණිජ යෙදුම් සඳහා API භාවිතා කළ හැකිද?

ඔව්, API වාණිජමය භාවිතය සඳහා නිර්මාණය කර ඇත. API හරහා ජනනය ශ්රව්ය ඔබේ නිෂ්පාදන, යෙදුම්, සහ සේවා භාවිතා කළ හැකිය. සියලු ආකෘති විවෘත මූලාශ්රය බලපත්ර භාවිතා, හා ජනනය ශ්රව්ය මත අමතර රාජ්ය නොවන ඇත.

වැලි බෝක්කු හෝ පරීක්ෂණ පරිසරයක් තිබේද?

නිදහස්-පන්තියේ ආකෘති (Kokoro, Piper, VITS, MeloTTS) විශිෂ්ට වැලිබෝක්ස් ලෙස සේවය කරයි - ඔවුන් ශුන්ය අක්ෂර භාවිතා කරන අතර සියලු ගිණුම් සඳහා ලබා ගත හැකිය. නිෂ්පාදනය සඳහා වාරික ආකෘති වෙත මාරු වීමට පෙර නිදහස් ආකෘති සමඟ ඔබේ ඒකාබද්ධතාව පරීක්ෂා කරන්න.

මම API හරහා ලබා ගත හැකි හඬ සහ ආකෘති ලැයිස්තුගත කරන්නේ කෙසේද?

පෙරහන් විකල්ප (ආකෘතිය, භාෂාව, ලිංගික) සමග සියලු ලබා ගත හැකි හඬ ලැයිස්තුගත කිරීමට GET / v1 / හඬ භාවිතා කරන්න. ඔවුන්ගේ හැකියාවන් සහ ස්ථර තොරතුරු සමග සියලු ලබා ගත හැකි TTS ආකෘති ලැයිස්තුගත කිරීමට GET / v1 / හඬ භාවිතා කරන්න. අවසන් දෙකම JSON ප්රතිචාර ලබා.

දෝෂය වාර්තා කරන්න / විශේෂාංග ඉල්ලීම

API ලේඛන

අපගේ REST API සමඟ ඔබේ යෙදුම් වලට TTS.ai ඒකාබද්ධ කරන්න. පහසු සංක්රමණය සඳහා OpenAI අනුකූල ආකෘතිය.

REST API OpenAI අනුකූල JSON ප්රතිචාර විකාශන සහාය

දර්ශකය

TTS.ai API සියලු වේදිකාවේ විශේෂාංග සඳහා වැඩසටහන්ගත ප්රවේශයක් සපයයි: පෙළ-කතා සංස්ලේෂණය, කථා-පෙළ පරිවර්තනය, හඬ ක්ලෝන, ශ්රව්ය වැඩිදියුණු කිරීම, සහ තවත්. API JSON ඉල්ලීම / ප්රතිචාර ශරීර සමඟ සම්මත REST සම්මුති භාවිතා කරයි.

API යතුර

ඔබගේ API යතුර ලබා ගන්න ගිණුම් සැකසුම්. Pro සහ Enterprise සැලසුම් මත ලබා ගත හැක.

මූලික URL

https://api.tts.ai/v1/

අවසරදීම

දරන්නා ටෝකනය හරහා Authorization ශීර්ෂකය

අවසරදීම

නිදහස් තලය - යතුර අවශ්ය නැත. නිශ්චිතව පෝස්ට් /v1/tts/ කිසිදු auth තොරව වැඩ, දක්වා 5,000 අක්ෂර / දින IP එක්, අපගේ නිදහස් ආකෘති ඕනෑම භාවිතා (piper, vits, melotts, kokoro). ලබා ගැනීමට නොමිලේ ගිණුමක් සඳහා ලියාපදිංචි වන්න 15,000 බෝනස් අක්ෂර සහ වාරික ආකෘති වෙත ප්රවේශය.

වාරික ආකෘති හා ඉහළ අනුපාත සීමා සඳහා, මෙම දරන්නා ටෝකනය සමග සහතික Authorization ශීර්ෂකය.

HTTP ශීර්ෂකය

Authorization: Bearer sk-tts-your-api-key-here

ඔබේ API යතුර රහසක් ලෙස තබා ගන්න. සේවාදායකයා-පැත්තේ කේතය එය හුවමාරු කරන්න එපා, පොදු කෞතුකාගාර, හෝ ලඝු-සටහන්. ඔබේ ගිණුම සැකසුම් සිට නිතිපතා යතුරු භ්රමණය.

SDKs

නිල SDKs ඔබේ අයදුම්පතට ඒකාබද්ධ කිරීමට පහසු කරයි TTS.ai. දෙකම විවෘත මූලාශ්රය සහ GitHub හි ලබා ගත හැකිය.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

මූලික URL

මූලික URL: https://api.tts.ai/v1/

සියලු අවසන් ස්ථානයන් මෙම මූලික URL ලිපිනයට සාපේක්ෂ වේ. උදාහරණයක් ලෙස, TTS අවසන් ස්ථානය:

POST https://api.tts.ai/v1/tts/

අනුපාත සීමා

API අනුපාත සීමා සැලැස්ම අනුව වෙනස් වේ:

සැලැස්ම	ඉල්ලීම් / මිනි	සමාන්තර	උපරිම පෙළ දිග
නිදහස්	10	2	අකුරු 500
ආරම්භකයා	30	3	අකුරු 1,000,000
ප්‍රො	60	5	අකුරු 1,000,000
එන්ටර්ප්‍රයිස්	300	20	අකුරු 50,000

අනුපාතය සීමා ශීර්ෂ සෑම ප්රතිචාරයක් ඇතුළත් වේ: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ණය පිරිවැය

සේවාව	පිරිවැය	ඒකකය
TTS (නිදහස් ආකෘති: Piper, VITS, MeloTTS)	අකුරු 1,000	අකුරු 1,000 කට
TTS (සම්මත ආකෘති: Kokoro, CosyVoice 2, ආදිය)	අකුරු 2,000	අකුරු 1,000 කට
TTS (විකල්ප ආකෘති: කටුස්සන්, Chatterbox, ආදිය)	අකුරු 4,000	අකුරු 1,000 කට
කථාව පෙළටName	අකුරු 2,000	මිනිත්තුවට ශ්‍රව්‍ය
හඬ ක්ලෝන කිරීම	අකුරු 4,000	අකුරු 1,000 කට
හඬ වෙනස් කරන්නName	3 ණය	මිනිත්තුවට ශ්‍රව්‍ය
ශ්‍රව්‍ය වැඩිදියුණු කිරීම	අකුරු 2,000	මිනිත්තුවට ශ්‍රව්‍ය
ශ්රව්ය ඉවත් කිරීම / ශාක බෙදීම	අකුරු 3,000-4,000	මිනිත්තුවට ශ්‍රව්‍ය
කථා පරිවර්තනයName	අකුරු 5,000	මිනිත්තුවට ශ්‍රව්‍ය
හඬ සංවාදය	3 ණය	වරකට
යතුරු සහ BPM සොයන්නා	නිදහස්	--
ශ්‍රව්‍ය පරිවර්තකය	නිදහස්	--

පෙළ සිට කථාවName

POST /v1/tts/

පෙළ කටහඬ ශ්‍රව්‍ය බවට පරිවර්තනය කරන්න. ඉල්ලා ඇති සංයුතියේ ශ්‍රව්‍ය ගොනුව ආපසු ලබාදේ.

ඉල්ලුම් ශරීරය

පරාමිතීන්	වර්ගය	අවශ්ය	විස්තරය
model	string	නෑ	ආකෘති අංකය (උදා, `kokoro`, `chatterbox`, `piper`). අතහැර දැමූ විට, අපි ඉල්ලා `language` සහාය වන ආකෘතිය ස්වයංක්රීයව තෝරා — en/ja/zh/ko/fr/de/it/pt/es/hi/ru සඳහා `kokoro`, අනෙකුත් සහාය වන භාෂා සඳහා `piper` (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.).
text	string	ඔව්	කටහඬ බවට පරිවර්තනය කිරීමට පෙළ. ප්රති-අවශ්යතා කැප්: 500 අක්ෂර (නිශ්චිත), 5,000 (නිදහස් ගිණුම), 1,000,000 (ගෙවුම් සැලැස්ම). දිගු ආදාන ස්වයංක්රීය-chunked සේවාදායක පැත්තේ වේ.
voice	string	ඔව්	හඬ ID (පවතින හඬ ලැයිස්තුගත කිරීමට `/v1/voices/` භාවිතා කරන්න)
format	string	නෑ	ප්‍රථිදානය සංයුතිය: `mp3` (පෙරනිමි), `wav`, `flac`, `ogg`
speed	float	නෑ	කතාබහ කිරීමේ වේග ගුණකය. පෙරනිමි: `1.0`. පරාසය: `0.5` සිට `2.0` දක්වා
language	string	නෑ	භාෂා කේතය (උදා, `en`, `es`). අතහැර දැමුවහොත් ස්වයංක්‍රීයව හඳුනාගනී.
instructions	string	නෑ	ක්රියා / භාරදීමේ ලකුණු (අක්ෂර ≤500). උදාහරණයක් ලෙස <කේතය> \
pronunciations	object \| array	නෑ	ඉල්ලීමකට අනුව උච්චාරණය අභිබවා යයි. `{\`
stream	boolean	නෑ	ප්‍රවාහ පිලිතුර සක්‍රීය කරන්න. පෙරනිමිය: `false`

උදාහරණ ඉල්ලීම

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ටැග

අංක, දින, මුදල්, දුරකථන අංක, සහ


                    
                        
                            විග්‍රහ කරන්න ආදාන කතා කරන ආකාරය
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 December thirty-first, nineteen ninety-nine
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

විග්‍රහ කරන්න	ආදාන	කතා කරන ආකාරය
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	December thirty-first, nineteen ninety-nine
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                දිනය ආකෘතිය mdy ඉංග්‍රීසි සඳහා සහ dmy වෙනත් තැනක පෙරනිමි; format=\ සමඟ අභිබවා

                
                    
                        උදාහරණය
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                ප්‍රතිචාරය
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                Full example
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                කථාව පෙළටName
                
                    POST /v1/stt/
                
                පෙළට ශ්රව්ය පරිවර්තනය. ස්වයංක්රීය අනාවරණය සමග 99 භාෂා සහාය.

                ඉල්ලුම් ශරීරය (multipart/form-data)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                file
                                file
                                ඔව්
                                ශ්රව්ය ගොනුව (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). මැක්ස් 100MB.
                            
                            
                                model
                                string
                                නෑ
                                STT ආකෘතිය: whisper (පෙරනිමි), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                නෑ
                                භාෂා කේතය. auto ස්වයංක්‍රීය හඳුනාගැනීම සඳහා (පෙරනිමි).
                            
                            
                                timestamps
                                boolean
                                නෑ
                                වචන මට්ටමේ කාල මුද්‍රා ඇතුළත් කරන්න. පෙරනිමි: false
                            
                            
                                diarize
                                boolean
                                නෑ
                                කථික දිනදර්ශනය සක්‍රීය කරන්න. පෙරනිමිය: false
                            
                        
                    
                

                ප්‍රතිචාරය
                
                    
                        JSON ප්‍රතිචාරය
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                හඬ ක්ලෝන කිරීම
                
                    POST /v1/tts/clone/
                
                ක්ලෝන හඬ කථාව ජනනය කරන්න. උපුටා ශ්‍රව්‍ය හා පෙළ උඩුගත කරන්න.

                ඉල්ලුම් ශරීරය (multipart/form-data)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                reference_audio
                                file
                                ඔව්
                                උපුටා හඬ ශ්රව්ය (10-30 තත්පර නිර්දේශ). මැක්ස් 20MB.
                            
                            
                                text
                                string
                                ඔව්
                                ක්ලෝන හඬින් කතා කිරීමට පෙළ.
                            
                            
                                model
                                string
                                නෑ
                                ක්ලෝන් ආකෘතිය: chatterbox (පෙරනිමි), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                නෑ
                                ප්‍රථිදානය සංයුතිය: mp3 (පෙරනිමි), wav, flac
                            
                            
                                language
                                string
                                නෑ
                                ඉලක්ක භාෂා කේතය. තෝරාගත් ආකෘතිය විසින් සහාය විය යුතුය.
                            
                        
                    
                

                ප්‍රතිචාරය
                ද්විමය දත්ත ලෙස ශ්‍රව්‍ය ගොනුව ආපසු ලබාදේ, TTS අවසාන ස්ථානය ලෙසම.
            

            
            
                හඬ වෙනස් කරන්නName
                
                    POST /v1/voice-convert/
                
                වෙනත් හඬක් මෙන් ශබ්ද කිරීමට ශ්රව්ය පරිවර්තනය. මූලාශ්රය ශ්රව්ය උඩුගත හා ඉලක්ක හඬ තෝරන්න.

                ඉල්ලුම් ශරීරය (multipart/form-data)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                file
                                file
                                ඔව්
                                මූලාශ්රය ශ්රව්ය ගොනුව (MP3, WAV, FLAC). මැක්ස් 50MB.
                            
                            
                                target_voice
                                string
                                ඔව්
                                පරිවර්තනය කිරීමට ඉලක්ක හඬ ID (පවතින හඬ ලැයිස්තුගත කිරීමට /v1/voices/ භාවිතා කරන්න)
                            
                            
                                model
                                string
                                නෑ
                                හඬ පරිවර්තන ආකෘතිය: openvoice (පෙරනිමි), knn-vc
                            
                            
                                format
                                string
                                නෑ
                                ප්‍රථිදාන සංයුතිය: wav (පෙරනිමි), mp3, flac
                            
                        
                    
                

                උදාහරණ ඉල්ලීම
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                ප්‍රතිචාරය
                පරිවර්තනය කල ශ්‍රව්‍ය ගොනුව ද්විමය දත්ත ලෙස ආපසු ලබාදේ.
            

            
            
                කථා පරිවර්තනයName
                
                    POST /v1/speech-translate/
                
                එක් භාෂාවකින් තවත් කතා ශ්රව්ය පරිවර්තනය. එක් ඇමතුමක් දී, පෙළ-කතා, පරිවර්තනය, සහ පෙළ-කතා ඒකාබද්ධ.

                ඉල්ලුම් ශරීරය (multipart/form-data)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                file
                                file
                                ඔව්
                                මූලික භාෂාවෙන් මූලාශ්රය ශ්රව්ය ගොනුව. මැක්ස් 100MB.
                            
                            
                                target_language
                                string
                                ඔව්
                                ඉලක්ක භාෂා කේතය (උදා, es, fr, de, ja)
                            
                            
                                voice
                                string
                                නෑ
                                පරිවර්තනය සඳහා හඬ. අතහැර දැමූ විට ස්වයංක්‍රීයව තෝරාගැනේ.
                            
                            
                                preserve_voice
                                boolean
                                නෑ
                                මුල් කථාකරන්නාගේ හඬ ලක්ෂණ රැකගැනීමට උත්සාහ කරන්න. පෙරනිමි: false
                            
                        
                    
                

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                කථාවෙන් කථාවName
                
                    POST /v1/speech-to-speech/
                
                භාෂා ශෛලිය පරිවර්තනය, හැඟීම්, අන්තර්ගතය තබා ගැනීමේදී හෝ බෙදා හැරීම. කටහඬ වෙනස් කිරීම සඳහා ප්රයෝජනවත්, pacing, හා expressionness.

                ඉල්ලුම් ශරීරය (multipart/form-data)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                file
                                file
                                ඔව්
                                මූල කථාව ශ්‍රව්‍ය ගොනුව. උපරිම 50MB.
                            
                            
                                voice
                                string
                                ඔව්
                                ප්‍රථිදානය සඳහා ඉලක්ක හඬ ID
                            
                            
                                model
                                string
                                නෑ
                                ආකෘතිය: openvoice (පෙරනිමි), chatterbox
                            
                            
                                emotion
                                string
                                නෑ
                                ඉලක්ක හැඟීම: සමතුලිත, සතුටින්, සතුටින්, කෝපයෙන්, සතුටින්
                            
                            
                                speed
                                float
                                නෑ
                                වේග ගැලපුම. පෙරනිමි: 1.0. පරාසය: 0.5 සිට 2.0
                            
                        
                    
                

                ප්‍රතිචාරය
                පරිවර්තනය කල ශ්‍රව්‍ය ගොනුව ද්විමය දත්ත ලෙස ආපසු ලබාදේ.
            

            
            
                ශ්‍රව්‍ය මෙවලම්Name
                වැඩි දියුණු කිරීම සඳහා ශ්‍රව්‍ය සැකසුම් අවසාන ස්ථානයන්, කටහඬ ඉවත් කිරීම, ශාක බෙදීම, සහ තවත් බොහෝ දේ.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        ශ්රව්ය ගුණාත්මකභාවය වැඩි දියුණු: denoise, පැහැදිලිභාවය වැඩි දියුණු, සුපිරි විභේදනය.
                        
                            
                                
                                    file file වැඩිදියුණු කිරීමට ශ්‍රව්‍ය ගොනුව
                                    denoise boolean ශබ්ද ඉවත් කිරීම සක්‍රීය කරන්න (පෙරනිමි: සත්‍ය)
                                    enhance_clarity boolean කථන පැහැදිලිතාව වැඩිදියුණු කරන්න (පෙරනිමි: සත්‍ය)
                                    super_resolution boolean ශ්‍රව්‍ය ගුණාත්මකභාවය වැඩි කරන්න (පෙරනිමි: අසත්‍ය)
                                    strength integer 1-3 (ආලෝකය, මධ්යම, ශක්තිමත්). පෙරනිමි: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        ද්විත්ව ස්ථර (ද්විත්ව ස්ථර) හෝ ද්විත්ව ස්ථර ද්විත්ව ස්ථර ලෙසද හැඳින්වේ.
                        
                            
                                
                                    file file වෙන් කළ යුතු ශ්‍රව්‍ය ගොනුව
                                    model string demucs (පෙරනිමිය) හෝ spleeter
                                    stems integer ශාක අංකය: 2, 4, 5, හෝ6(පෙරනිමි: 2)
                                    format string ප්‍රථිදානය සංයුතිය: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        ශ්‍රව්‍ය පටිගත කිරීම් වලින් ප්‍රතිබිම්බය සහ ප්‍රතිබිම්බය ඉවත් කරන්න.
                        
                            
                                
                                    file file සැකසීමට ශ්‍රව්‍ය ගොනුව
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            නිදහස්
                        
                        ප්රධාන හඳුනා ගැනීමට ශ්රව්ය විශ්ලේෂණය, BPM, සහ කාලය අත්සන්.
                        
                            
                                
                                    file file විශ්ලේෂණයට ශ්‍රව්‍ය ගොනුව
                                
                            
                        
                        
                            ප්‍රතිචාරය
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            නිදහස්
                        
                        ආකෘති අතර ශ්‍රව්‍ය පරිවර්තනය කරන්න.
                        
                            
                                
                                    file file පරිවර්තනය කළයුතු ශ්‍රව්‍ය ගොනුව
                                    format string ඉලක්කගත සංයුතිය: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer kbps හි ප්‍රථිදාන බිට් අනුපාතය: 64, 128, 192, 256, 320
                                    sample_rate integer සාම්පල අනුපාතය: 22050, 44100, 48000
                                    channels string mono හෝ stereo
                                
                            
                        
                    
                
            

            
            
                හඬ සංවාදය
                
                    POST /v1/voice-chat/
                
                ශ්රව්ය හෝ පෙළ යැවීමට හා සංස්ලේෂණය කථාව සමග AI ප්රතිචාරයක් ලබා ගන්න.

                ඉල්ලුම් ශරීරය (multipart/form-data හෝ JSON)
                
                    
                        
                            පරාමිතීන් වර්ගය අවශ්ය විස්තරය
                        
                        
                            
                                audio
                                file
                                නෑ*
                                ශබ්ද ආදාන (audio හෝ text අවශ්යයි)
                            
                            
                                text
                                string
                                නෑ*
                                පෙළ ආදාන (audio හෝ text අවශ්ය වේ)
                            
                            
                                voice
                                string
                                නෑ
                                AI ප්‍රතිචාර සඳහා හඬ. පෙරනිමි: af_bella
                            
                            
                                tts_model
                                string
                                නෑ
                                පිලිතුර සඳහා TTS ආකෘතිය. පෙරනිමි: kokoro
                            
                            
                                system_prompt
                                string
                                නෑ
                                AI සඳහා රුචි පද්ධති ප්‍රාප්තිය
                            
                            
                                conversation_id
                                string
                                නෑ
                                පවතින සංවාදයක් දිගටම කරගෙන යන්න
                            
                        
                    
                

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                කාණ්ඩ TTS
                
                    POST /v1/tts/batch/
                
                සමාන්තර TTS ජනනය සඳහා බහු පෙළ ඉදිරිපත්. සියලු වැඩ අවසන් වූ විට webhook callback ලබා ගැනීමට විකල්ප.

                පරාමිතීන්
                
                    පරාමිතීන් වර්ගය විස්තරය
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string Optional URL to POST results when batch completes.
                    
                

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                GET /v1/tts/batch/result/?batch_id=abc123 සමග ඡන්ද ප්රගතිය
            

            
            
                හඬ තිළැලි කිරීම
                
                    POST /v1/voice-embed/
                
                උපුටා ගැනීම් ශ්රව්ය සිට හඬ embedding පෙර-ගණනය. ආසන්න ක්ෂණික ජනනය සඳහා පසු හඬ ක්ලෝන ඉල්ලීම් තුළ ආපසු embed_id භාවිතා කරන්න.

                පරාමිතීන්
                
                    පරාමිතීන් වර්ගය විස්තරය
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                සෞඛ්ය පරීක්ෂාව
                
                    GET /v1/health/
                
                GPU සේවාදායක තත්වය, පූර්ණය කළ ආකෘති, සහ පෝලිම් ප්‍රමාණය පරීක්ෂා කරන්න. තහවුරු කිරීමක් අවශ්ය නොවේ. තත්පර 30 ක් සඳහා කැච් කර ඇත.

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ආකෘති ලැයිස්තුව
                
                    GET /v1/models/
                
                ඔවුන්ගේ හැකියාවන් සමග සියලු ලබා ගත හැකි ආකෘති ලැයිස්තුවක් ලබා දෙයි.

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                ශබ්ද ලැයිස්තුව
                
                    GET /v1/voices/
                
                ආකෘතිය හෝ භාෂාව මඟින් විකල්ප ලෙස පෙරහන් කරන ලද සියලු භාවිතයට ඇති හඬ ලැයිස්තුවක් ලබා දෙයි.

                විමසුම් පරාමිති
                
                    
                        
                            පරාමිතීන් වර්ගය විස්තරය
                        
                        
                            
                                model
                                string
                                ආකෘති ID මගින් පෙරහන් කරන්න (උදා. kokoro)
                            
                            
                                language
                                string
                                භාෂා කේතය අනුව පෙරහන් කරන්න (උදා. en)
                            
                            
                                gender
                                string
                                ලිංගිකත්වය අනුව පෙරහන්: male, female, neutral
                            
                        
                    
                

                ප්‍රතිචාරය
                
                    JSON ප්‍රතිචාරය
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                උපසිරැසි (SRT / VTT) නව
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                ඕනෑම සම්පූර්ණ TTS වැඩ සඳහා සමමුහුර්ත උපසිරැසි ජනනය. ශ්රව්ය මත Whisper සකස් කිරීම ධාවනය හා SRT හෝ WebVTT ආපසු. ප්රතිඵලය එම uuid සඳහා දෙවන ඇමතුමක් තැටිය කියවීමට නිසා තැටිය මත කැච් කර ඇත.
                විමසුම් පරාමිති
                
                    
                        පරාමිතීන් අවශ්ය විස්තරය
                        
                            uuid ඔව් /v1/tts/ හෝ /v1/voice-clone/ මගින් ලැබුණු කාර්ය UUID.
                            format නෑ srt (පෙරනිමි) හෝ vtt.
                            download නෑ 1 Content-Disposition: attachment යැවීමට බ්‍රව්සරය වඩා දර්ශන සුරැකීමට.
                            language නෑ සකස් කිරීම ආකෘතිය සඳහා ඉඟියක් (අතුරුදහන් නම් ස්වයංක්රීයව හඳුනා).
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                උච්චාරණ ශබ්දකෝෂය නව
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                විශේෂිත වචන උච්චාරණය කරන ආකාරය TTS එන්ජිම කියන්න. සුරකින ලද ඇතුළත් කිරීම් ඔබ කරන සෑම TTS ඉල්ලීම ස්වයංක්රීයව අදාළ. 200-එකතුවකට-අනුපාත සීමාව.
                ඉල්ලුම් ශරීරය (POST)
                
                    
                        පරාමිතීන් වර්ගය විස්තරය
                        
                            word string අභිප්‍රේත වචනය (උදා. GIF, Anthropic). වචන-සීමාව ගැලපේ.
                            replacement string උදාහරණයක් ලෙස, jiff, ann THROP ick යනාදී ලෙසින් යෙදිය හැක.
                            language string විකල්ප ISO කේතය. හිස් = සියලු භාෂා සඳහා අදාළ වේ.
                            case_sensitive boolean පෙරනිමි false. true විට හරියටම අකුරු ගැලපෙන.
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                ඔබ ද ඔවුන් සුරැකීම තොරව ඉල්ලා අස්කර හැරීම සඳහා ලකුණු ලබා ගත හැකිය - වස්තුව හෝ ආකෘතිය ලෙස ඕනෑම /v1/tts / ඇමතුමක් මත pronunciations ඇතුළත් (TTS අවසාන ලකුණ params බලන්න).
            

            
            
                ලිපිය කියවන්නා නව
                ඕනෑම ලිපියක් පිටුව මත තනි

පරාමිතීන්	වර්ගය	අවශ්ය	විස්තරය
file	file	ඔව්	ශ්රව්ය ගොනුව (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). මැක්ස් 100MB.
model	string	නෑ	STT ආකෘතිය: `whisper` (පෙරනිමි), `faster-whisper`, `sensevoice`
language	string	නෑ	භාෂා කේතය. `auto` ස්වයංක්‍රීය හඳුනාගැනීම සඳහා (පෙරනිමි).
timestamps	boolean	නෑ	වචන මට්ටමේ කාල මුද්‍රා ඇතුළත් කරන්න. පෙරනිමි: `false`
diarize	boolean	නෑ	කථික දිනදර්ශනය සක්‍රීය කරන්න. පෙරනිමිය: `false`

පරාමිතීන්	වර්ගය	අවශ්ය	විස්තරය
reference_audio	file	ඔව්	උපුටා හඬ ශ්රව්ය (10-30 තත්පර නිර්දේශ). මැක්ස් 20MB.
text	string	ඔව්	ක්ලෝන හඬින් කතා කිරීමට පෙළ.
model	string	නෑ	ක්ලෝන් ආකෘතිය: `chatterbox` (පෙරනිමි), `cosyvoice2`, `gpt-sovits`
format	string	නෑ	ප්‍රථිදානය සංයුතිය: `mp3` (පෙරනිමි), `wav`, `flac`
language	string	නෑ	ඉලක්ක භාෂා කේතය. තෝරාගත් ආකෘතිය විසින් සහාය විය යුතුය.

file file	වැඩිදියුණු කිරීමට ශ්‍රව්‍ය ගොනුව
denoise boolean	ශබ්ද ඉවත් කිරීම සක්‍රීය කරන්න (පෙරනිමි: සත්‍ය)
enhance_clarity boolean	කථන පැහැදිලිතාව වැඩිදියුණු කරන්න (පෙරනිමි: සත්‍ය)
super_resolution boolean	ශ්‍රව්‍ය ගුණාත්මකභාවය වැඩි කරන්න (පෙරනිමි: අසත්‍ය)
strength integer	1-3 (ආලෝකය, මධ්යම, ශක්තිමත්). පෙරනිමි: 2

file file	වෙන් කළ යුතු ශ්‍රව්‍ය ගොනුව
model string	`demucs` (පෙරනිමිය) හෝ `spleeter`
stems integer	ශාක අංකය: 2, 4, 5, හෝ6(පෙරනිමි: 2)
format string	ප්‍රථිදානය සංයුතිය: `wav`, `mp3`, `flac`

file file	සැකසීමට ශ්‍රව්‍ය ගොනුව
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	පරිවර්තනය කළයුතු ශ්‍රව්‍ය ගොනුව
format string	ඉලක්කගත සංයුතිය: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	kbps හි ප්‍රථිදාන බිට් අනුපාතය: 64, 128, 192, 256, 320
sample_rate integer	සාම්පල අනුපාතය: 22050, 44100, 48000
channels string	`mono` හෝ `stereo`

පරාමිතීන්	වර්ගය	අවශ්ය	විස්තරය
audio	file	නෑ*	ශබ්ද ආදාන (`audio` හෝ `text` අවශ්යයි)
text	string	නෑ*	පෙළ ආදාන (`audio` හෝ `text` අවශ්ය වේ)
voice	string	නෑ	AI ප්‍රතිචාර සඳහා හඬ. පෙරනිමි: `af_bella`
tts_model	string	නෑ	පිලිතුර සඳහා TTS ආකෘතිය. පෙරනිමි: `kokoro`
system_prompt	string	නෑ	AI සඳහා රුචි පද්ධති ප්‍රාප්තිය
conversation_id	string	නෑ	පවතින සංවාදයක් දිගටම කරගෙන යන්න

පරාමිතීන්	වර්ගය	විස්තරය
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	Optional URL to POST results when batch completes.

පරාමිතීන්	වර්ගය	විස්තරය
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

පරාමිතීන්	වර්ගය	විස්තරය
model	string	ආකෘති ID මගින් පෙරහන් කරන්න (උදා. `kokoro`)
language	string	භාෂා කේතය අනුව පෙරහන් කරන්න (උදා. `en`)
gender	string	ලිංගිකත්වය අනුව පෙරහන්: `male`, `female`, `neutral`

පරාමිතීන්	අවශ්ය	විස්තරය
uuid	ඔව්	/v1/tts/ හෝ /v1/voice-clone/ මගින් ලැබුණු කාර්ය UUID.
format	නෑ	`srt` (පෙරනිමි) හෝ `vtt`.
download	නෑ	`1` `Content-Disposition: attachment` යැවීමට බ්‍රව්සරය වඩා දර්ශන සුරැකීමට.
language	නෑ	සකස් කිරීම ආකෘතිය සඳහා ඉඟියක් (අතුරුදහන් නම් ස්වයංක්රීයව හඳුනා).

පරාමිතීන්	වර්ගය	විස්තරය
word	string	අභිප්‍රේත වචනය (උදා. `GIF`, `Anthropic`). වචන-සීමාව ගැලපේ.
replacement	string	උදාහරණයක් ලෙස, `jiff`, `ann THROP ick` යනාදී ලෙසින් යෙදිය හැක.
language	string	විකල්ප ISO කේතය. හිස් = සියලු භාෂා සඳහා අදාළ වේ.
case_sensitive	boolean	පෙරනිමි `false`. `true` විට හරියටම අකුරු ගැලපෙන.