API ڪوڊ ڪيئن حاصل ڪجي؟

مفت TTS.ai اڪائونٽ لاءِ رجسٽر ڪريو، پوءِ پنهنجي اڪائونٽ ڊيش بورڊ ڏانهن وڃو ۽ ڪلڪ ڪريو "API ڪوڊ ٺاهيو." توهان جي ڪوڊ کي sk-tts سان اڳواڻ ڪيو ويندو ۽ فوري طور تي استعمال ڪري سگهجي ٿو. مفت اڪائونٽس شروع ڪرڻ لاءِ 50 ڪرنٽ حاصل ڪندا.

ڇا API OpenAI جي فارميٽ سان مطابقت رکي ٿو؟

ھائو، اسان جو API OpenAI-compatible درخواست ۽ جواب فارميٽن تي عمل ڪري ٿو. جيڪڏھن توھان وٽ موجود ڪوڊ آھي جيڪو OpenAI's TTS API استعمال ڪري ٿو، توھان TTS.ai تي تبديل ڪري سگھو ٿا بنياد URL ۽ API کي تبديل ڪري ٿو گھٽ ۾ گھٽ ڪوڊ تبديلين سان.

ڪھڙيون پروگرامنگ ٻوليون مدد ڏنل آھن؟

REST API ڪنهن به ٻولي سان ڪم ڪري ٿو جيڪو HTTP درخواستون ڪري سگهي ٿو. اسان Python، JavaScript (Node.js ۽ برائوزر)، cURL، ۽ وڌيڪ ۾ ڪوڊ جا مثال فراهم ڪريون ٿا. HTTP ڪلينٽ لائبريري (Go، Ruby، Java، C #، PHP، وغيره) سان ڪنهن به ٻولي API استعمال ڪري سگهي ٿي.

API جي شرح جون حدون ڇا آهن؟

مفت اڪائونٽس ڪلاڪ ۾ 3 درخواستن تائين محدود آهن. ادا ڪيل منصوبن ۾ توهان جي سبسڪرپشن سطح تي ٻڌل وڌيڪ حدون آهن: شروع (60 / ڪلاڪ)، پروفيشنل (300 / ڪلاڪ)، انٽرپرائز (نامحدود). هر API جواب ۾ حد جي حدن کي شامل ڪيو ويو آهي.

API جي قيمت ۽ ڪرڊٽ ڪيئن ڪم ڪري ٿو؟

API استعمال ڪريڊٽ استعمال ڪري ٿو ماڊل ٽائر ۽ متن جي ڊيگهه تي ٻڌل. مفت ماڊل0ڪريڊٽ استعمال ڪن ٿا، معياري ماڊل 2 ڪريڊٽ استعمال ڪن ٿا هر 1K ڪردار، ۽ پريميئم ماڊل 4 ڪريڊٽ استعمال ڪن ٿا هر 1K ڪردار. ڪريڊٽ سڀني ادا ڪيل منصوبن ۾ شامل آهن ۽ جدا جدا خريد ڪري سگھجن ٿا.

ڪھڙا آخري نقطا موجود آھن؟

API متن کان ڳالهائڻ (POST /v1/tts/)، ڳالهائڻ کان متن (POST /v1/transcribe/)، آواز جي کلوننگ (POST /v1/voice-clone/)، آواز جي تبديلي (POST /v1/voice-convert/)، ڳالهائڻ جو ترجمو (POST /v1/speech-translate/)، آڊيو وڌائڻ (POST /v1/audio-enhance/)، آواز ختم ڪرڻ، سٽم ورهاڻ، کيسي ۽ BPM تشخيص، ۽ وڌيڪ لاءِ انتهائي نقطا فراهم ڪري ٿو.

API ڪھڙيون آڊيو شڪلون موٽائي ٿو؟

API آڊيو کي WAV فارميٽ ۾ واپس ڪري ٿو. توهان جواب_ فارميٽ پاراميٽر استعمال ڪري آڊيو جو فارميٽ (mp3, wav, ogg, flac) بيان ڪري سگهو ٿا. MP3 ويب ايپليڪيشنن لاءِ صلاح ڏنل آهي، WAV وڌيڪ آڊيو پروسيسنگ لاءِ.

ڇا ريئل-ٽائم TTS لاءِ اسٽريمنگ API موجود آهي؟

ھائو، اسان جو async API هڪ ڪم UUID موٽائي ٿو جنھن کي توھان نتيجن لاءِ پوئلڳ ڪري سگھو ٿا. مدد ڏنل ماڊلن جھڙوڪ Kokoro لاءِ، آڊيو پيدا ڪرڻ تقريبن حقيقي وقت جي ايپليڪيشنن لاءِ ڪافي تيز آھي. پوئلڳ آخري نقطو آڊيو URL موٽائي ٿو جڏھن پروسيس مڪمل ٿئي ٿو.

آءٌ API ۾ غلطين کي ڪيئن سنڀاليان؟

API معياري HTTP حالت ڪوڊ موٽائي ٿو (400 خراب درخواستن لاءِ، 401 تصديق جي غلطين لاءِ، 429 شرح حدن لاءِ، 500 سرور جي غلطين لاءِ) JSON غلطي جي پيغامن سان. هميشه حالت ڪوڊ ۽ غلطي جي ميدان کي جوابن ۾ صحيح غلطي جي سنڀال لاءِ چيڪ ڪريو.

آءٌ تجارتي ايپليڪيشنن لاءِ API استعمال ڪري سگهان ٿو؟

ھائو، API تجارتي استعمال لاءِ ٺاهيو ويو آهي. API ذريعي پيدا ڪيل آڊيو کي توهان جي شين، ايپليڪيشنن ۽ سروسز ۾ استعمال ڪري سگهجي ٿو. سڀ ماڊل اوپن سورس لائسنس استعمال ڪن ٿا، ۽ پيدا ڪيل آڊيو تي اضافي رائٽس نه آهن.

ڇا ڪو رڻ باڪس يا ٽيسٽ ماحول موجود آهي؟

مفت-ترتيب ماڊل (Kokoro, Piper, VITS, MeloTTS) هڪ بهترين sandbox طور ڪم ڪن ٿا - اهي صفر ڪريڊٽس استعمال ڪن ٿا ۽ سڀني اڪائونٽن لاءِ دستياب آهن. پيداوار جي استعمال لاءِ پريميئم ماڊل ۾ تبديل ٿيڻ کان اڳ مفت ماڊل سان توهان جي گڏجاڻي کي آزمايو.

آءٌ API ذريعي دستياب آوازن ۽ ماڊلن جي فهرست ڪيئن ٺاهيان؟

GET /v1/voices استعمال ڪريو سڀني دستياب آوازن جي فهرست ٺاهڻ لاءِ فلٽرنگ اختيارن سان (ماڊل، ٻولي، جنس). GET /v1/models استعمال ڪريو سڀني دستياب TTS ماڊلن جي فهرست ٺاهڻ لاءِ سندن صلاحيتن ۽ طبقي جي معلومات سان. ٻئي آخري نقطا JSON جواب موٽائيندا.

ڦيٿي / خاصيت جي درخواست رپورٽ ڪريو

API دستاويز

اسان جي REST API سان TTS.ai کي پنهنجي ايپليڪيشنن ۾ شامل ڪريو. آسان منتقلي لاءِ OpenAI-compatible فارميٽ.

REST API OpenAI مطابقت رکندڙ JSON جواب اسٽريمنگ مدد

نظرثاني

TTS.ai API سڀني پليٽ فارم جي خاصيتن تائين پروگرامنگ رسائي فراهم ڪري ٿو: متن-to-speech synthesis، ڳالهائڻ-to-text transcription، آواز ڪلوننگ، آڊيو وڌائڻ، ۽ وڌيڪ. API JSON درخواست / جواب جي جسمن سان معياري REST معاهدن کي استعمال ڪري ٿو.

API ڪوڊ

پنھنجو API ڪوڊ ھتان حاصل ڪريو اڪائونٽ جون ترتيبون. پرو ۽ انٽرپرائز منصوبن تي دستياب.

بنياد URL

https://api.tts.ai/v1/

تصديق

بيئر ٽوڪين ذريعي Authorization هيڊر

تصديق

مفت درجو — ڪابه ڪَچُ گھرجي. نامعلوم پوسٽون /v1/tts/ ڪنهن به auth کانسواءِ ڪم ڪريو، 5000 تائين ڪارڪن/ڏينهن تائين هر IP، اسان جي ڪنهن به مفت ماڊل کي استعمال ڪندي (piper, vits, melotts, kokoro). 15,000 بونس ڪارڪنن ۽ پريميئم ماڊلز تائين رسائي حاصل ڪرڻ لاءِ مفت اڪائونٽ لاءِ رجسٽر ڪريو.

سڀني API درخواستن کي توثيق جي ضرورت آھي Authorization هيڊر.

HTTP هيڊر

Authorization: Bearer sk-tts-your-api-key-here

پنھنجي API کي ڳجھو رکو. ان کي ڪلائنٽ پاسي جي ڪوڊ، عام ذخيرن، يا لاگ ۾ نه ورهايو. پنھنجي اڪائونٽ جي ترتيبن مان ڪُلب کي منظم ريت ڦيرايو.

ايس ڊي ڪي

سرڪاري SDKs TTS.ai کي توهان جي ايپليڪيشن ۾ شامل ڪرڻ آسان بڻائي ٿو. ٻئي اوپن سورس ۽ GitHub تي دستياب آهن.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

بنياد URL

بنياد URL: https://api.tts.ai/v1/

سڀ آخري نقطا ھن بنياد URL سان لاڳاپيل آھن. مثال طور، TTS آخري نقطو آھي:

POST https://api.tts.ai/v1/tts/

شرح جي حدون

API شرح حدون منصوبي تي منحصر آهن:

منصوبو	درخواستون/منٽ	گڏيل	وڌ ۾ وڌ متن جي ڊيگهه
مفت	10	2	500 ڪارا
شروع	30	3	1,000,000 ڪارٽس
پرو	60	5	1,000,000 ڪارٽس
انٽرپرائز	300	20	حرف

هر جواب ۾ شرح حد جي هيڊرن کي شامل ڪيو ويندو: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

قرض

سروس	خرچ	يونٽ
TTS (آزاد ماڊل: Piper, VITS, MeloTTS)	1 ڪرنٽ	هر 1,000 حروف
TTS (معياري ماڊل: Kokoro, CosyVoice 2, وغيره)	2 کريڊٽ	هر 1,000 حروف
TTS (پريميئم ماڊل: Tortoise, Chatterbox, وغيره)	4 کريڊٽ	هر 1,000 حروف
ڳالھائڻ کان متن	2 کريڊٽ	هر منٽ آڊيو
آواز جو کلون	4 کريڊٽ	هر 1,000 حروف
آواز تبديل ڪندڙ	3 کريڊٽ	هر منٽ آڊيو
آڊيو بهتري	2 کريڊٽ	هر منٽ آڊيو
وڪيول حذف / وڪيول ورهاڻ	3-4 اکر	هر منٽ آڊيو
ڳالهائڻ جو ترجمو	5 ڪرنٽ	هر منٽ آڊيو
آواز جي ڳالھائي	3 کريڊٽ	هر دور ۾
& BPM ڳوليندڙ	مفت	--
آڊيو تبديل ڪندڙ	مفت	--

لکت مان ڳالھائڻName

POST /v1/tts/

متن کي ڳالھائڻ واري آڊيو ۾ تبديل ڪريو. درخواست ڪيل فارميٽ ۾ آڊيو فائل موٽائي ٿو.

درخواست جو جسم

پيراميڊ	قسم	لازمي	بيان
model	string	نه	ماڊل ID (مثال، `kokoro`, `chatterbox`, `piper`)
text	string	ھائو	ڳالهائڻ ۾ تبديل ڪرڻ لاءِ متن (پرو لاءِ وڌ ۾ وڌ 5,000 حرف، انٽرپرائز لاءِ 50,000)
voice	string	ھائو	آواز جي سڃاڻپ (`/v1/voices/` استعمال ڪريو موجود آوازن جي لسٽ لاءِ)
format	string	نه	ٻاھر ڪڍڻ جي شڪل: `mp3` (درآمد)، `wav`, `flac`, `ogg`
speed	float	نه	ڳالهائڻ جي رفتار جو ضرب. ڊفالٽ: `1.0`. حد: `0.5` کان `2.0` تائين
language	string	نه	ٻوليءَ جو ڪوڊ (مثال، `en`, `es`). جيڪڏھن ڇڏي ڏنو ويو ته خودڪار طرح ڳوليو ويندو.
instructions	string	نه	عمل / کڻڻ جو اشارو (≤500 ڪارا). مثال طور <ڪود>\
pronunciations	object \| array	نه	پر-مطلب ويڪرائي ورجائي. يا ته `{\`
stream	boolean	نه	ڊرائنگ جواب کي فعال ڪريو. ڊيفالٽ: `false`

مثالي درخواست

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ٽيگ

نمبر، تاريخون، ڪرنسي، فون نمبر ۽ مختصر لفظ


                    
                        
                            سمجھيو داخلا اھڙي طرح ڳالھايو ويو
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 ڊسمبر 31, 1999
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

سمجھيو	داخلا	اھڙي طرح ڳالھايو ويو
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ڊسمبر 31, 1999
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                mdy انگريزي لاءِ ۽ dmy ٻيا جڳھون، format=\ سان مٿان لکجي

                
                    
                        مثال
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                جواب
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                پورو مثال
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                ڳالھائڻ کان متن
                
                    POST /v1/stt/
                
                آڊيو کي متن ۾ تبديل ڪريو. 99 ٻولين کي خودڪار ڳولا سان سپورٽ ڪري ٿو.

                درخواست جو جسم (multipart/form-data)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                file
                                file
                                ھائو
                                آڊيو فائل (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). وڌ ۾ وڌ 100MB.
                            
                            
                                model
                                string
                                نه
                                STT ماڊل: whisper (درآمد)، faster-whisper، sensevoice
                            
                            
                                language
                                string
                                نه
                                ٻوليءَ جو ڪوڊ. auto خودڪار ڳولا لاءِ (مقرر ٿيل).
                            
                            
                                timestamps
                                boolean
                                نه
                                لفظ جي سطح تي وقت جون نشانيون شامل ڪريو. ڊيفالٽ: false
                            
                            
                                diarize
                                boolean
                                نه
                                اسپيڪر ڊائريزيشن کي فعال ڪريو. ڊفالٽ: false
                            
                        
                    
                

                جواب
                
                    
                        JSON جواب
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                آواز جو کلون
                
                    POST /v1/tts/clone/
                
                ڪلون ٿيل آواز ۾ ڳالهائڻ پيدا ڪريو. حوالو آڊيو ۽ متن اپ لوڊ ڪريو.

                درخواست جو جسم (multipart/form-data)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                reference_audio
                                file
                                ھائو
                                حوالو آواز آڊيو (10-30 سيڪنڊ صلاح ڏنل). وڌ ۾ وڌ 20MB.
                            
                            
                                text
                                string
                                ھائو
                                ڪلون ٿيل آواز ۾ ڳالهائڻ لاءِ متن.
                            
                            
                                model
                                string
                                نه
                                ڪلون ماڊل: chatterbox (درآمد)، cosyvoice2، gpt-sovits
                            
                            
                                format
                                string
                                نه
                                ٻاھر ڪڍڻ جي شڪل: mp3 (درآمد)، wav, flac
                            
                            
                                language
                                string
                                نه
                                مقصد جي ٻوليءَ جو ڪوڊ. چونڊيل ماڊل کي مدد ڏيڻي پوندي.
                            
                        
                    
                

                جواب
                آڊيو فائل کي بائنري ڊيٽا طور موٽائي ٿو، جيئن TTS آخري نقطو.
            

            
            
                آواز تبديل ڪندڙ
                
                    POST /v1/voice-convert/
                
                آڊيو کي مختلف آواز وانگر ٻڌڻ لاءِ تبديل ڪريو. سرچشمو آڊيو اپ لوڊ ڪريو ۽ مقصد آواز چونڊيو.

                درخواست جو جسم (multipart/form-data)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                file
                                file
                                ھائو
                                ماڳ آڊيو فائل (MP3, WAV, FLAC). وڌ ۾ وڌ 50MB.
                            
                            
                                target_voice
                                string
                                ھائو
                                تبديل ڪرڻ لاءِ آواز جي نشاني جو مقصد (موجود آوازن جي لسٽ ڪرڻ لاءِ /v1/voices/ استعمال ڪريو)
                            
                            
                                model
                                string
                                نه
                                آواز تبديلي ماڊل: openvoice (درآمد)، knn-vc
                            
                            
                                format
                                string
                                نه
                                ٻاھر ڪڍڻ جي شڪل: wav (درآمد)، mp3, flac
                            
                        
                    
                

                مثالي درخواست
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                جواب
                تبديل ٿيل آڊيو فائل ٻنهي طرفن واري ڊيٽا وانگر موٽائي ٿو.
            

            
            
                ڳالهائڻ جو ترجمو
                
                    POST /v1/speech-translate/
                
                هڪ ٻوليءَ مان ٻئي ٻوليءَ ۾ ڳالهائيندڙ آڊيو جو ترجمو ڪريو. هڪ ئي ڪالن ۾ ڳالهائڻ کان متن، ترجمو ۽ متن کان ڳالهائڻ کي گڏ ڪري ٿو.

                درخواست جو جسم (multipart/form-data)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                file
                                file
                                ھائو
                                آڊيو فائل اصل ٻوليءَ ۾. وڌ ۾ وڌ 100MB.
                            
                            
                                target_language
                                string
                                ھائو
                                مقصد جي ٻوليءَ جو ڪوڊ (مثال، es, fr, de, ja)
                            
                            
                                voice
                                string
                                نه
                                ترجمو ڪيل خروجي لاءِ آواز. جيڪڏھن ڇڏي ڏنو وڃي ته پاڻمرادو چونڊيو ويندو.
                            
                            
                                preserve_voice
                                boolean
                                نه
                                اصل ڳالھائيندڙ کي بچائڻ جي ڪوشش ڪريو
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                ڳالھائڻ کان ڳالھائڻ
                
                    POST /v1/speech-to-speech/
                
                ڳالهائڻ جي انداز، احساس يا پيشڪش کي تبديل ڪريو جڏهن ته مواد کي برقرار رکو. ٽون، رفتار ۽ اظهار کي ترتيب ڏيڻ لاءِ فائديمند.

                درخواست جو جسم (multipart/form-data)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                file
                                file
                                ھائو
                                وڪيپيڊيا:
                            
                            
                                voice
                                string
                                ھائو
                                آڌار واري ڳالھائڻ لاءِ مقصد آواز جي ايڊريس
                            
                            
                                model
                                string
                                نه
                                ماڊل: openvoice (درآمد)، chatterbox
                            
                            
                                emotion
                                string
                                نه
                                مقصد جو احساس: neutral, happy, sad, angry, excited
                            
                            
                                speed
                                float
                                نه
                                رفتار جي ترتيب. ڊفالٽ: 1.0. حد: 0.5 کان 2.0 تائين
                            
                        
                    
                

                جواب
                تبديل ٿيل آڊيو فائل ٻنهي طرفن واري ڊيٽا وانگر موٽائي ٿو.
            

            
            
                آڊيو اوزار
                آڊيو پروسيسنگ جي آخري نقطن کي وڌائڻ، آواز کي هٽائڻ، اسٽيم کي ورهاڻ، ۽ وڌيڪ لاءِ.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        آڊيو جي معيار کي بهتر ڪريو: دٻاءُ کي ختم ڪريو، شفافيت کي بهتر ڪريو، سپر ريزوليوشن.
                        
                            
                                
                                    file file وڌائڻ لاءِ آڊيو فائل
                                    denoise boolean ڊيناوسينگ کي فعال ڪريو (دليل: سچو)
                                    enhance_clarity boolean ڳالھائڻ جي پڌرائي وڌاءِ (دليل: سچو)
                                    super_resolution boolean آڊيو جي معيار کي وڌي (دليل: غلط)
                                    strength integer 1- 3 (آسان، وچولي، سخت). ڊفالٽ: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        آوازن کي اوزارن کان ڌار ڪريو (صوتي حذف) يا ٽنگن ۾ ورهايو.
                        
                            
                                
                                    file file ڌار ڪرڻ لاءِ آڊيو فائل
                                    model string demucs (ڊفالٽ) يا spleeter
                                    stems integer 2، 4، 5، يا 6 (دليل: 2)
                                    format string آخري فارميٽ: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        آڊيو رڪارڊنگ مان ايڪو ۽ ريبربر کي هٽايو.
                        
                            
                                
                                    file file عمل ۾ آڻڻ لاءِ آڊيو فائل
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            مفت
                        
                        ڪيچ، بي پي ايم، ۽ وقت جي دستخط کي ڳولڻ لاءِ آڊيو جو جائزو وٺو.
                        
                            
                                
                                    file file تشخيص لاءِ آڊيو فائل
                                
                            
                        
                        
                            جواب
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            مفت
                        
                        آڊيو شڪلن جي وچ ۾ تبديل ڪريو.
                        
                            
                                
                                    file file تبديل ڪرڻ لاءِ آڊيو فائل
                                    format string مقصد جي شڪل: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer 64, 128, 192, 256, 320 ۾ بيٽ رائيٽ
                                    sample_rate integer نموني جي شرح:
                                    channels string mono يا stereo
                                
                            
                        
                    
                
            

            
            
                آواز جي ڳالھائي
                
                    POST /v1/voice-chat/
                
                آڊيو يا متن موڪليو ۽ سنٿسيٽ ٿيل ڳالهائڻ سان AI جو جواب حاصل ڪريو.

                درخواست جو جسم (multipart/form-data يا JSON)
                
                    
                        
                            پيراميڊ قسم لازمي بيان
                        
                        
                            
                                audio
                                file
                                نه*
                                آڊيو داخلا (يا ته audio يا text گھرجي)
                            
                            
                                text
                                string
                                نه*
                                متن داخلا (يا ته audio يا text گھرجي)
                            
                            
                                voice
                                string
                                نه
                                AI جواب لاءِ آواز. ڊفالٽ: af_bella
                            
                            
                                tts_model
                                string
                                نه
                                جواب لاءِ TTS ماڊل. ڊفالٽ: kokoro
                            
                            
                                system_prompt
                                string
                                نه
                                AI لاءِ پسنديده سسٽم پوسٽ
                            
                            
                                conversation_id
                                string
                                نه
                                اڳيان واري ڳالهه ٻولهه جاري رکو
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                ٽٽس
                
                    POST /v1/tts/batch/
                
                گڏيل TTS پيدا ڪرڻ لاءِ ڪيترائي متن داخل ڪريو. جڏهن سڀ ڪم پورا ٿين تڏھن اختياري طور Webhook ڪال واپس وٺو.

                پيرا ميٽر
                
                    پيراميڊ قسم بيان
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string جڏھن باچ مڪمل ٿئي ٿو تڏھن POST نتيجن لاءِ اختياري URL.
                    
                

                جواب
                
                    JSON جواب
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                GET /v1/tts/batch/result/?batch_id=abc123 سان پوئلڳ جي ترقي
            

            
            
                آواز داخل ڪرڻ
                
                    POST /v1/voice-embed/
                
                حوالو آڊيو کان آواز جي ڳنڍڻ کي اڳ ۾ ڳڻپيو. embed_id واپس ڪيل استعمال ڪريو پوئين آواز جي ڪلوننگ جي درخواستن ۾ تقريبن فوري پيدائش لاءِ.

                پيرا ميٽر
                
                    پيراميڊ قسم بيان
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                جواب
                
                    JSON جواب
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                صحت جي جانچ
                
                    GET /v1/health/
                
                GPU سرور جي حالت، لوڊ ٿيل ماڊل ۽ قطار جي سائز جو جائزو وٺو. تصديق جي ضرورت نه آھي. 30 سيڪنڊن لاءِ ڪيش ڪيو ويو.

                جواب
                
                    JSON جواب
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ماڊلز جي لسٽ
                
                    GET /v1/models/
                
                سڀني موجود ماڊلن جي فهرست سندن صلاحيتن سان موٽائي ٿو.

                جواب
                
                    JSON جواب
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                آوازن جي لسٽ
                
                    GET /v1/voices/
                
                سڀني موجود آوازن جي فهرست موٽائي ٿو، ماڊل يا ٻوليءَ جي چونڊ سان فلٽر ٿيل.

                پڇا ڳاڇا
                
                    
                        
                            پيراميڊ قسم بيان
                        
                        
                            
                                model
                                string
                                ماڊل ID سان فلٽر ڪريو (مثال، kokoro)
                            
                            
                                language
                                string
                                ٻوليءَ جي ڪوڊ سان فلٽر ڪريو (مثال، en)
                            
                            
                                gender
                                string
                                جنس موجب فلٽر: male, female, neutral
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                زير عنوان نئون
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                ڪنهن به مڪمل TTS ڪم لاءِ سنئين وقت تي عنوان پيدا ڪريو. آڊيو تي ويسپير سلائڊنگ هلائي ٿو ۽ SRT يا WebVTT موٽائي ٿو. نتيجو ڊسڪ تي ڪيش ڪيو ويندو آهي تنھنڪري ھڪ ئي uuid لاءِ ٻيو ڪال ڊسڪ پڙهڻ وانگر ٿيندو.
                پڇا ڳاڇا
                
                    
                        پيراميڊ لازمي بيان
                        
                            uuid ھائو /v1/tts/ يا /v1/voice-clone/ پاران واپس ڪيل ڪم UUID.
                            format نه srt (درآمد) يا vtt.
                            download نه 1 Content-Disposition: attachment موڪلڻ لاءِ ته جيئن برائوزر ڏيکارڻ جي بدران محفوظ ڪري.
                            language نه برابري ماڊل لاءِ اشارو (جيڪڏھن ڇڏي ڏنو وڃي ته خودڪار طرح ڳوليو ويندو).
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                ويڪرائي لکڻيءَ جي لغت نئون
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                TTS انجن کي ٻڌاءِ ته ڪھڙي طرح مخصوص لفظن کي پڙھي. محفوظ ڪيل داخلا توھان جي هر TTS درخواست تي پاڻمرادو لاڳو ٿيندا. 200-انٽرس جي حد هر اڪائونٽ تي.
                درخواست جو جسم (POST)
                
                    
                        پيراميڊ قسم بيان
                        
                            word string لفظ جيڪو مٿان لکجي (مثال: GIF, Anthropic). لفظ جي حد مطابقت رکي ٿي.
                            replacement string ماڊل لاءِ ان کي ڪيئن لکجي (مثال طور jiff, ann THROP ick).
                            language string اختياري ISO ڪوڊ. خالي = سڀني ٻولين تي لاڳو ٿئي ٿو.
                            case_sensitive boolean false جي ڊيفالٽ. true جي صحيح صورت ۾ ملائي.
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                توھان پڻ درخواست جي مٿان انھن کي محفوظ ڪرڻ کانسواءِ پاس ڪري سگھو ٿا -  pronunciations شامل ڪريو ڪنھن به /v1/tts/ ڪالي تي يا ته هڪ شي يا هڪ آرري طور (TTS جي آخر واري نقطي جي پارامڪس ڏسو).
            

            
            
                مضمون ٻڌائيندڙ نئون
                ڪنهن به مضمون صفحي تي هڪ

پيراميڊ	قسم	لازمي	بيان
file	file	ھائو	آڊيو فائل (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). وڌ ۾ وڌ 100MB.
model	string	نه	STT ماڊل: `whisper` (درآمد)، `faster-whisper`، `sensevoice`
language	string	نه	ٻوليءَ جو ڪوڊ. `auto` خودڪار ڳولا لاءِ (مقرر ٿيل).
timestamps	boolean	نه	لفظ جي سطح تي وقت جون نشانيون شامل ڪريو. ڊيفالٽ: `false`
diarize	boolean	نه	اسپيڪر ڊائريزيشن کي فعال ڪريو. ڊفالٽ: `false`

پيراميڊ	قسم	لازمي	بيان
reference_audio	file	ھائو	حوالو آواز آڊيو (10-30 سيڪنڊ صلاح ڏنل). وڌ ۾ وڌ 20MB.
text	string	ھائو	ڪلون ٿيل آواز ۾ ڳالهائڻ لاءِ متن.
model	string	نه	ڪلون ماڊل: `chatterbox` (درآمد)، `cosyvoice2`، `gpt-sovits`
format	string	نه	ٻاھر ڪڍڻ جي شڪل: `mp3` (درآمد)، `wav`, `flac`
language	string	نه	مقصد جي ٻوليءَ جو ڪوڊ. چونڊيل ماڊل کي مدد ڏيڻي پوندي.

file file	وڌائڻ لاءِ آڊيو فائل
denoise boolean	ڊيناوسينگ کي فعال ڪريو (دليل: سچو)
enhance_clarity boolean	ڳالھائڻ جي پڌرائي وڌاءِ (دليل: سچو)
super_resolution boolean	آڊيو جي معيار کي وڌي (دليل: غلط)
strength integer	1- 3 (آسان، وچولي، سخت). ڊفالٽ: 2

file file	ڌار ڪرڻ لاءِ آڊيو فائل
model string	`demucs` (ڊفالٽ) يا `spleeter`
stems integer	2، 4، 5، يا 6 (دليل: 2)
format string	آخري فارميٽ: `wav`, `mp3`, `flac`

file file	عمل ۾ آڻڻ لاءِ آڊيو فائل
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	تبديل ڪرڻ لاءِ آڊيو فائل
format string	مقصد جي شڪل: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	64, 128, 192, 256, 320 ۾ بيٽ رائيٽ
sample_rate integer	نموني جي شرح:
channels string	`mono` يا `stereo`

پيراميڊ	قسم	لازمي	بيان
audio	file	نه*	آڊيو داخلا (يا ته `audio` يا `text` گھرجي)
text	string	نه*	متن داخلا (يا ته `audio` يا `text` گھرجي)
voice	string	نه	AI جواب لاءِ آواز. ڊفالٽ: `af_bella`
tts_model	string	نه	جواب لاءِ TTS ماڊل. ڊفالٽ: `kokoro`
system_prompt	string	نه	AI لاءِ پسنديده سسٽم پوسٽ
conversation_id	string	نه	اڳيان واري ڳالهه ٻولهه جاري رکو

پيراميڊ	قسم	بيان
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	جڏھن باچ مڪمل ٿئي ٿو تڏھن POST نتيجن لاءِ اختياري URL.

پيراميڊ	قسم	بيان
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

پيراميڊ	قسم	بيان
model	string	ماڊل ID سان فلٽر ڪريو (مثال، `kokoro`)
language	string	ٻوليءَ جي ڪوڊ سان فلٽر ڪريو (مثال، `en`)
gender	string	جنس موجب فلٽر: `male`, `female`, `neutral`

پيراميڊ	لازمي	بيان
uuid	ھائو	/v1/tts/ يا /v1/voice-clone/ پاران واپس ڪيل ڪم UUID.
format	نه	`srt` (درآمد) يا `vtt`.
download	نه	`1` `Content-Disposition: attachment` موڪلڻ لاءِ ته جيئن برائوزر ڏيکارڻ جي بدران محفوظ ڪري.
language	نه	برابري ماڊل لاءِ اشارو (جيڪڏھن ڇڏي ڏنو وڃي ته خودڪار طرح ڳوليو ويندو).

پيراميڊ	قسم	بيان
word	string	لفظ جيڪو مٿان لکجي (مثال: `GIF`, `Anthropic`). لفظ جي حد مطابقت رکي ٿي.
replacement	string	ماڊل لاءِ ان کي ڪيئن لکجي (مثال طور `jiff`, `ann THROP ick`).
language	string	اختياري ISO ڪوڊ. خالي = سڀني ٻولين تي لاڳو ٿئي ٿو.
case_sensitive	boolean	`false` جي ڊيفالٽ. `true` جي صحيح صورت ۾ ملائي.