میں ایک API کی کلید کیسے حاصل کر سکتا ہوں؟

ایک مفت TTS.ai اکاؤنٹ کے لئے رجسٹر کریں، پھر اپنے اکاؤنٹ کے ڈیش بورڈ پر جائیں اور "API کیج پیدا کریں" پر کلک کریں۔ آپ کی کلید sk-tts- کے ساتھ پیش فہرست کی جائے گی اور فوراً استعمال کی جاسکتی ہے۔ مفت اکاؤنٹس کو شروع کرنے کے لئے 15000 حروف ملتے ہیں۔

کیا API OpenAI کے فارمیٹ کے ساتھ مطابقت رکھتا ہے؟

ہاں، ہمارا API OpenAI-مطابق درخواست اور جواب فارمیٹ کا پیرو کرتا ہے. اگر آپ کے پاس موجود کوڈ ہے جو OpenAI's TTS API کا استعمال کرتا ہے، تو آپ TTS.ai کو تبدیل کر سکتے ہیں کم سے کم کوڈ تبدیلیوں کے ساتھ بیس URL اور API کی کلید کو تبدیل کر کے.

پروگرامنگ کی کیا زبانیں مدد دی جاتی ہیں؟

REST API کو کسی بھی زبان کے ساتھ کام کرنا ہے جو HTTP درخواستیں کر سکتا ہے ہم Python، JavaScript (Node.js اور براؤزر) میں کوڈ مثالیں فراہم کرتے ہیں، cURL، اور زیادہ۔ HTTP کلائنٹ لائبریری کے ساتھ کوئی بھی زبان (Go، Ruby، Java، C#، PHP، اور اور) API کو استعمال کر سکتا ہے.

API کی شرح کی حدیں کیا ہیں؟

مفت اکاؤنٹس ہر گھنٹہ 3 درخواستوں تک محدود ہیں۔ پیسے کے پلانوں میں آپ کی سبسکریپشن ٹیئر پر مبنی اعلی حدیں ہوتی ہیں: اسٹارٹر (60/ گھنٹہ)، پرفیشنل (300/ گھنٹہ)، اینٹرپرائز (لامحدود)۔ ہر API جواب میں ریت حد کے ہیڈر شامل ہوتے ہیں۔

API کی قیمتیں کیسے کام کرتی ہیں؟

API استعمال کو ماڈل ٹیئر اور متن کی لمبائی پر مبنی حروف کا استعمال ہوتا ہے. فری ماڈل 0 حروف کا استعمال کرتے ہیں، معیاری ماڈل 2x حروف کا استعمال کرتے ہیں، اور پرائم ماڈل 4x حروف کا استعمال کرتے ہیں. حروف تمام ادا کردہ منصوبوں میں شامل ہیں اور انہیں حروف کے پیکج کے طور پر الگ الگ خریدا جاسکتا ہے۔

کیا انتہا پوائنٹس دستیاب ہیں؟

یہ API متن سے کلام (POST /v1/tts/) ، کلام سے متن (POST /v1/transcribe/) ، آواز کلوننگ (POST /v1/voice-clone/) ، آواز تبدیل (POST /v1/voice-convert/) ، کلام ترجمہ (POST /v1/speech-translate/) ، آڈیو بہتری (POST /v1/audio-enhance/) ، آواز کو ہٹانا ، سٹیم تقسیم ، کی اور بی پی ایم تجزیہ ، اور مزید کے لئے انڈیپائنٹس فراہم کرتا ہے۔

API کیا آڈیو فارمیٹ واپس کرتا ہے؟

API WAV فارمیٹ میں آڈیو واپس کرتا ہے آپ جواب_ فارمیٹ پیرامیٹر کے استعمال سے آؤٹ پٹ فارمیٹ (mp3, wav, ogg, flac) کو بیان کرسکتے ہیں. MP3 ویب ایپلیکیشنز کے لیے سفارش کیا جاتا ہے، WAV مزید آڈیو پروسیسنگ کے لیے.

کیا ریل-ٹائم TTS کے لئے ایک اسٹریم API موجود ہے؟

ہاں، ہمارا Async API ایک کام UUID واپس کرتا ہے جسے آپ نتائج کے لیے پول کر سکتے ہیں. Kokoro جیسے مدد شدہ ماڈلز کے لیے، آڈیو پیداوار قریب-ریئل-ٹائم ایپلیکیشنوں کے لیے کافی تیز ہے. پولنگ انڈیپائنٹ پروسیسنگ مکمل ہونے کے بعد آڈیو URL واپس کرتا ہے.

میں API میں غلطیوں کو کیسے ہینڈل کرتا ہوں؟

API معیاری HTTP اسٹیٹس کوڈز (400 بد درخواستوں کے لیے، 401 تصدیق غلطیوں کے لیے، 429 شرح حد کے لیے، 500 سرور غلطیوں کے لیے) JSON غلطی پیغامات کے ساتھ واپس کرتا ہے. صحیح غلطی ہینڈلنگ کے لیے جواب میں ہمیشہ اسٹیٹس کوڈ اور غلطی فیلڈ چکیں.

کیا میں تجارتی ایپلیکیشنز کے لئے API استعمال کر سکتا ہوں؟

ہاں، API تجارتی استعمال کے لیے ڈیزائن کیا گیا ہے. API کے ذریعے پیدا کی گئی آڈیو آپ کی مصنوعات، ایپلیکیشنز اور سروسز میں استعمال کی جاسکتی ہے۔ تمام ماڈل اوپن سورس لائسنس استعمال کرتے ہیں، اور پیدا کی گئی آڈیو پر کوئی اضافی روایات نہیں ہیں۔

کیا کوئی سنڈ باکس یا ٹیسٹ ماحول موجود ہے؟

فری ٹیئر ماڈل (Kokoro, Piper, VITS, MeloTTS) ایک بہترین سنڈ باکس کے طور پر کام کرتے ہیں - وہ صفر حروف کا استعمال کرتے ہیں اور تمام اکاؤنٹس کے لیے دستیاب ہیں. پروڈکشن استعمال کے لیے پرائم ماڈل میں تبدیل ہونے سے پہلے فری ماڈل کے ساتھ آپ کی انٹیگریشن کو ٹیسٹ کریں.

میں API کے ذریعے دستیاب آوازوں اور ماڈلز کی فہرست کیسے بنا سکتا ہوں؟

تمام موجود آوازوں کو فلٹرنگ آپشنز کے ساتھ فہرست کر نے کے ليے GET /v1/voices استعمال کريں ( ماڈل ، زبان ، جنس ) تمام موجود TTS ماڈل کو انکے توانائيوں اور سطحي معلومات کے ليے فہرست کر نے کے ليے GET /v1/models استعمال کريں دوئي اينڈ پوائنٹ JSON جوابات واپس کريں

بگ / خصوصیت کی درخواست رپورٹ کریں

API دستاویزات

REST API کے ساتھ TTS.ai کو آپ کی ایپلیکیشن میں شامل کریں۔ آسان ہجرت کے لئے OpenAI-مطابق فارمیٹ۔

REST API OpenAI سازگار JSON جوابات اسٹریمنگ مدد

نظرثاني

TTS.ai API تمام پلیٹ فارم خصوصیات تک پروگرامی رسائی فراہم کرتا ہے: متن سے کلام ترکیب، کلام سے متن نقل، آواز کلوننگ، آڈیو بہتری، اور مزید۔ API JSON درخواست/جواب بدنوں کے ساتھ معیاری REST کنوانشنز کا استعمال کرتا ہے۔

API کلید

آپ کی API کلید یہاں سے حاصل کریں اکاؤنٹس. پرو اور انٹرپرائز منصوبوں پر دستیاب.

بنياد URL

https://api.tts.ai/v1/

تصدیق

بیئر ٹوکن کے ذریعے Authorization هيڈر

توثیق

مفت سطح - کوئی کلید نہیں چاہیے. نامعلوم POSTs کو /v1/tts/ کوئی بھی تصدیق کے بغیر کام کریں، 5000 حروف/روز تک ہر IP، ہمارے مفت ماڈلوں کا استعمال کرتے ہوئے (piper, vits, melotts, kokoro). 15,000 بونس حروف اور پرائم ماڈلز تک رسائی حاصل کرنے کے لئے ایک مفت اکاؤنٹ کے لئے رجسٹر کریں.

پرائم ماڈلز اور اعلی ریت حدوں کے لئے، ایک بییئر ٹوکن کے ساتھ توثیق کریں Authorization هيڈر.

HTTP ہیڈر

Authorization: Bearer sk-tts-your-api-key-here

آپ کی API کی راز رکھیں. اسے کلائنٹ-سائڈ کوڈ، عوامی ذخیروں، یا لاگ میں شریک نہ کریں. اپنے اکاؤنٹ کی ترتیبات سے منظم طور پر کلیدوں کی گردش کریں.

ايس ڈی کي

سرکاری SDKs آپ کی ایپلیکیشن میں TTS.ai کو شامل کرنے کو آسان بناتے ہیں. دونوں ہی اوپن سورس اور GitHub پر دستیاب ہیں.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

بنياد URL

بنياد URL: https://api.tts.ai/v1/

تمام انتہا پوائنٹس اس بیس URL کے نسبت ہیں. مثال کے طور پر، TTS انتہا پوائنٹ ہے:

POST https://api.tts.ai/v1/tts/

حدیں

API شرح حدوں پلان کے مطابق مختلف ہیں:

پلان	درخواستیں/منٹ	متوازی	زیادہ سے زیادہ متن کی لمبائی
مفت	10	2	500 حروف
شروع	30	3	1,000,000 حروف
پرو	60	5	1,000,000 حروف
انٹرپرائز	300	20	50,000 حروف

ریت حد ہیڈرس ہر جواب میں شامل ہیں: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

کریڈٹ لاگت

سروس	خرچ	يونٹ
TTS (آزاد ماڈل: Piper, VITS, MeloTTS)	1000 حروف	ہر 1000 حروف
TTS (معیاري ماڈل: Kokoro, CosyVoice 2, etc.)	2000 حروف	ہر 1000 حروف
TTS (پریمیئم ماڈل: Tortoise, Chatterbox, etc.)	4 کریڈٹ	ہر 1000 حروف
زبان سے متن	2000 حروف	پر منٹ
آواز کا کلوننگ	4 کریڈٹ	ہر 1000 حروف
آواز بدلنے والا	3000 حروف	پر منٹ
آڈیو بہتری	2000 حروف	پر منٹ
آواز ختم کر نے/ آواز تقسيم کر نے	3000-4000 حروف	پر منٹ
ترجمہ	5000 حروف	پر منٹ
آواز چیٹ	3000 حروف	ہر دور
کلید & BPM تلاش کرنے والا	مفت	--
آڈیو تبدیل کرنے والا	مفت	--

تحریر سے کلام

POST /v1/tts/

متن کو بولنے والی آڈیو میں تبدیل کریں. درخواست شدہ فارمیٹ میں آڈیو فائل واپس کرتا ہے.

درخواست کا جسم

پیرامیٹرز	قسم	ضروری	وضاحت
model	string	نہیں	ماڈل ID (مثال، `kokoro`, `chatterbox`, `piper`). اگر چھوڑ دیا گیا تو، ہم خودکار طور پر ایک ماڈل منتخب کرتے ہیں جو درخواست شدہ `language` کو مدد دیتا ہے - en/ja/zh/ko/fr/de/it/pt/es/hi/ru کے ليے `kokoro`، اور دیگر مدد شدہ زبانوں کے ليے `piper` (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.)
text	string	جی ہاں	متن جو کہ بولنے میں تبدیل کیا جائے گا. ہر درخواست کے لیے حد: 500 حروف (نامعلوم)، 5000 (فری اکاؤنٹ)، 100 (پیش پرداخت پلان). لمبے انٹیج خودکار طور پر سرور کی طرف سے جوڑ دیے جاتے ہیں.
voice	string	جی ہاں	آواز ID (موجود آوازوں کی فہرست بنانے کے لیے `/v1/voices/` استعمال کریں)
format	string	نہیں	خروجی فارمیٹ: `mp3` (دیفالٹ)، `wav`، `flac`، `ogg`
speed	float	نہیں	بولنے کی رفتار کا ضربي. ديفا لوٹ: `1.0` رينج: `0.5` سے `2.0`
language	string	نہیں	زبان کا کوڈ (مثال، `en`, `es`). اگر چھوڑ دیا جائے تو خودکار طور پر دریافت کیا جائے گا.
instructions	string	نہیں	عمل / فراہمی کیو (≤500 حروف). مثال: <کوڈ>\
pronunciations	object \| array	نہیں	پر-مطلبی آواز غلبہ. یا تو `{\`
stream	boolean	نہیں	ڈفالٹ: `false`

مثال درخواست

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ٹیگ

نمبرات، تاريخیں، رقم، فون نمبرات اور مختصر ناموں کو


                    
                        
                            ان کا تعبیر کريں ان پٹ اس طرح بولا گیا
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 دسمبر 31، 1999
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

ان کا تعبیر کريں	ان پٹ	اس طرح بولا گیا
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	دسمبر 31، 1999
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                تاریخ کا فارمیٹ دیفالٹ mdy انگریزی کے لیے اور dmy دیگر جگہوں پر؛ format=\ کے ساتھ اووررائڈ

                
                    
                        مثال
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                جواب
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                مکمل مثال
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                زبان سے متن
                
                    POST /v1/stt/
                
                آڈیو کو ٹیکس میں تبدیل کریں. خودکار دریافت کے ساتھ 99 زبانوں کی حمایت کرتا ہے.

                درخواست کا جسم (multipart/form-data)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                file
                                file
                                جی ہاں
                                آڈیو فائل (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). زیادہ سے زیادہ 100MB.
                            
                            
                                model
                                string
                                نہیں
                                STT ماڈل: ويسپر (دفٹر)، فاسٹر ويسپر، سنس وايس
                            
                            
                                language
                                string
                                نہیں
                                زبان کا کوڈ. auto خودکار دریافت کے لیے (مقررہ).
                            
                            
                                timestamps
                                boolean
                                نہیں
                                لفظ-لیول ٹائم سٹیمپ شامل کریں. ڈیفالٹ: false
                            
                            
                                diarize
                                boolean
                                نہیں
                                اسپیکر ڈائریزیشن فعال کریں. ڈیفالٹ: false
                            
                        
                    
                

                جواب
                
                    
                        JSON جواب
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                آواز کا کلوننگ
                
                    POST /v1/tts/clone/
                
                کلونڈ آواز میں بولنا پيدا کريں رفرنس آڊيو اور ٹیکس اپ لوڈ کريں

                درخواست کا جسم (multipart/form-data)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                reference_audio
                                file
                                جی ہاں
                                ریفرنس وائٹس آڈیو (10-30 سیکنڈ کی رائے دی جاتی ہے). زیادہ سے زیادہ 20MB.
                            
                            
                                text
                                string
                                جی ہاں
                                کلون کی گئی آواز میں بولنے کے لیے متن.
                            
                            
                                model
                                string
                                نہیں
                                کلون ماڈل: chatterbox (دفٹر)، cosyvoice2، gpt-sovits
                            
                            
                                format
                                string
                                نہیں
                                خروجی فارمیٹ: mp3 (دیفالٹ)، wav، flac
                            
                            
                                language
                                string
                                نہیں
                                مقصد زبان کوڈ. منتخب ماڈل سے مدد ملنا چاہیے.
                            
                        
                    
                

                جواب
                آڈیو فائل کو بائنری ڈیٹا کے طور پر واپس کرتا ہے، جیسا کہ TTS انتہا پوائنٹ.
            

            
            
                آواز بدلنے والا
                
                    POST /v1/voice-convert/
                
                مختلف آواز کے طور پر آواز کے طور پر آڈیو تبدیل کریں. سرچشمہ آڈیو اپ لوڈ کریں اور مقصد آواز منتخب کریں.

                درخواست کا جسم (multipart/form-data)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                file
                                file
                                جی ہاں
                                سرچشمہ آڈیو فائل (MP3, WAV, FLAC). زیادہ سے زیادہ 50MB.
                            
                            
                                target_voice
                                string
                                جی ہاں
                                تبدیل کرنے کے لیے آواز ID کا مقصد (موجود آوازوں کی فہرست بنانے کے لیے /v1/voices/ استعمال کریں)
                            
                            
                                model
                                string
                                نہیں
                                آواز تبدیل کرنے کا ماڈل: openvoice (دیفالٹ)، knn-vc
                            
                            
                                format
                                string
                                نہیں
                                خروجی فارمیٹ: wav (دیفالٹ)، mp3، flac
                            
                        
                    
                

                مثال درخواست
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                جواب
                تبدیل شدہ آڈیو فائل کو بائنری ڈیٹا کے طور پر واپس کرتا ہے.
            

            
            
                ترجمہ
                
                    POST /v1/speech-translate/
                
                ایک زبان سے دوسری زبان میں بولی ہوئی آڈیو کا ترجمہ کریں۔ ایک کال میں بولی سے تحریر، ترجمہ اور تحریر سے بولی کا ترکیب کرتے ہیں۔

                درخواست کا جسم (multipart/form-data)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                file
                                file
                                جی ہاں
                                اصل زبان میں سرچشمہ آڈیو فائل. زیادہ سے زیادہ 100MB.
                            
                            
                                target_language
                                string
                                جی ہاں
                                مقصد زبان کا کوڈ (مثال، es, fr, de, ja)
                            
                            
                                voice
                                string
                                نہیں
                                ترجمہ خروجی کے لیے آواز. اگر چھوڑ دیا جائے تو خودکار طور پر منتخب کیا جائے گا.
                            
                            
                                preserve_voice
                                boolean
                                نہیں
                                اصل اسپیکر کی آواز کی خصوصیات محفوظ رکھنے کی کوشش کریں. دیفالٹ: false
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                کلام سے کلام
                
                    POST /v1/speech-to-speech/
                
                مضمون کو محفوظ رکھتے ہوئے بولنے کے انداز ، احساس يا پيش کر نے کو تبديل کريں. تنا ر ، پيسنگ اور اظہار کي ترتيب کے ليے فائده مند

                درخواست کا جسم (multipart/form-data)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                file
                                file
                                جی ہاں
                                آواز کی سرچشمہ آڈیو فائل. زیادہ سے زیادہ 50MB.
                            
                            
                                voice
                                string
                                جی ہاں
                                خروجی بولنے کے لیے مقصد آواز ID
                            
                            
                                model
                                string
                                نہیں
                                ماڈل: openvoice (دفٹر)، chatterbox
                            
                            
                                emotion
                                string
                                نہیں
                                مقصدي احساس: neutral, happy, sad, angry, excited
                            
                            
                                speed
                                float
                                نہیں
                                رفتار تعديل ديافترض: 1.0 رينج: 0.5 سے 2.0
                            
                        
                    
                

                جواب
                تبدیل شدہ آڈیو فائل کو بائنری ڈیٹا کے طور پر واپس کرتا ہے.
            

            
            
                آڈیو ٹولز
                بہتری کے لیے آڈیو پروسیسنگ انتہا پوائنٹس، آواز کو ہٹانا، سٹیم تقسیم کرنا، اور مزید.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        آڈیو کی کیفیت کو بہتر بنائیں: شور کو ختم کریں، واضحی کو بہتر کریں، سپر رزولوشن.
                        
                            
                                
                                    file file اوڈیو فائل جسے بہتر بنانا ہے
                                    denoise boolean نویز ختم کرنے کو فعال کریں (دیفالٹ: صحیح)
                                    enhance_clarity boolean بولنے کی واضحی بڑھاؤ (معیار: صحیح)
                                    super_resolution boolean اوڈيو کي معيار کي بلندي (دفترِاصل: غلط)
                                    strength integer 1-3 (اُجھلا, متوسط, مضبوط). دیفالٹ: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        آوازوں کو سازوں سے جدا کريں ( آوازوں کو ہٹا ديں ) يا ان کو ٹکڑے کريں
                        
                            
                                
                                    file file آڈیو فائل جدا کرنے کے لیے
                                    model string demucs (دیفالٹ) يا spleeter
                                    stems integer سٹم کی تعداد: 2, 4, 5, or 6 (دفٹر: 2)
                                    format string خروجی فارمیٹ: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        اوڈيو ریکارڈنگ سے ایکو اور ری بیرر کو ہٹاو
                        
                            
                                
                                    file file پروسیسنگ کے لیے آڈیو فائل
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            مفت
                        
                        کی، BPM اور ٹائم سائن ان کو تلاش کرنے کے ليے اوڈيو کا جائزہ لیں
                        
                            
                                
                                    file file اوڈیو فائل جس کا تجزیہ کرنا ہے
                                
                            
                        
                        
                            جواب
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            مفت
                        
                        اوڈیو فارمیٹ کے درمیان تبدیل کریں
                        
                            
                                
                                    file file تبدیل کرنے کے لیے آڈیو فائل
                                    format string مقصدی فارمیٹ: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer آؤٹ پٹ بٹرائٹ kbps میں: 64, 128, 192, 256, 320
                                    sample_rate integer نمونہ ریت: 22050، 44100، 48000
                                    channels string mono يا stereo
                                
                            
                        
                    
                
            

            
            
                آواز چیٹ
                
                    POST /v1/voice-chat/
                
                آڈیو یا ٹیکس بھیجیں اور سنتھسیزڈ کلام کے ساتھ ایک AI جواب حاصل کریں.

                درخواست کا جسم (multipart/form-data يا JSON)
                
                    
                        
                            پیرامیٹرز قسم ضروری وضاحت
                        
                        
                            
                                audio
                                file
                                نہیں*
                                آڈیو ان پٹ (یا تو audio یا text ضروری ہے)
                            
                            
                                text
                                string
                                نہیں*
                                ٹیکس ان پٹ (یا تو audio یا text ضروری ہے)
                            
                            
                                voice
                                string
                                نہیں
                                AI جواب کے ليے آواز ديفالٹ: af_bella
                            
                            
                                tts_model
                                string
                                نہیں
                                جواب کے لیے TTS ماڈل. دیفالٹ: kokoro
                            
                            
                                system_prompt
                                string
                                نہیں
                                AI کے ليے ذاتي نظام پرو موٹ
                            
                            
                                conversation_id
                                string
                                نہیں
                                موجود گفتگو جاری رکھیں
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                بٹ TTS
                
                    POST /v1/tts/batch/
                
                TTS کی متوازی پیدائش کے لیے متعدد تحریریں پیش کریں. اختیاری طور پر ایک ویب ہوک کالبیکٹ حاصل کریں جب تمام کام مکمل ہوں.

                پرائمرز
                
                    پرائمری قسم وضاحت
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string اختیاری URL POST نتائج کے لیے جب بیچ مکمل ہو جاتا ہے.
                    
                

                جواب
                
                    JSON جواب
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                پو ل ترقی GET /v1/tts/batch/result/؟batch_id=abc123 کے ساتھ
            

            
            
                آواز شامل کرنا
                
                    POST /v1/voice-embed/
                
                ریفرنس آڈیو سے آواز کو داخل کرنے کا پیش-حساب کریں. قریب-حالت پیداوار کے لیے بعد میں آواز کلوننگ درخواستوں میں واپسی embed_id استعمال کریں.

                پرائمرز
                
                    پرائمری قسم وضاحت
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                جواب
                
                    JSON جواب
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                صحت کی جانچ
                
                    GET /v1/health/
                
                GPU سرور کی حالت، لوڈ ماڈلز، اور قطار کی سائز چکیں. توثیق کی ضرورت نہیں. 30 سیکنڈ کے لیے کیچ کیا گیا.

                جواب
                
                    JSON جواب
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ماڈلز کی فہرست
                
                    GET /v1/models/
                
                ان کی صلاحیتوں کے ساتھ تمام دستیاب ماڈلز کی فهرست واپس کرتا ہے.

                جواب
                
                    JSON جواب
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                آوازیں شامل کریں
                
                    GET /v1/voices/
                
                تمام دستیاب آوازوں کی فهرست واپس کرتا ہے، اختیاری طور پر ماڈل یا زبان کے مطابق فلٹر کیا جاتا ہے.

                سوالات
                
                    
                        
                            پیرامیٹرز قسم وضاحت
                        
                        
                            
                                model
                                string
                                ماڈل ID کے مطابق فلٹر کریں (مثال، kokoro)
                            
                            
                                language
                                string
                                زبان کوڈ کے مطابق فلٹر کریں (مثال، en)
                            
                            
                                gender
                                string
                                جنس کے مطابق فلٹر: male, female, neutral
                            
                        
                    
                

                جواب
                
                    JSON جواب
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                سب ٹیٹرز نیا
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                کسی بھی مکمل TTS کام کے لیے ہم آہنگ سب ٹیٹلز پیدا کریں. اوڈیو پر ویشپر الائنمنٹ چلاتا ہے اور SRT یا WebVTT واپس کرتا ہے. نتیجہ ڈسک پر کیچ کیا جاتا ہے تاکہ اسی uuid کے لیے دوسرا کال ایک ڈسک پڑھنا ہو.
                سوالات
                
                    
                        پیرامیٹرز ضروری وضاحت
                        
                            uuid جی ہاں کام UUID /v1/tts/ یا /v1/voice-clone/ سے واپس کیا گیا.
                            format نہیں srt (دفٹر) یا vtt.
                            download نہیں 1 Content-Disposition: attachment بھیجنے کے لیے تاکہ براؤزر محفوظ کرے اس کی بجائے کہ دکھائے.
                            language نہیں alignment ماڈل کے لیے اشارہ (خودکار طور پر دریافت کیا جاتا ہے اگر چھوڑ دیا جاتا ہے)
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                لفظي ديکشنري نیا
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                خاص لفظوں کو بولنے کے ليے TTS انجن کي بتايں محفوظ کردہ دخلات آپ کو هر TTS درخواست پر خودکاري سے لا گيا جاتا هے 200 دخلات پر اکاونٹ حد
                درخواست کا جسم (POST)
                
                    
                        پیرامیٹرز قسم وضاحت
                        
                            word string لفظ جس پر غلبہ کريں (مثال: GIF, Anthropic). لفظي حد ميں ميلاپ
                            replacement string ماڈل کے لیے اسے کیسے فہرست کیا جائے (مثال کے لیے jiff, ann THROP ick).
                            language string اختیاری ISO کوڈ. خالی = تمام زبانوں پر لاگو ہوتا ہے.
                            case_sensitive boolean دیفالٹ false. اگر true تو صحیح طور پر کاس ملیں.
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                آپ بھی ان کو محفوظ کرنے کے بغیر پر درخواست اووررائڈز بھی منتقل کر سکتے ہیں - شامل کریں  pronunciations کسی بھی /v1/tts/ کال پر یا تو ایک چیز یا ایک آرری کے طور پر (TTS انتہا نقطہ params دیکھیں).
            

            
            
                آرٽيڪل راوی نیا
                يه واحد

پیرامیٹرز	قسم	ضروری	وضاحت
file	file	جی ہاں	آڈیو فائل (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). زیادہ سے زیادہ 100MB.
model	string	نہیں	STT ماڈل: `ويسپر` (دفٹر)، `فاسٹر ويسپر`، `سنس وايس`
language	string	نہیں	زبان کا کوڈ. `auto` خودکار دریافت کے لیے (مقررہ).
timestamps	boolean	نہیں	لفظ-لیول ٹائم سٹیمپ شامل کریں. ڈیفالٹ: `false`
diarize	boolean	نہیں	اسپیکر ڈائریزیشن فعال کریں. ڈیفالٹ: `false`

پیرامیٹرز	قسم	ضروری	وضاحت
reference_audio	file	جی ہاں	ریفرنس وائٹس آڈیو (10-30 سیکنڈ کی رائے دی جاتی ہے). زیادہ سے زیادہ 20MB.
text	string	جی ہاں	کلون کی گئی آواز میں بولنے کے لیے متن.
model	string	نہیں	کلون ماڈل: `chatterbox` (دفٹر)، `cosyvoice2`، `gpt-sovits`
format	string	نہیں	خروجی فارمیٹ: `mp3` (دیفالٹ)، `wav`، `flac`
language	string	نہیں	مقصد زبان کوڈ. منتخب ماڈل سے مدد ملنا چاہیے.

file file	اوڈیو فائل جسے بہتر بنانا ہے
denoise boolean	نویز ختم کرنے کو فعال کریں (دیفالٹ: صحیح)
enhance_clarity boolean	بولنے کی واضحی بڑھاؤ (معیار: صحیح)
super_resolution boolean	اوڈيو کي معيار کي بلندي (دفترِاصل: غلط)
strength integer	1-3 (اُجھلا, متوسط, مضبوط). دیفالٹ: 2

file file	آڈیو فائل جدا کرنے کے لیے
model string	`demucs` (دیفالٹ) يا `spleeter`
stems integer	سٹم کی تعداد: 2, 4, 5, or 6 (دفٹر: 2)
format string	خروجی فارمیٹ: `wav`, `mp3`, `flac`

file file	پروسیسنگ کے لیے آڈیو فائل
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	تبدیل کرنے کے لیے آڈیو فائل
format string	مقصدی فارمیٹ: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	آؤٹ پٹ بٹرائٹ kbps میں: 64, 128, 192, 256, 320
sample_rate integer	نمونہ ریت: 22050، 44100، 48000
channels string	`mono` يا `stereo`

پیرامیٹرز	قسم	ضروری	وضاحت
audio	file	نہیں*	آڈیو ان پٹ (یا تو `audio` یا `text` ضروری ہے)
text	string	نہیں*	ٹیکس ان پٹ (یا تو `audio` یا `text` ضروری ہے)
voice	string	نہیں	AI جواب کے ليے آواز ديفالٹ: `af_bella`
tts_model	string	نہیں	جواب کے لیے TTS ماڈل. دیفالٹ: `kokoro`
system_prompt	string	نہیں	AI کے ليے ذاتي نظام پرو موٹ
conversation_id	string	نہیں	موجود گفتگو جاری رکھیں

پرائمری	قسم	وضاحت
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	اختیاری URL POST نتائج کے لیے جب بیچ مکمل ہو جاتا ہے.

پرائمری	قسم	وضاحت
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

پیرامیٹرز	قسم	وضاحت
model	string	ماڈل ID کے مطابق فلٹر کریں (مثال، `kokoro`)
language	string	زبان کوڈ کے مطابق فلٹر کریں (مثال، `en`)
gender	string	جنس کے مطابق فلٹر: `male`, `female`, `neutral`

پیرامیٹرز	ضروری	وضاحت
uuid	جی ہاں	کام UUID /v1/tts/ یا /v1/voice-clone/ سے واپس کیا گیا.
format	نہیں	`srt` (دفٹر) یا `vtt`.
download	نہیں	`1` `Content-Disposition: attachment` بھیجنے کے لیے تاکہ براؤزر محفوظ کرے اس کی بجائے کہ دکھائے.
language	نہیں	alignment ماڈل کے لیے اشارہ (خودکار طور پر دریافت کیا جاتا ہے اگر چھوڑ دیا جاتا ہے)

پیرامیٹرز	قسم	وضاحت
word	string	لفظ جس پر غلبہ کريں (مثال: `GIF`, `Anthropic`). لفظي حد ميں ميلاپ
replacement	string	ماڈل کے لیے اسے کیسے فہرست کیا جائے (مثال کے لیے `jiff`, `ann THROP ick`).
language	string	اختیاری ISO کوڈ. خالی = تمام زبانوں پر لاگو ہوتا ہے.
case_sensitive	boolean	دیفالٹ `false`. اگر `true` تو صحیح طور پر کاس ملیں.