API ਦਸਤਾਵੇਜ਼

ਸਾਡੇ REST API ਨਾਲ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ TTS.ai ਨੂੰ ਇਕਸਾਰ ਕਰੋ। ਸੌਖਾ ਮਾਈਗਰੇਸ਼ਨ ਲਈ OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ ਹੈ।

REST API OpenAI ਅਨੁਕੂਲ JSON ਜਵਾਬ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ

ਝਲਕ

TTS.ai API ਸਭ ਪਲੇਟਫਾਰਮ ਫੀਚਰਾਂ ਲਈ ਪ੍ਰੋਗਰਾਮਿੰਗ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ: ਪਾਠ-ਤੋਂ-ਬਾਤ ਸੰਸਲੇਸ਼ਣ, ਪਾਠ-ਤੋਂ-ਬਾਤ ਅਨੁਵਾਦ, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਆਡੀਓ ਸੁਧਾਰ, ਅਤੇ ਹੋਰ। API JSON ਬੇਨਤੀ/ਜਵਾਬ ਸਰੀਰ ਨਾਲ ਸਟੈਂਡਰਡ REST ਸੰਧੀ ਵਰਤਦਾ ਹੈ।

API ਕੁੰਜੀ

ਆਪਣੀ API ਕੁੰਜੀ ਇੱਥੇ ਲਵੋ ਅਕਾਊਂਟ ਸੈਟਿੰਗ. Pro ਅਤੇ Enterprise ਪਲਾਨ ਉੱਤੇ ਉਪਲੱਬਧ ਹੈ।

ਬੇਸ URL

https://api.tts.ai/v1/

ਪਰਮਾਣਕਿਤਾ

ਬੀਅਰਰ ਟੋਕਨ ਰਾਹੀਂ Authorization ਹੈੱਡਰ

ਪਰਮਾਣਕਿਤਾ

ਮੁਫਤ ਪੱਧਰ — ਕੋਈ ਕੁੰਜੀ ਲੋੜੀਦੀ ਨਹੀਂ ਹੈ । ਅਣਜਾਣ POSTs ਨੂੰ /v1/tts/ ਬਿਨਾਂ ਕਿਸੇ ਪ੍ਰਮਾਣਿਕਤਾ ਦੇ ਕੰਮ ਕਰੋ, 5,000 ਅੱਖਰ/ਦਿਨ ਪ੍ਰਤੀ IP ਤੱਕ, ਸਾਡੇ ਕਿਸੇ ਵੀ ਮੁਫਤ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ (piper, vits, melotts, kokoro). 15,000 ਬੋਨਸ ਅੱਖਰ ਅਤੇ ਪ੍ਰੀਮੀਅਮ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁਫਤ ਅਕਾਊਂਟ ਲਈ ਸਾਈਨ ਅੱਪ ਕਰੋ।

ਪ੍ਰੀਮੀਅਮ ਮਾਡਲਾਂ ਅਤੇ ਉੱਚ ਦਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਲਈ, ਹੇਠਾਂ ਇੱਕ ਬੀਅਰਰ ਟੋਕਨ ਨਾਲ ਪਰਮਾਣਿਤ ਕਰੋ Authorization ਹੈੱਡਰ.

HTTP ਹੈੱਡਰ
Authorization: Bearer sk-tts-your-api-key-here
ਆਪਣੀ API ਕੁੰਜੀ ਗੁਪਤ ਰੱਖੋ । ਕਲਾਂਇਟ-ਸਾਈਡ ਕੋਡ, ਪਬਲਿਕ ਰਿਪੋਜ਼ਟਰੀਆਂ ਜਾਂ ਲਾਗ ਵਿੱਚ ਸਾਂਝਾ ਨਾ ਕਰੋ । ਆਪਣੇ ਅਕਾਊਂਟ ਸੈਟਿੰਗ ਤੋਂ ਕੁੰਜੀਆਂ ਨੂੰ ਨਿਯਮਤ ਰੂਪ ਵਿੱਚ ਘੁੰਮਾਓ ।

SDKs

TTS.ai ਨੂੰ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਲਈ ਰਸਮੀ SDKs ਆਸਾਨ ਬਣਾਉਂਦੇ ਹਨ। ਦੋਵੇਂ ਓਪਨ ਸਰੋਤ ਹਨ ਅਤੇ GitHub ਉੱਤੇ ਉਪਲੱਬਧ ਹਨ।

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

ਬੇਸ URL

ਬੇਸ URL: https://api.tts.ai/v1/

ਸਭ ਅੰਤ- ਬਿੰਦੂ ਇਸ ਬੇਸ URL ਨਾਲ ਸਬੰਧਤ ਹਨ । ਉਦਾਹਰਨ ਲਈ, TTS ਅੰਤ- ਬਿੰਦੂ ਹੈ:

POST https://api.tts.ai/v1/tts/

ਰੇਟ ਲਿਮਟ

API ਰੇਟ ਲਿਮਟ ਯੋਜਨਾ ਅਨੁਸਾਰ ਵੱਖਰੀ ਹੈ:

ਪਲਾਨ ਬੇਨਤੀਆਂ/ ਮਿੰਟ ਇੱਕੋ ਸਮੇਂ ਵੱਧੋ- ਵੱਧ ਪਾਠ ਲੰਬਾਈ
ਮੁਫਤ 10 2 500 ਅੱਖਰ
ਲਾਂਚਰ 30 3 ਅੱਖਰ
ਪਰੋ 60 5 ਅੱਖਰ
ਇੰਟਰਪ੍ਰਾਈਜ਼ 300 20 50,000 ਅੱਖਰ

ਹਰੇਕ ਜਵਾਬ ਵਿੱਚ ਰੇਟ ਲਿਮਟ ਹੈਂਡਰ ਸ਼ਾਮਲ ਹਨ: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ਕ੍ਰੈਡਿਟ ਲਾਗਤ

ਸਰਵਿਸ ਕੀਮਤ ਯੂਨਿਟ
TTS (ਮੁਫ਼ਤ ਮਾਡਲ: Piper, VITS, MeloTTS) 1,000 ਅੱਖਰ ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
TTS (ਸਟੈਂਡਰਡ ਮਾਡਲ: ਕੋਕੋਰੋ, ਕੋਸੀਵਾਇਸ 2, ਆਦਿ) 2,000 ਅੱਖਰ ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
TTS (ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ: Tortoise, Chatterbox, ਆਦਿ) 4,000 ਅੱਖਰ ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
ਬੋਲੀ ਤੋਂ ਪਾਠName 2,000 ਅੱਖਰ ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲੀ ਕਲੋਨਿੰਗ 4,000 ਅੱਖਰ ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
ਬੋਲੀ ਬਦਲਣ ਵਾਲਾName 3,000 ਅੱਖਰ ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਆਡੀਓ ਸੁਧਾਰ 2,000 ਅੱਖਰ ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲ ਹਟਾਉਣ / ਬੋਲ ਵੰਡਣ 3,000-4,000 ਅੱਖਰ ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲੀ ਅਨੁਵਾਦName 5,000 ਅੱਖਰ ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਆਵਾਜ਼ ਗੱਲਬਾਤName 3,000 ਅੱਖਰ ਹਰ ਵਾਰ
ਕੁੰਜੀ & BPM ਖੋਜਕਾਰ ਮੁਫਤ --
ਆਡੀਓ ਕਨਵਰਟਰName ਮੁਫਤ --

ਪਾਠ ਤੋਂ ਬੋਲੀComment

POST /v1/tts/

ਟੈਕਸਟ ਨੂੰ ਬੋਲੀ ਆਡੀਓ ਵਿੱਚ ਬਦਲੋ । ਲੋੜੀਦੀ ਫਾਰਮੈਟ ਵਿੱਚ ਆਡੀਓ ਫਾਇਲ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।

ਬੇਨਤੀ ਭਾਗ

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
model string ਕੋਈ ਨਹੀਂ ਮਾਡਲ ID (ਜਿਵੇਂ ਕਿ kokoro, chatterbox, piper)। ਜੇਕਰ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਅਸੀਂ ਇੱਕ ਮਾਡਲ ਆਟੋ-ਚੋਣਾਂਗੇ ਜੋ ਕਿ language ਲਈ ਸਹਾਇਕ ਹੈ - en/ja/zh/ko/fr/de/it/pt/es/hi/ru ਲਈ kokoro, ਹੋਰ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.) ਲਈ piper
text string ਹਾਂ ਬੋਲੀ ਵਿੱਚ ਬਦਲਣ ਲਈ ਪਾਠ। ਪ੍ਰਤੀ ਮੰਗ ਵੱਧ ਤੋਂ ਵੱਧ: 500 ਅੱਖਰ (ਅਨੋਣਤ), 5,000 (ਮੁਫ਼ਤ ਅਕਾਊਂਟ), 1,000,000 (ਪੈਡ ਪਲਾਨ)। ਲੰਬੇ ਇੰਪੁੱਟ ਸਰਵਰ-ਸਾਇਡ ਆਟੋ-ਚੁਕੇ ਜਾਂਦੇ ਹਨ।
voice string ਹਾਂ ਆਵਾਜ਼ ID (ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ /v1/voices/ ਵਰਤੋਂ)
format string ਕੋਈ ਨਹੀਂ ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: mp3 (ਮੂਲ), wav, flac, ogg
speed float ਕੋਈ ਨਹੀਂ ਬੋਲਣ ਦੀ ਗਤੀ ਗੁਣਨਖੰਡ। ਮੂਲ: 1.0। ਰੇਜ਼: 0.5 ਤੋਂ 2.0
language string ਕੋਈ ਨਹੀਂ ਭਾਸ਼ਾ ਕੋਡ (ਜਿਵੇਂ ਕਿ en, es)। ਜੇ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਆਟੋ-ਖੋਜਿਆ ਜਾਵੇਗਾ।
instructions string ਕੋਈ ਨਹੀਂ ਕਾਰਵਾਈ / ਡਿਲੀਵਰੀ ਸੁਝਾਅ (≤500 ਅੱਖਰ) । ਉਦਾਹਰਨ ਲਈ \
pronunciations object | array ਕੋਈ ਨਹੀਂ ਹਰੇਕ ਮੰਗ ਉੱਤੇ ਉਚਾਰਨ ਉੱਤੇ ਲਿਖੋ । ਜਾਂ ਤਾਂ {\
stream boolean ਕੋਈ ਨਹੀਂ ਸਟਰੀਮਿੰਗ ਜਵਾਬ ਯੋਗ ਕਰੋ । ਡਿਫਾਲਟ: false

ਉਦਾਹਰਨ ਬੇਨਤੀ

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ਟੈਗ

ਇੰਟਰਪਲੇਅ- ਐਸਇੰਪੁੱਟਇਸ ਤਰ੍ਹਾਂ ਬੋਲਿਆ
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31ਦਸੰਬਰ ਤੀਸਰੀ- ਇੱਕ, ਓਨਵੀਂ ਨੌਵੀਂ
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

ਮਿਤੀ ਫਾਰਮੈਟ ਡਿਫਾਲਟ mdy ਅੰਗਰੇਜ਼ੀ ਲਈ ਅਤੇ dmy ਹੋਰ ਥਾਵਾਂ ਲਈ; format=\ ਨਾਲ ਅਣਡਿੱਠਾ ਕਰੋ

ਉਦਾਹਰਨ
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

ਜਵਾਬ

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

ਪੂਰਾ ਉਦਾਹਰਨ

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

ਬੋਲੀ ਤੋਂ ਪਾਠName

POST /v1/stt/

ਆਡੀਓ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਤਬਦੀਲ ਕਰੋ । ਆਟੋ- ਖੋਜ ਨਾਲ 99 ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
file file ਹਾਂ ਆਡੀਓ ਫਾਇਲ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM) । ਵੱਧੋ- ਵੱਧ 100MB ਹੈ ।
model string ਕੋਈ ਨਹੀਂ STT ਮਾਡਲ: whisper (ਮੂਲ), faster-whisper, sensevoice
language string ਕੋਈ ਨਹੀਂ ਭਾਸ਼ਾ ਕੋਡ। ਆਟੋ-ਖੋਜ ਲਈ auto (ਮੂਲ)।
timestamps boolean ਕੋਈ ਨਹੀਂ ਸ਼ਬਦ- ਪੱਧਰ ਟਾਈਮ- ਸਟੈਂਪ ਸ਼ਾਮਲ ਕਰੋ। ਡਿਫਾਲਟ: false
diarize boolean ਕੋਈ ਨਹੀਂ ਸਪੀਕਰ ਡਾਇਰੈਕਟਰੀ ਯੋਗ ਕਰੋ । ਮੂਲ: false

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

ਬੋਲੀ ਕਲੋਨਿੰਗ

POST /v1/tts/clone/

ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ । ਇੱਕ ਹਵਾਲਾ ਆਡੀਓ ਅਤੇ ਟੈਕਸਟ ਅੱਪਲੋਡ ਕਰੋ ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
reference_audio file ਹਾਂ ਰਿਫਰੈਸ਼ਨ ਵੌਇਸ ਆਡੀਓ (10-30 ਸਕਿੰਟ ਸਿਫਾਰਸ਼ੀ) । ਵੱਧੋ- ਵੱਧ 20MB ਹੈ ।
text string ਹਾਂ ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਬੋਲਣ ਲਈ ਟੈਕਸਟ ਹੈ ।
model string ਕੋਈ ਨਹੀਂ ਕਲੋਨ ਮਾਡਲ: chatterbox (ਮੂਲ), cosyvoice2, gpt-sovits
format string ਕੋਈ ਨਹੀਂ ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: mp3 (ਮੂਲ), wav, flac
language string ਕੋਈ ਨਹੀਂ ਟਾਰਗੇਟ ਭਾਸ਼ਾ ਕੋਡ ਹੈ । ਚੁਣੇ ਮਾਡਲ ਵਲੋਂ ਸਹਾਇਕ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ।

ਜਵਾਬ

ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਦੇ ਰੂਪ ਵਿੱਚ ਵਾਪਸ ਕਰੋ, ਜੋ ਕਿ TTS ਅੰਤ- ਬਿੰਦੂ ਵਾਂਗ ਹੀ ਹੈ ।

ਬੋਲੀ ਬਦਲਣ ਵਾਲਾName

POST /v1/voice-convert/

ਆਡੀਓ ਨੂੰ ਵੱਖਰੀ ਆਵਾਜ਼ ਵਾਂਗ ਸੁਣਨ ਲਈ ਬਦਲੋ । ਸਰੋਤ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ ਟਾਰਗੇਟ ਆਡੀਓ ਚੁਣੋ ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
file file ਹਾਂ ਸਰੋਤ ਆਡੀਓ ਫਾਇਲ (MP3, WAV, FLAC) । ਵੱਧੋ- ਵੱਧ 50MB ਹੈ ।
target_voice string ਹਾਂ ਤਬਦੀਲ ਕਰਨ ਲਈ ਟਾਰਗੇਟ ਬੋਲੀ ID (ਉਪਲੱਬਧ ਬੋਲੀਆਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ /v1/voices/ ਵਰਤੋਂ)
model string ਕੋਈ ਨਹੀਂ ਆਵਾਜ਼ ਬਦਲਣ ਮਾਡਲ: openvoice (ਮੂਲ), knn-vc
format string ਕੋਈ ਨਹੀਂ ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: wav (ਮੂਲ), mp3, flac

ਉਦਾਹਰਨ ਬੇਨਤੀ

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

ਜਵਾਬ

ਬਦਲੀ ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਵਾਂਗ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।

ਬੋਲੀ ਅਨੁਵਾਦName

POST /v1/speech-translate/

ਇੱਕ ਭਾਸ਼ਾ ਤੋਂ ਦੂਜੀ ਭਾਸ਼ਾ ਵਿੱਚ ਬੋਲੀ ਆਡੀਓ ਦਾ ਅਨੁਵਾਦ ਕਰੋ। ਇੱਕ ਕਾਲ ਵਿੱਚ ਬੋਲੀ-ਤੋਂ-ਪਾਠ, ਅਨੁਵਾਦ ਅਤੇ ਪਾਠ-ਤੋਂ-ਬੋਲੀ ਨੂੰ ਮਿਲਾਓ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
file file ਹਾਂ ਅਸਲੀ ਭਾਸ਼ਾ ਵਿੱਚ ਸਰੋਤ ਆਡੀਓ ਫਾਇਲ ਹੈ । ਵੱਧੋ- ਵੱਧ 100MB ਹੈ ।
target_language string ਹਾਂ ਟਾਰਗੇਟ ਭਾਸ਼ਾ ਕੋਡ (ਜਿਵੇਂ ਕਿ es, fr, de, ja)
voice string ਕੋਈ ਨਹੀਂ ਅਨੁਵਾਦ ਆਉਟਪੁੱਟ ਲਈ ਆਵਾਜ਼ । ਜੇ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਆਟੋ- ਚੁਣਿਆ ਜਾਵੇਗਾ ।
preserve_voice boolean ਕੋਈ ਨਹੀਂ ਅਸਲੀ ਸਪੀਕਰ ਦੀ ਆਵਾਜ਼ ਵਿਸ਼ੇਸ਼ਤਾ ਸੰਭਾਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ। ਡਿਫਾਲਟ: false

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

ਬੋਲੀ ਤੋਂ ਬੋਲੀComment

POST /v1/speech-to-speech/

ਭਾਸ਼ਾ ਸਟਾਈਲ, ਭਾਵਨਾ ਜਾਂ ਸਮੱਗਰੀ ਨੂੰ ਸੰਭਾਲਦੇ ਹੋਏ ਸੰਚਾਰ ਬਦਲੋ । ਟੋਨ, ਪੈਸਿੰਗ ਅਤੇ ਭਾਵਨਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲ ਕਰਨ ਲਈ ਫਾਇਦੇਮੰਦ ਹੈ ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
file file ਹਾਂ ਸਰੋਤ ਬੋਲੀ ਆਡੀਓ ਫਾਇਲ । ਵੱਧੋ- ਵੱਧ 50MB ਹੈ ।
voice string ਹਾਂ ਆਉਟਪੁੱਟ ਬੋਲੀ ਲਈ ਟਾਰਗੇਟ ਬੋਲੀ ID
model string ਕੋਈ ਨਹੀਂ ਮਾਡਲ: openvoice (ਮੂਲ), chatterbox
emotion string ਕੋਈ ਨਹੀਂ ਟਾਰਗੇਟ ਭਾਵਨਾ: neutral, happy, sad, angry, excited
speed float ਕੋਈ ਨਹੀਂ ਸਪੀਡ ਅਡਜੱਸਟਮੈਂਟ। ਡਿਫਾਲਟ: 1.0। ਰੇਜ਼: 0.5 ਤੋਂ 2.0

ਜਵਾਬ

ਤਬਦੀਲ ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਵਾਂਗ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।

ਆਡੀਓ ਟੂਲName

ਆਡੀਓ ਪ੍ਰੋਸੈੱਸਿੰਗ ਅੰਤ- ਬਿੰਦੂ ਵਧਾਉਣ, ਬੋਲ ਹਟਾਉਣ, ਸਟੈਮ ਵੰਡਣ ਅਤੇ ਹੋਰ ਲਈ

POST /v1/audio/enhance/

ਆਡੀਓ ਕੁਆਲਟੀ ਵਧਾਓ: ਨੌਇਸ ਹਟਾਓ, ਸਪੱਸ਼ਟੀਕਰਨ ਵਧਾਓ, ਸੁਪਰ ਰੈਜ਼ੋਲੂਸ਼ਨ ।

file fileਵਧਾਉਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
denoise booleanਡਿਨੋਇਸਿੰਗ ਯੋਗ (ਡਿਫਾਲਟ: ਸੱਚ)
enhance_clarity booleanਬੋਲੀ ਸਪੱਸ਼ਟਤਾ ਵਧਾਓ (ਮੂਲ: ਸੱਚ)
super_resolution booleanਆਡੀਓ ਕੁਆਲਟੀ ਅੱਪਸਕੇਲ (ਮੂਲ: ਝੂਠਾ)
strength integer1-3(ਹਲਕਾ, ਦਰਮਿਆਨਾ, ਮਜ਼ਬੂਤ) ਡਿਫਾਲਟ: 2
POST /v1/audio/separate/

ਵੋਕਲ ਨੂੰ ਸੰਗੀਤ ਤੋਂ ਵੱਖ ਕਰੋ (ਵਾਕ ਹਟਾਉਣਾ) ਜਾਂ ਸਟੈਮ ਵਿੱਚ ਵੰਡੋ ।

file fileਵੱਖ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
model stringdemucs (ਡਿਫਾਲਟ) ਜਾਂ spleeter
stems integerਸਟੈਮ ਦੀ ਗਿਣਤੀ: 2, 4, 5, ਜਾਂ6(ਮੂਲ: 2)
format stringਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: wav, mp3, flac
POST /v1/audio/dereverb/

ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਤੋਂ ਈਕੋ ਅਤੇ ਰਿਵਰਬ ਹਟਾਓ ।

file fileਪਰੋਸੈਸ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ ਮੁਫਤ

ਕੀ, BPM ਅਤੇ ਟਾਈਮ ਦਸਤਖਤ ਲੱਭਣ ਲਈ ਆਡੀਓ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ ।

file fileਜਾਂਚ ਲਈ ਆਡੀਓ ਫਾਇਲ
ਜਵਾਬ
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ ਮੁਫਤ

ਆਡੀਓ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਬਦਲੋ ।

file fileਬਦਲਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
format stringਟਾਰਗੇਟ ਫਾਰਮੈਟ: mp3, wav, flac, ogg, m4a, aac
bitrate integerਆਉਟਪੁੱਟ ਬਿੱਟਰੇਟ kbps ਵਿੱਚ: 64, 128, 192, 256, 320
sample_rate integerਸੈਂਪਲ ਰੇਟ: 22050, 44100, 48000
channels stringmono ਜਾਂ stereo

ਆਵਾਜ਼ ਗੱਲਬਾਤName

POST /v1/voice-chat/

ਆਡੀਓ ਜਾਂ ਟੈਕਸਟ ਭੇਜੋ ਅਤੇ ਸੰਸਲੇਸ਼ਿਤ ਬੋਲੀ ਨਾਲ AI ਜਵਾਬ ਪ੍ਰਾਪਤ ਕਰੋ।

ਬੇਨਤੀ ਭਾਗ (multipart/form-data ਜਾਂ JSON)

ਪੈਰਾਮੀਟਰਟਾਈਪਲੋੜੀਦਾਵੇਰਵਾ
audio file ਕੋਈ ਨਹੀਂ* ਆਡੀਓ ਇੰਪੁੱਟ (audio ਜਾਂ text ਲੋੜੀਦਾ ਹੈ)
text string ਕੋਈ ਨਹੀਂ* ਟੈਕਸਟ ਇੰਪੁੱਟ (audio ਜਾਂ text ਲੋੜੀਦਾ ਹੈ)
voice string ਕੋਈ ਨਹੀਂ AI ਜਵਾਬ ਲਈ ਆਵਾਜ਼। ਡਿਫਾਲਟ: af_bella
tts_model string ਕੋਈ ਨਹੀਂ ਜਵਾਬ ਲਈ TTS ਮਾਡਲ ਹੈ। ਡਿਫਾਲਟ: kokoro
system_prompt string ਕੋਈ ਨਹੀਂ AI ਲਈ ਪਸੰਦੀਦਾ ਸਿਸਟਮ ਪੁਆਇੰਟਰ
conversation_id string ਕੋਈ ਨਹੀਂ ਮੌਜੂਦਾ ਗੱਲਬਾਤ ਜਾਰੀ ਰੱਖੋ

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

ਬੈਚ TTS

POST /v1/tts/batch/

ਪੈਰਲਲ TTS ਬਣਾਉਣ ਲਈ ਕਈ ਟੈਕਸਟ ਭੇਜੋ । ਚੋਣਵੀਂ ਵੈਬਹੁੱਕ ਕਾਲਬੈਕ ਪ੍ਰਾਪਤ ਕਰੋ, ਜਦੋਂ ਸਭ ਕੰਮ ਪੂਰੇ ਹੋਣ ।

ਪੈਰਾਮੀਟਰ

ਪੈਰਾਮੀਟਰਟਾਈਪਵੇਰਵਾ
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringਜਦੋਂ ਬੈਚ ਮੁਕੰਮਲ ਹੋਵੇ ਤਾਂ POST ਨਤੀਜੇ ਲਈ ਚੋਣਵੀਂ URL ਹੈ ।

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

GET /v1/tts/batch/result/?batch_id=abc123 ਨਾਲ ਪੁਲਿਸ ਪ੍ਰਗਤੀ

ਬੋਲੀ ਇੰਬੈੱਡਿੰਗ

POST /v1/voice-embed/

ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਇੱਕ ਬੋਲੀ ਇੰਬੈੱਡ ਕਰਨ ਲਈ ਪਹਿਲਾਂ-ਗਣਨਾ ਕਰੋ। ਬਾਅਦ ਵਿੱਚ ਬੋਲੀ ਕਲੋਨਿੰਗ ਮੰਗਾਂ ਲਈ ਸਿੱਧੀ-ਉੱਤੇ-ਅੰਤ ਪੈਦਾ ਕਰਨ ਲਈ embed_id ਵਰਤੋਂ।

ਪੈਰਾਮੀਟਰ

ਪੈਰਾਮੀਟਰਟਾਈਪਵੇਰਵਾ
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

ਸਿਹਤ ਚੈੱਕ

GET /v1/health/

GPU ਸਰਵਰ ਹਾਲਤ, ਲੋਡ ਮਾਡਲ ਅਤੇ ਕਤਾਰ ਸਾਈਜ਼ ਚੈੱਕ ਕਰੋ । ਕੋਈ ਪਰਮਾਣਕਿਤਾ ਲੋੜੀਦੀ ਨਹੀਂ ਹੈ । 30 ਸਕਿੰਟ ਲਈ ਕੈਸ਼ ਕੀਤਾ ।

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

ਮਾਡਲਾਂ ਦੀ ਲਿਸਟ

GET /v1/models/

ਸਭ ਉਪਲੱਬਧ ਮਾਡਲਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਲਿਸਟ ਦਿੰਦਾ ਹੈ ।

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

ਆਵਾਜ਼ ਲਿਸਟ

GET /v1/voices/

ਸਭ ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਦੀ ਲਿਸਟ ਦਿੰਦਾ ਹੈ, ਜੋ ਕਿ ਮਾਡਲ ਜਾਂ ਭਾਸ਼ਾ ਨਾਲ ਫਿਲਟਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ।

ਕਿਊਰੀ ਪੈਰਾਮੀਟਰ

ਪੈਰਾਮੀਟਰਟਾਈਪਵੇਰਵਾ
model string ਮਾਡਲ ID ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ kokoro)
language string ਭਾਸ਼ਾ ਕੋਡ ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ en)
gender string ਲਿੰਗ ਮੁਤਾਬਕ ਫਿਲਟਰ: male, female, neutral

ਜਵਾਬ

JSON ਜਵਾਬ
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

ਸਬ- ਟਾਈਟਲ (SRT / VTT) ਨਵਾਂ

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

ਕਿਸੇ ਵੀ ਪੂਰੇ TTS ਕੰਮ ਲਈ ਸਮਕਾਲੀ ਸਬ- ਟਾਈਟਲ ਬਣਾਓ । ਆਡੀਓ ਉੱਤੇ Whisper ਅਲਾਇੰਸ ਚਲਾਓ ਅਤੇ SRT ਜਾਂ WebVTT ਦਿਓ । ਨਤੀਜਾ ਡਿਸਕ ਉੱਤੇ ਕੈਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਕਿ ਇੱਕੋ uuid ਲਈ ਦੂਜਾ ਕਾਲ ਇੱਕ ਡਿਸਕ ਪੜ੍ਹਨ ਲਈ ਹੋਵੇ ।

ਕਿਊਰੀ ਪੈਰਾਮੀਟਰ

ਪੈਰਾਮੀਟਰਲੋੜੀਦਾਵੇਰਵਾ
uuidਹਾਂ/v1/tts/ ਜਾਂ /v1/voice-clone/ ਵਲੋਂ ਵਾਪਸ ਕੀਤੀ ਜਾਬ UUID ਹੈ।
formatਕੋਈ ਨਹੀਂsrt (ਮੂਲ) ਜਾਂ vtt
downloadਕੋਈ ਨਹੀਂ1 Content-Disposition: attachment ਭੇਜਣ ਲਈ ਤਾਂ ਕਿ ਬਰਾਊਜ਼ਰ ਵੇਖਾਉਣ ਦੀ ਬਜਾਏ ਸੰਭਾਲੇ।
languageਕੋਈ ਨਹੀਂਇਕਸਾਰਤਾ ਮਾਡਲ ਲਈ ਇਸ਼ਾਰਾ (ਜੇ ਛੱਡਿਆ ਜਾਵੇ ਤਾਂ ਆਟੋ- ਖੋਜਿਆ ਜਾਵੇਗਾ) ।
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

ਉਚਾਰਨ ਡਿਕਸ਼ਨਰੀ ਨਵਾਂ

GET POST DELETE /api/v1/pronunciations/

TTS ਇੰਜਣ ਨੂੰ ਦੱਸੋ ਕਿ ਖਾਸ ਸ਼ਬਦ ਕਿਵੇਂ ਉਚਾਰੇ ਜਾਣ। ਸੰਭਾਲੀਆਂ ਐਂਟਰੀਆਂ ਆਟੋਮੈਟਿਕ ਹੀ ਹਰ TTS ਮੰਗ ਉੱਤੇ ਲਾਗੂ ਹੋ ਜਾਂਦੀਆਂ ਹਨ। ਪ੍ਰਤੀ ਅਕਾਊਂਟ 200 ਐਂਟਰੀਆਂ ਦੀ ਸੀਮਾ ਹੈ।

ਬੇਨਤੀ ਭਾਗ (POST)

ਪੈਰਾਮੀਟਰਟਾਈਪਵੇਰਵਾ
wordstringਉੱਤੇ ਲਿਖਣ ਲਈ ਸ਼ਬਦ (ਜਿਵੇਂ ਕਿ GIF, Anthropic)। ਸ਼ਬਦ-ਬੰਡਲ ਮਿਲਿਆ।
replacementstringਮਾਡਲ ਲਈ ਇਸ ਦਾ ਸ਼ਬਦ-ਜੋੜ ਕਿਵੇਂ ਹੈ (ਜਿਵੇਂ jiff, ann THROP ick)।
languagestringਚੋਣਵਾਂ ISO ਕੋਡ । ਖਾਲੀ = ਸਭ ਭਾਸ਼ਾਵਾਂ ਲਈ ਲਾਗੂ ਹੈ ।
case_sensitivebooleanਡਿਫਾਲਟ false ਹੈ। true ਦੇ ਨਾਲ ਕੇਸ ਮਿਲਦਾ ਹੈ।
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

ਤੁਸੀਂ ਬਿਨਾਂ ਸੰਭਾਲੇ ਪਰ- ਮੰਗ ਉੱਤੇ ਲਿਖ ਸਕਦੇ ਹੋ - ਕਿਸੇ ਵੀ /v1/tts/ ਕਾਲ ਉੱਤੇ pronunciations ਨੂੰ ਇੱਕ ਆਬਜੈਕਟ ਜਾਂ ਐਰੇ ਦੇ ਤੌਰ ਤੇ ਸ਼ਾਮਲ ਕਰੋ (TTS ਅੰਤ- ਬਿੰਦੂ ਪੈਰਾਮੀਟਰ ਵੇਖੋ) ।

ਲੇਖ ਗਾਇਕ ਨਵਾਂ

ਕਿਸੇ ਵੀ ਲੇਖ ਪੇਜ਼ ਉੱਤੇ ਇੱਕ