ਮੈਂ API ਕੁੰਜੀ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹਾਂ?

ਮੁਫਤ TTS.ai ਅਕਾਊਂਟ ਲਈ ਰਜਿਸਟਰਡ ਹੋਵੋ, ਫਿਰ ਆਪਣੇ ਅਕਾਊਂਟ ਡੈਸ਼ਬੋਰਡ ਉੱਤੇ ਜਾਓ ਅਤੇ "API ਕੁੰਜੀ ਬਣਾਓ" ਨੂੰ ਕਲਿੱਕ ਕਰੋ। ਤੁਹਾਡੀ ਕੁੰਜੀ ਨੂੰ sk-tts- ਨਾਲ ਪਹਿਲਾਂ ਰੱਖਿਆ ਜਾਵੇਗਾ ਅਤੇ ਤੁਰੰਤ ਵਰਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਮੁਫਤ ਅਕਾਊਂਟ ਨੂੰ ਸ਼ੁਰੂ ਕਰਨ ਲਈ 15,000 ਅੱਖਰ ਮਿਲਦੇ ਹਨ।

ਕੀ API OpenAI ਦੇ ਫਾਰਮੈਟ ਨਾਲ ਅਨੁਕੂਲ ਹੈ?

ਹਾਂ, ਸਾਡਾ API OpenAI- ਅਨੁਕੂਲ ਬੇਨਤੀ ਅਤੇ ਜਵਾਬ ਫਾਰਮੈਟ ਨੂੰ ਪਸੰਦ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ ਮੌਜੂਦਾ ਕੋਡ ਹੈ, ਜੋ ਕਿ OpenAI ਦਾ TTS API ਵਰਤਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਬੇਸ URL ਅਤੇ API ਕੁੰਜੀ ਨੂੰ ਘੱਟੋ-ਘੱਟ ਕੋਡ ਤਬਦੀਲੀਆਂ ਨਾਲ TTS.ai ਲਈ ਬਦਲ ਸਕਦੇ ਹੋ।

ਕਿਹੜੀਆਂ ਪ੍ਰੋਗਰਾਮਿੰਗ ਭਾਸ਼ਾਵਾਂ ਸਹਾਇਕ ਹਨ?

REST API ਕਿਸੇ ਵੀ ਭਾਸ਼ਾ ਨਾਲ ਕੰਮ ਕਰਦੀ ਹੈ, ਜੋ ਕਿ HTTP ਬੇਨਤੀਆਂ ਕਰ ਸਕਦੀ ਹੈ । ਅਸੀਂ ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ (Node. js ਅਤੇ ਝਲਕਾਰਾ), cURL ਅਤੇ ਹੋਰਾਂ ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਾਂ । HTTP ਕਲਾਇਟ ਲਾਇਬਰੇਰੀ (Go, Ruby, Java, C#, PHP, ਆਦਿ) ਨਾਲ ਕੋਈ ਵੀ ਭਾਸ਼ਾ API ਨੂੰ ਵਰਤ ਸਕਦੀ ਹੈ ।

API ਦੀ ਦਰ ਸੀਮਾ ਕੀ ਹੈ?

ਮੁਫਤ ਅਕਾਊਂਟ ਪ੍ਰਤੀ ਘੰਟਾ3ਮੰਗਾਂ ਤੱਕ ਸੀਮਿਤ ਹਨ। ਭੁਗਤਾਨ ਕੀਤੇ ਯੋਜਨਾਵਾਂ ਵਿੱਚ ਤੁਹਾਡੀ ਮੈਂਬਰੀ ਪੱਧਰ 'ਤੇ ਅਧਾਰਿਤ ਵਧੇਰੇ ਸੀਮਾਵਾਂ ਹਨ: ਸਟਾਰਟਅੱਪ (60/ਘੰਟਾ), ਪਰੋਫੈਸ਼ਨਲ (300/ਘੰਟਾ), ਇੰਟਰਪ੍ਰਾਈਜ਼ (ਅਣ- ਸੀਮਿਤ)। ਹਰ API ਜਵਾਬ ਵਿੱਚ ਰੇਟ ਲਿਮਟ ਹੈਡਰ ਸ਼ਾਮਲ ਹਨ।

API ਕੀਮਤ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ?

API ਵਰਤੋਂ ਮਾਡਲ ਟਾਇਰ ਅਤੇ ਪਾਠ ਲੰਬਾਈ ਉੱਤੇ ਅਧਾਰਿਤ ਅੱਖਰ ਵਰਤਦੀ ਹੈ। ਮੁਫਤ ਮਾਡਲ0ਅੱਖਰ ਵਰਤਦੇ ਹਨ, ਸਟੈਂਡਰਡ ਮਾਡਲ2x ਅੱਖਰ ਵਰਤਦੇ ਹਨ ਅਤੇ ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ 4x ਅੱਖਰ ਵਰਤਦੇ ਹਨ। ਅੱਖਰ ਸਭ ਭੁਗਤਾਨ ਯੋਜਨਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ ਅਤੇ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਅੱਖਰ ਪੈਕ ਵਜੋਂ ਵੀ ਖਰੀਦੇ ਜਾ ਸਕਦੇ ਹਨ।

ਕੀ ਅੰਤ- ਬਿੰਦੂ ਉਪਲੱਬਧ ਹਨ?

API ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ (POST /v1/tts/), ਸਪੀਚ-ਟੂ-ਸਪੀਚ (POST /v1/transcribe/), ਆਵਾਜ਼ ਕਲੋਨਿੰਗ (POST /v1/voice-clone/), ਆਵਾਜ਼ ਪਰਿਵਰਤਨ (POST /v1/voice-convert/), ਆਵਾਜ਼ ਅਨੁਵਾਦ (POST /v1/speech-translate/), ਆਡੀਓ ਸੁਧਾਰ (POST /v1/audio-enhance/), ਆਵਾਜ਼ ਹਟਾਉਣ, ਸਟੈਮ ਸਪਲਿਟਿੰਗ, ਕੁੰਜੀ ਅਤੇ BPM ਵਿਸ਼ਲੇਸ਼ਣ, ਅਤੇ ਹੋਰ ਲਈ ਅੰਤ ਬਿੰਦੂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

API ਕਿਹੜੇ ਆਡੀਓ ਫਾਰਮੈਟ ਦਿੰਦਾ ਹੈ?

API ਡਿਫਾਲਟ ਤੌਰ ਉੱਤੇ WAV ਫਾਰਮੈਟ ਵਿੱਚ ਆਡੀਓ ਦਿੰਦਾ ਹੈ । ਤੁਸੀਂ ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ (mp3, wav, ogg, flac) response_ format ਪੈਰਾਮੀਟਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਦੇ ਸਕਦੇ ਹੋ । ਵੈੱਬ ਐਪਲੀਕੇਸ਼ਨ ਲਈ MP3 ਦੀ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਹੋਰ ਆਡੀਓ ਪਰੋਸੈਸਿੰਗ ਲਈ WAV ਦੀ ।

ਕੀ ਰੀਅਲ-ਟਾਈਮ TTS ਲਈ ਇੱਕ ਸਟਰੀਮਿੰਗ API ਹੈ?

ਹਾਂ, ਸਾਡਾ ਅ- ਸਮਕਾਲੀ API ਇੱਕ ਜਾਬ UUID ਦਿੰਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਨਤੀਜਿਆਂ ਲਈ ਪੁਲਿਸ ਕਰ ਸਕਦੇ ਹੋ। ਕੋਕੋਰੋ ਵਰਗੇ ਸਹਾਇਕ ਮਾਡਲਾਂ ਲਈ, ਆਡੀਓ ਬਣਾਉਣਾ ਨਜ਼ਦੀਕੀ- ਰੀਅਲ- ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਕਾਫੀ ਤੇਜ਼ ਹੈ। ਪੁਲਿਸ ਅੰਤ- ਬਿੰਦੂ ਆਡੀਓ URL ਦਿੰਦਾ ਹੈ, ਜਦੋਂ ਪਰੋਸੈਸ ਪੂਰਾ ਹੁੰਦਾ ਹੈ।

ਮੈਂ API ਵਿੱਚ ਗਲਤੀਆਂ ਕਿਵੇਂ ਹੈਂਡਲ ਕਰਾਂ?

API ਸਟੈਂਡਰਡ HTTP ਹਾਲਤ ਕੋਡ (400 ਗਲਤ ਬੇਨਤੀਆਂ ਲਈ, 401 ਪਰਮਾਣਕਿਤਾ ਗਲਤੀਆਂ ਲਈ, 429 ਰੇਟ ਲਿਮਟ ਲਈ, 500 ਸਰਵਰ ਗਲਤੀਆਂ ਲਈ) JSON ਗਲਤੀ ਸੁਨੇਹੇ ਨਾਲ ਵਾਪਸ ਦਿੰਦਾ ਹੈ । ਠੀਕ ਗਲਤੀ ਹੈਂਡਲਿੰਗ ਲਈ ਜਵਾਬ ਵਿੱਚ ਹਾਲਤ ਕੋਡ ਅਤੇ ਗਲਤੀ ਖੇਤਰ ਹਮੇਸ਼ਾ ਚੈੱਕ ਕਰੋ ।

ਕੀ ਮੈਂ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਲਈ API ਵਰਤ ਸਕਦਾ ਹਾਂ?

ਹਾਂ, API ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ। API ਰਾਹੀਂ ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਉਤਪਾਦਾਂ, ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਸਰਵਿਸਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਸਭ ਮਾਡਲ ਓਪਨ-ਸੋਰਸ ਲਾਈਸੈਂਸ ਵਰਤਦੇ ਹਨ ਅਤੇ ਬਣਾਈ ਆਡੀਓ ਉੱਤੇ ਕੋਈ ਵਾਧੂ ਰਿਆਇਤ ਨਹੀਂ ਹੈ।

ਕੀ ਕੋਈ ਸੇਂਡਬਾਕਸ ਜਾਂ ਟੈਸਟ ਇੰਵਾਇਰਨਮੈਂਟ ਹੈ?

ਮੁਫਤ- ਪੱਧਰ ਮਾਡਲ (ਕੋਕੋਰੋ, ਪਾਈਪਰ, VITS, MeloTTS) ਇੱਕ ਵਧੀਆ ਸੇਂਡਬਾਕਸ ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ - ਉਹਨਾਂ ਵਿੱਚ ਸ਼ੂਗਰ ਅੱਖਰ ਨਹੀਂ ਵਰਤੇ ਜਾਂਦੇ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸਭ ਅਕਾਊਂਟ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਉਤਪਾਦਨ ਲਈ ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ ਵਿੱਚ ਬਦਲਣ ਤੋਂ ਪਹਿਲਾਂ ਮੁਫਤ ਮਾਡਲਾਂ ਨਾਲ ਆਪਣਾ ਇੱਕਜੁਟਤਾ ਟੈਸਟ ਕਰੋ।

ਮੈਂ API ਰਾਹੀਂ ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਅਤੇ ਮਾਡਲਾਂ ਦੀ ਲਿਸਟ ਕਿਵੇਂ ਬਣਾ ਸਕਦਾ ਹਾਂ?

ਫਿਲਟਰਿੰਗ ਚੋਣਾਂ (ਮੈਡਲ, ਭਾਸ਼ਾ, ਲਿੰਗ) ਨਾਲ ਸਭ ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ GET /v1/voices ਵਰਤੋਂ। ਸਭ ਉਪਲੱਬਧ TTS ਮਾਡਲਾਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ GET /v1/models ਵਰਤੋਂ। ਦੋਵੇਂ ਅੰਤ-ਪੁਣੇ JSON ਜਵਾਬ ਦਿੰਦਾ ਹੈ।

ਬੱਗ ਰਿਪੋਰਟ / ਫੀਚਰ ਮੰਗ

API ਦਸਤਾਵੇਜ਼

ਸਾਡੇ REST API ਨਾਲ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ TTS.ai ਨੂੰ ਇਕਸਾਰ ਕਰੋ। ਸੌਖਾ ਮਾਈਗਰੇਸ਼ਨ ਲਈ OpenAI- ਅਨੁਕੂਲ ਫਾਰਮੈਟ ਹੈ।

REST API OpenAI ਅਨੁਕੂਲ JSON ਜਵਾਬ ਸਟਰੀਮਿੰਗ ਸਹਿਯੋਗ

ਝਲਕ

TTS.ai API ਸਭ ਪਲੇਟਫਾਰਮ ਫੀਚਰਾਂ ਲਈ ਪ੍ਰੋਗਰਾਮਿੰਗ ਪਹੁੰਚ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ: ਪਾਠ-ਤੋਂ-ਬਾਤ ਸੰਸਲੇਸ਼ਣ, ਪਾਠ-ਤੋਂ-ਬਾਤ ਅਨੁਵਾਦ, ਬੋਲੀ ਕਲੋਨਿੰਗ, ਆਡੀਓ ਸੁਧਾਰ, ਅਤੇ ਹੋਰ। API JSON ਬੇਨਤੀ/ਜਵਾਬ ਸਰੀਰ ਨਾਲ ਸਟੈਂਡਰਡ REST ਸੰਧੀ ਵਰਤਦਾ ਹੈ।

API ਕੁੰਜੀ

ਆਪਣੀ API ਕੁੰਜੀ ਇੱਥੇ ਲਵੋ ਅਕਾਊਂਟ ਸੈਟਿੰਗ. Pro ਅਤੇ Enterprise ਪਲਾਨ ਉੱਤੇ ਉਪਲੱਬਧ ਹੈ।

ਬੇਸ URL

https://api.tts.ai/v1/

ਪਰਮਾਣਕਿਤਾ

ਬੀਅਰਰ ਟੋਕਨ ਰਾਹੀਂ Authorization ਹੈੱਡਰ

ਪਰਮਾਣਕਿਤਾ

ਮੁਫਤ ਪੱਧਰ — ਕੋਈ ਕੁੰਜੀ ਲੋੜੀਦੀ ਨਹੀਂ ਹੈ । ਅਣਜਾਣ POSTs ਨੂੰ /v1/tts/ ਬਿਨਾਂ ਕਿਸੇ ਪ੍ਰਮਾਣਿਕਤਾ ਦੇ ਕੰਮ ਕਰੋ, 5,000 ਅੱਖਰ/ਦਿਨ ਪ੍ਰਤੀ IP ਤੱਕ, ਸਾਡੇ ਕਿਸੇ ਵੀ ਮੁਫਤ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ (piper, vits, melotts, kokoro). 15,000 ਬੋਨਸ ਅੱਖਰ ਅਤੇ ਪ੍ਰੀਮੀਅਮ ਮਾਡਲਾਂ ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਮੁਫਤ ਅਕਾਊਂਟ ਲਈ ਸਾਈਨ ਅੱਪ ਕਰੋ।

ਪ੍ਰੀਮੀਅਮ ਮਾਡਲਾਂ ਅਤੇ ਉੱਚ ਦਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਲਈ, ਹੇਠਾਂ ਇੱਕ ਬੀਅਰਰ ਟੋਕਨ ਨਾਲ ਪਰਮਾਣਿਤ ਕਰੋ Authorization ਹੈੱਡਰ.

HTTP ਹੈੱਡਰ

Authorization: Bearer sk-tts-your-api-key-here

ਆਪਣੀ API ਕੁੰਜੀ ਗੁਪਤ ਰੱਖੋ । ਕਲਾਂਇਟ-ਸਾਈਡ ਕੋਡ, ਪਬਲਿਕ ਰਿਪੋਜ਼ਟਰੀਆਂ ਜਾਂ ਲਾਗ ਵਿੱਚ ਸਾਂਝਾ ਨਾ ਕਰੋ । ਆਪਣੇ ਅਕਾਊਂਟ ਸੈਟਿੰਗ ਤੋਂ ਕੁੰਜੀਆਂ ਨੂੰ ਨਿਯਮਤ ਰੂਪ ਵਿੱਚ ਘੁੰਮਾਓ ।

SDKs

TTS.ai ਨੂੰ ਆਪਣੇ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਕਰਨ ਲਈ ਰਸਮੀ SDKs ਆਸਾਨ ਬਣਾਉਂਦੇ ਹਨ। ਦੋਵੇਂ ਓਪਨ ਸਰੋਤ ਹਨ ਅਤੇ GitHub ਉੱਤੇ ਉਪਲੱਬਧ ਹਨ।

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

ਬੇਸ URL

ਬੇਸ URL: https://api.tts.ai/v1/

ਸਭ ਅੰਤ- ਬਿੰਦੂ ਇਸ ਬੇਸ URL ਨਾਲ ਸਬੰਧਤ ਹਨ । ਉਦਾਹਰਨ ਲਈ, TTS ਅੰਤ- ਬਿੰਦੂ ਹੈ:

POST https://api.tts.ai/v1/tts/

ਰੇਟ ਲਿਮਟ

API ਰੇਟ ਲਿਮਟ ਯੋਜਨਾ ਅਨੁਸਾਰ ਵੱਖਰੀ ਹੈ:

ਪਲਾਨ	ਬੇਨਤੀਆਂ/ ਮਿੰਟ	ਇੱਕੋ ਸਮੇਂ	ਵੱਧੋ- ਵੱਧ ਪਾਠ ਲੰਬਾਈ
ਮੁਫਤ	10	2	500 ਅੱਖਰ
ਲਾਂਚਰ	30	3	ਅੱਖਰ
ਪਰੋ	60	5	ਅੱਖਰ
ਇੰਟਰਪ੍ਰਾਈਜ਼	300	20	50,000 ਅੱਖਰ

ਹਰੇਕ ਜਵਾਬ ਵਿੱਚ ਰੇਟ ਲਿਮਟ ਹੈਂਡਰ ਸ਼ਾਮਲ ਹਨ: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

ਕ੍ਰੈਡਿਟ ਲਾਗਤ

ਸਰਵਿਸ	ਕੀਮਤ	ਯੂਨਿਟ
TTS (ਮੁਫ਼ਤ ਮਾਡਲ: Piper, VITS, MeloTTS)	1,000 ਅੱਖਰ	ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
TTS (ਸਟੈਂਡਰਡ ਮਾਡਲ: ਕੋਕੋਰੋ, ਕੋਸੀਵਾਇਸ 2, ਆਦਿ)	2,000 ਅੱਖਰ	ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
TTS (ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ: Tortoise, Chatterbox, ਆਦਿ)	4,000 ਅੱਖਰ	ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
ਬੋਲੀ ਤੋਂ ਪਾਠName	2,000 ਅੱਖਰ	ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲੀ ਕਲੋਨਿੰਗ	4,000 ਅੱਖਰ	ਪ੍ਰਤੀ 1,000 ਅੱਖਰ
ਬੋਲੀ ਬਦਲਣ ਵਾਲਾName	3,000 ਅੱਖਰ	ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਆਡੀਓ ਸੁਧਾਰ	2,000 ਅੱਖਰ	ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲ ਹਟਾਉਣ / ਬੋਲ ਵੰਡਣ	3,000-4,000 ਅੱਖਰ	ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਬੋਲੀ ਅਨੁਵਾਦName	5,000 ਅੱਖਰ	ਆਡੀਓ ਪ੍ਰਤੀ ਮਿੰਟ
ਆਵਾਜ਼ ਗੱਲਬਾਤName	3,000 ਅੱਖਰ	ਹਰ ਵਾਰ
ਕੁੰਜੀ & BPM ਖੋਜਕਾਰ	ਮੁਫਤ	--
ਆਡੀਓ ਕਨਵਰਟਰName	ਮੁਫਤ	--

ਪਾਠ ਤੋਂ ਬੋਲੀComment

POST /v1/tts/

ਟੈਕਸਟ ਨੂੰ ਬੋਲੀ ਆਡੀਓ ਵਿੱਚ ਬਦਲੋ । ਲੋੜੀਦੀ ਫਾਰਮੈਟ ਵਿੱਚ ਆਡੀਓ ਫਾਇਲ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।

ਬੇਨਤੀ ਭਾਗ

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਲੋੜੀਦਾ	ਵੇਰਵਾ
model	string	ਕੋਈ ਨਹੀਂ	ਮਾਡਲ ID (ਜਿਵੇਂ ਕਿ `kokoro`, `chatterbox`, `piper`)। ਜੇਕਰ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਅਸੀਂ ਇੱਕ ਮਾਡਲ ਆਟੋ-ਚੋਣਾਂਗੇ ਜੋ ਕਿ `language` ਲਈ ਸਹਾਇਕ ਹੈ - en/ja/zh/ko/fr/de/it/pt/es/hi/ru ਲਈ `kokoro`, ਹੋਰ ਸਹਾਇਕ ਭਾਸ਼ਾਵਾਂ (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.) ਲਈ `piper`।
text	string	ਹਾਂ	ਬੋਲੀ ਵਿੱਚ ਬਦਲਣ ਲਈ ਪਾਠ। ਪ੍ਰਤੀ ਮੰਗ ਵੱਧ ਤੋਂ ਵੱਧ: 500 ਅੱਖਰ (ਅਨੋਣਤ), 5,000 (ਮੁਫ਼ਤ ਅਕਾਊਂਟ), 1,000,000 (ਪੈਡ ਪਲਾਨ)। ਲੰਬੇ ਇੰਪੁੱਟ ਸਰਵਰ-ਸਾਇਡ ਆਟੋ-ਚੁਕੇ ਜਾਂਦੇ ਹਨ।
voice	string	ਹਾਂ	ਆਵਾਜ਼ ID (ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ `/v1/voices/` ਵਰਤੋਂ)
format	string	ਕੋਈ ਨਹੀਂ	ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: `mp3` (ਮੂਲ), `wav`, `flac`, `ogg`
speed	float	ਕੋਈ ਨਹੀਂ	ਬੋਲਣ ਦੀ ਗਤੀ ਗੁਣਨਖੰਡ। ਮੂਲ: `1.0`। ਰੇਜ਼: `0.5` ਤੋਂ `2.0`
language	string	ਕੋਈ ਨਹੀਂ	ਭਾਸ਼ਾ ਕੋਡ (ਜਿਵੇਂ ਕਿ `en`, `es`)। ਜੇ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਆਟੋ-ਖੋਜਿਆ ਜਾਵੇਗਾ।
instructions	string	ਕੋਈ ਨਹੀਂ	ਕਾਰਵਾਈ / ਡਿਲੀਵਰੀ ਸੁਝਾਅ (≤500 ਅੱਖਰ) । ਉਦਾਹਰਨ ਲਈ `\`
pronunciations	object \| array	ਕੋਈ ਨਹੀਂ	ਹਰੇਕ ਮੰਗ ਉੱਤੇ ਉਚਾਰਨ ਉੱਤੇ ਲਿਖੋ । ਜਾਂ ਤਾਂ `{\`
stream	boolean	ਕੋਈ ਨਹੀਂ	ਸਟਰੀਮਿੰਗ ਜਵਾਬ ਯੋਗ ਕਰੋ । ਡਿਫਾਲਟ: `false`

ਉਦਾਹਰਨ ਬੇਨਤੀ

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML ਟੈਗ


                    
                        
                            ਇੰਟਰਪਲੇਅ- ਐਸ ਇੰਪੁੱਟ ਇਸ ਤਰ੍ਹਾਂ ਬੋਲਿਆ
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 ਦਸੰਬਰ ਤੀਸਰੀ- ਇੱਕ, ਓਨਵੀਂ ਨੌਵੀਂ
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

ਇੰਟਰਪਲੇਅ- ਐਸ	ਇੰਪੁੱਟ	ਇਸ ਤਰ੍ਹਾਂ ਬੋਲਿਆ
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ਦਸੰਬਰ ਤੀਸਰੀ- ਇੱਕ, ਓਨਵੀਂ ਨੌਵੀਂ
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                ਮਿਤੀ ਫਾਰਮੈਟ ਡਿਫਾਲਟ mdy ਅੰਗਰੇਜ਼ੀ ਲਈ ਅਤੇ dmy ਹੋਰ ਥਾਵਾਂ ਲਈ; format=\ ਨਾਲ ਅਣਡਿੱਠਾ ਕਰੋ

                
                    
                        ਉਦਾਹਰਨ
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                ਜਵਾਬ
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                ਪੂਰਾ ਉਦਾਹਰਨ
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                ਬੋਲੀ ਤੋਂ ਪਾਠName
                
                    POST /v1/stt/
                
                ਆਡੀਓ ਨੂੰ ਟੈਕਸਟ ਵਿੱਚ ਤਬਦੀਲ ਕਰੋ । ਆਟੋ- ਖੋਜ ਨਾਲ 99 ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                file
                                file
                                ਹਾਂ
                                ਆਡੀਓ ਫਾਇਲ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM) । ਵੱਧੋ- ਵੱਧ 100MB ਹੈ ।
                            
                            
                                model
                                string
                                ਕੋਈ ਨਹੀਂ
                                STT ਮਾਡਲ: whisper (ਮੂਲ), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਭਾਸ਼ਾ ਕੋਡ। ਆਟੋ-ਖੋਜ ਲਈ auto (ਮੂਲ)।
                            
                            
                                timestamps
                                boolean
                                ਕੋਈ ਨਹੀਂ
                                ਸ਼ਬਦ- ਪੱਧਰ ਟਾਈਮ- ਸਟੈਂਪ ਸ਼ਾਮਲ ਕਰੋ। ਡਿਫਾਲਟ: false
                            
                            
                                diarize
                                boolean
                                ਕੋਈ ਨਹੀਂ
                                ਸਪੀਕਰ ਡਾਇਰੈਕਟਰੀ ਯੋਗ ਕਰੋ । ਮੂਲ: false
                            
                        
                    
                

                ਜਵਾਬ
                
                    
                        JSON ਜਵਾਬ
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                ਬੋਲੀ ਕਲੋਨਿੰਗ
                
                    POST /v1/tts/clone/
                
                ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਬੋਲੀ ਬਣਾਓ । ਇੱਕ ਹਵਾਲਾ ਆਡੀਓ ਅਤੇ ਟੈਕਸਟ ਅੱਪਲੋਡ ਕਰੋ ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                reference_audio
                                file
                                ਹਾਂ
                                ਰਿਫਰੈਸ਼ਨ ਵੌਇਸ ਆਡੀਓ (10-30 ਸਕਿੰਟ ਸਿਫਾਰਸ਼ੀ) । ਵੱਧੋ- ਵੱਧ 20MB ਹੈ ।
                            
                            
                                text
                                string
                                ਹਾਂ
                                ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਬੋਲਣ ਲਈ ਟੈਕਸਟ ਹੈ ।
                            
                            
                                model
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਕਲੋਨ ਮਾਡਲ: chatterbox (ਮੂਲ), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: mp3 (ਮੂਲ), wav, flac
                            
                            
                                language
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਟਾਰਗੇਟ ਭਾਸ਼ਾ ਕੋਡ ਹੈ । ਚੁਣੇ ਮਾਡਲ ਵਲੋਂ ਸਹਾਇਕ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ।
                            
                        
                    
                

                ਜਵਾਬ
                ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਦੇ ਰੂਪ ਵਿੱਚ ਵਾਪਸ ਕਰੋ, ਜੋ ਕਿ TTS ਅੰਤ- ਬਿੰਦੂ ਵਾਂਗ ਹੀ ਹੈ ।
            

            
            
                ਬੋਲੀ ਬਦਲਣ ਵਾਲਾName
                
                    POST /v1/voice-convert/
                
                ਆਡੀਓ ਨੂੰ ਵੱਖਰੀ ਆਵਾਜ਼ ਵਾਂਗ ਸੁਣਨ ਲਈ ਬਦਲੋ । ਸਰੋਤ ਆਡੀਓ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ ਟਾਰਗੇਟ ਆਡੀਓ ਚੁਣੋ ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                file
                                file
                                ਹਾਂ
                                ਸਰੋਤ ਆਡੀਓ ਫਾਇਲ (MP3, WAV, FLAC) । ਵੱਧੋ- ਵੱਧ 50MB ਹੈ ।
                            
                            
                                target_voice
                                string
                                ਹਾਂ
                                ਤਬਦੀਲ ਕਰਨ ਲਈ ਟਾਰਗੇਟ ਬੋਲੀ ID (ਉਪਲੱਬਧ ਬੋਲੀਆਂ ਦੀ ਲਿਸਟ ਵੇਖਾਉਣ ਲਈ /v1/voices/ ਵਰਤੋਂ)
                            
                            
                                model
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਆਵਾਜ਼ ਬਦਲਣ ਮਾਡਲ: openvoice (ਮੂਲ), knn-vc
                            
                            
                                format
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: wav (ਮੂਲ), mp3, flac
                            
                        
                    
                

                ਉਦਾਹਰਨ ਬੇਨਤੀ
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                ਜਵਾਬ
                ਬਦਲੀ ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਵਾਂਗ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।
            

            
            
                ਬੋਲੀ ਅਨੁਵਾਦName
                
                    POST /v1/speech-translate/
                
                ਇੱਕ ਭਾਸ਼ਾ ਤੋਂ ਦੂਜੀ ਭਾਸ਼ਾ ਵਿੱਚ ਬੋਲੀ ਆਡੀਓ ਦਾ ਅਨੁਵਾਦ ਕਰੋ। ਇੱਕ ਕਾਲ ਵਿੱਚ ਬੋਲੀ-ਤੋਂ-ਪਾਠ, ਅਨੁਵਾਦ ਅਤੇ ਪਾਠ-ਤੋਂ-ਬੋਲੀ ਨੂੰ ਮਿਲਾਓ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                file
                                file
                                ਹਾਂ
                                ਅਸਲੀ ਭਾਸ਼ਾ ਵਿੱਚ ਸਰੋਤ ਆਡੀਓ ਫਾਇਲ ਹੈ । ਵੱਧੋ- ਵੱਧ 100MB ਹੈ ।
                            
                            
                                target_language
                                string
                                ਹਾਂ
                                ਟਾਰਗੇਟ ਭਾਸ਼ਾ ਕੋਡ (ਜਿਵੇਂ ਕਿ es, fr, de, ja)
                            
                            
                                voice
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਅਨੁਵਾਦ ਆਉਟਪੁੱਟ ਲਈ ਆਵਾਜ਼ । ਜੇ ਛੱਡਿਆ ਗਿਆ ਤਾਂ ਆਟੋ- ਚੁਣਿਆ ਜਾਵੇਗਾ ।
                            
                            
                                preserve_voice
                                boolean
                                ਕੋਈ ਨਹੀਂ
                                ਅਸਲੀ ਸਪੀਕਰ ਦੀ ਆਵਾਜ਼ ਵਿਸ਼ੇਸ਼ਤਾ ਸੰਭਾਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ। ਡਿਫਾਲਟ: false
                            
                        
                    
                

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                ਬੋਲੀ ਤੋਂ ਬੋਲੀComment
                
                    POST /v1/speech-to-speech/
                
                ਭਾਸ਼ਾ ਸਟਾਈਲ, ਭਾਵਨਾ ਜਾਂ ਸਮੱਗਰੀ ਨੂੰ ਸੰਭਾਲਦੇ ਹੋਏ ਸੰਚਾਰ ਬਦਲੋ । ਟੋਨ, ਪੈਸਿੰਗ ਅਤੇ ਭਾਵਨਾਵਾਂ ਨੂੰ ਅਨੁਕੂਲ ਕਰਨ ਲਈ ਫਾਇਦੇਮੰਦ ਹੈ ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                file
                                file
                                ਹਾਂ
                                ਸਰੋਤ ਬੋਲੀ ਆਡੀਓ ਫਾਇਲ । ਵੱਧੋ- ਵੱਧ 50MB ਹੈ ।
                            
                            
                                voice
                                string
                                ਹਾਂ
                                ਆਉਟਪੁੱਟ ਬੋਲੀ ਲਈ ਟਾਰਗੇਟ ਬੋਲੀ ID
                            
                            
                                model
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਮਾਡਲ: openvoice (ਮੂਲ), chatterbox
                            
                            
                                emotion
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਟਾਰਗੇਟ ਭਾਵਨਾ: neutral, happy, sad, angry, excited
                            
                            
                                speed
                                float
                                ਕੋਈ ਨਹੀਂ
                                ਸਪੀਡ ਅਡਜੱਸਟਮੈਂਟ। ਡਿਫਾਲਟ: 1.0। ਰੇਜ਼: 0.5 ਤੋਂ 2.0
                            
                        
                    
                

                ਜਵਾਬ
                ਤਬਦੀਲ ਆਡੀਓ ਫਾਇਲ ਨੂੰ ਬਾਈਨਰੀ ਡਾਟਾ ਵਾਂਗ ਮੁੜ- ਪ੍ਰਾਪਤ ਕਰੋ ।
            

            
            
                ਆਡੀਓ ਟੂਲName
                ਆਡੀਓ ਪ੍ਰੋਸੈੱਸਿੰਗ ਅੰਤ- ਬਿੰਦੂ ਵਧਾਉਣ, ਬੋਲ ਹਟਾਉਣ, ਸਟੈਮ ਵੰਡਣ ਅਤੇ ਹੋਰ ਲਈ

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        ਆਡੀਓ ਕੁਆਲਟੀ ਵਧਾਓ: ਨੌਇਸ ਹਟਾਓ, ਸਪੱਸ਼ਟੀਕਰਨ ਵਧਾਓ, ਸੁਪਰ ਰੈਜ਼ੋਲੂਸ਼ਨ ।
                        
                            
                                
                                    file file ਵਧਾਉਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
                                    denoise boolean ਡਿਨੋਇਸਿੰਗ ਯੋਗ (ਡਿਫਾਲਟ: ਸੱਚ)
                                    enhance_clarity boolean ਬੋਲੀ ਸਪੱਸ਼ਟਤਾ ਵਧਾਓ (ਮੂਲ: ਸੱਚ)
                                    super_resolution boolean ਆਡੀਓ ਕੁਆਲਟੀ ਅੱਪਸਕੇਲ (ਮੂਲ: ਝੂਠਾ)
                                    strength integer 1-3(ਹਲਕਾ, ਦਰਮਿਆਨਾ, ਮਜ਼ਬੂਤ) ਡਿਫਾਲਟ: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        ਵੋਕਲ ਨੂੰ ਸੰਗੀਤ ਤੋਂ ਵੱਖ ਕਰੋ (ਵਾਕ ਹਟਾਉਣਾ) ਜਾਂ ਸਟੈਮ ਵਿੱਚ ਵੰਡੋ ।
                        
                            
                                
                                    file file ਵੱਖ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
                                    model string demucs (ਡਿਫਾਲਟ) ਜਾਂ spleeter
                                    stems integer ਸਟੈਮ ਦੀ ਗਿਣਤੀ: 2, 4, 5, ਜਾਂ6(ਮੂਲ: 2)
                                    format string ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਤੋਂ ਈਕੋ ਅਤੇ ਰਿਵਰਬ ਹਟਾਓ ।
                        
                            
                                
                                    file file ਪਰੋਸੈਸ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            ਮੁਫਤ
                        
                        ਕੀ, BPM ਅਤੇ ਟਾਈਮ ਦਸਤਖਤ ਲੱਭਣ ਲਈ ਆਡੀਓ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ ।
                        
                            
                                
                                    file file ਜਾਂਚ ਲਈ ਆਡੀਓ ਫਾਇਲ
                                
                            
                        
                        
                            ਜਵਾਬ
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            ਮੁਫਤ
                        
                        ਆਡੀਓ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਬਦਲੋ ।
                        
                            
                                
                                    file file ਬਦਲਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
                                    format string ਟਾਰਗੇਟ ਫਾਰਮੈਟ: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer ਆਉਟਪੁੱਟ ਬਿੱਟਰੇਟ kbps ਵਿੱਚ: 64, 128, 192, 256, 320
                                    sample_rate integer ਸੈਂਪਲ ਰੇਟ: 22050, 44100, 48000
                                    channels string mono ਜਾਂ stereo
                                
                            
                        
                    
                
            

            
            
                ਆਵਾਜ਼ ਗੱਲਬਾਤName
                
                    POST /v1/voice-chat/
                
                ਆਡੀਓ ਜਾਂ ਟੈਕਸਟ ਭੇਜੋ ਅਤੇ ਸੰਸਲੇਸ਼ਿਤ ਬੋਲੀ ਨਾਲ AI ਜਵਾਬ ਪ੍ਰਾਪਤ ਕਰੋ।

                ਬੇਨਤੀ ਭਾਗ (multipart/form-data ਜਾਂ JSON)
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                        
                            
                                audio
                                file
                                ਕੋਈ ਨਹੀਂ*
                                ਆਡੀਓ ਇੰਪੁੱਟ (audio ਜਾਂ text ਲੋੜੀਦਾ ਹੈ)
                            
                            
                                text
                                string
                                ਕੋਈ ਨਹੀਂ*
                                ਟੈਕਸਟ ਇੰਪੁੱਟ (audio ਜਾਂ text ਲੋੜੀਦਾ ਹੈ)
                            
                            
                                voice
                                string
                                ਕੋਈ ਨਹੀਂ
                                AI ਜਵਾਬ ਲਈ ਆਵਾਜ਼। ਡਿਫਾਲਟ: af_bella
                            
                            
                                tts_model
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਜਵਾਬ ਲਈ TTS ਮਾਡਲ ਹੈ। ਡਿਫਾਲਟ: kokoro
                            
                            
                                system_prompt
                                string
                                ਕੋਈ ਨਹੀਂ
                                AI ਲਈ ਪਸੰਦੀਦਾ ਸਿਸਟਮ ਪੁਆਇੰਟਰ
                            
                            
                                conversation_id
                                string
                                ਕੋਈ ਨਹੀਂ
                                ਮੌਜੂਦਾ ਗੱਲਬਾਤ ਜਾਰੀ ਰੱਖੋ
                            
                        
                    
                

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                ਬੈਚ TTS
                
                    POST /v1/tts/batch/
                
                ਪੈਰਲਲ TTS ਬਣਾਉਣ ਲਈ ਕਈ ਟੈਕਸਟ ਭੇਜੋ । ਚੋਣਵੀਂ ਵੈਬਹੁੱਕ ਕਾਲਬੈਕ ਪ੍ਰਾਪਤ ਕਰੋ, ਜਦੋਂ ਸਭ ਕੰਮ ਪੂਰੇ ਹੋਣ ।

                ਪੈਰਾਮੀਟਰ
                
                    ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਵੇਰਵਾ
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string ਜਦੋਂ ਬੈਚ ਮੁਕੰਮਲ ਹੋਵੇ ਤਾਂ POST ਨਤੀਜੇ ਲਈ ਚੋਣਵੀਂ URL ਹੈ ।
                    
                

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                GET /v1/tts/batch/result/?batch_id=abc123 ਨਾਲ ਪੁਲਿਸ ਪ੍ਰਗਤੀ
            

            
            
                ਬੋਲੀ ਇੰਬੈੱਡਿੰਗ
                
                    POST /v1/voice-embed/
                
                ਹਵਾਲਾ ਆਡੀਓ ਤੋਂ ਇੱਕ ਬੋਲੀ ਇੰਬੈੱਡ ਕਰਨ ਲਈ ਪਹਿਲਾਂ-ਗਣਨਾ ਕਰੋ। ਬਾਅਦ ਵਿੱਚ ਬੋਲੀ ਕਲੋਨਿੰਗ ਮੰਗਾਂ ਲਈ ਸਿੱਧੀ-ਉੱਤੇ-ਅੰਤ ਪੈਦਾ ਕਰਨ ਲਈ embed_id ਵਰਤੋਂ।

                ਪੈਰਾਮੀਟਰ
                
                    ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਵੇਰਵਾ
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                ਸਿਹਤ ਚੈੱਕ
                
                    GET /v1/health/
                
                GPU ਸਰਵਰ ਹਾਲਤ, ਲੋਡ ਮਾਡਲ ਅਤੇ ਕਤਾਰ ਸਾਈਜ਼ ਚੈੱਕ ਕਰੋ । ਕੋਈ ਪਰਮਾਣਕਿਤਾ ਲੋੜੀਦੀ ਨਹੀਂ ਹੈ । 30 ਸਕਿੰਟ ਲਈ ਕੈਸ਼ ਕੀਤਾ ।

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ਮਾਡਲਾਂ ਦੀ ਲਿਸਟ
                
                    GET /v1/models/
                
                ਸਭ ਉਪਲੱਬਧ ਮਾਡਲਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਲਿਸਟ ਦਿੰਦਾ ਹੈ ।

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                ਆਵਾਜ਼ ਲਿਸਟ
                
                    GET /v1/voices/
                
                ਸਭ ਉਪਲੱਬਧ ਆਵਾਜ਼ਾਂ ਦੀ ਲਿਸਟ ਦਿੰਦਾ ਹੈ, ਜੋ ਕਿ ਮਾਡਲ ਜਾਂ ਭਾਸ਼ਾ ਨਾਲ ਫਿਲਟਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ।

                ਕਿਊਰੀ ਪੈਰਾਮੀਟਰ
                
                    
                        
                            ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਵੇਰਵਾ
                        
                        
                            
                                model
                                string
                                ਮਾਡਲ ID ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ kokoro)
                            
                            
                                language
                                string
                                ਭਾਸ਼ਾ ਕੋਡ ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ en)
                            
                            
                                gender
                                string
                                ਲਿੰਗ ਮੁਤਾਬਕ ਫਿਲਟਰ: male, female, neutral
                            
                        
                    
                

                ਜਵਾਬ
                
                    JSON ਜਵਾਬ
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                ਸਬ- ਟਾਈਟਲ (SRT / VTT) ਨਵਾਂ
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                ਕਿਸੇ ਵੀ ਪੂਰੇ TTS ਕੰਮ ਲਈ ਸਮਕਾਲੀ ਸਬ- ਟਾਈਟਲ ਬਣਾਓ । ਆਡੀਓ ਉੱਤੇ Whisper ਅਲਾਇੰਸ ਚਲਾਓ ਅਤੇ SRT ਜਾਂ WebVTT ਦਿਓ । ਨਤੀਜਾ ਡਿਸਕ ਉੱਤੇ ਕੈਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਕਿ ਇੱਕੋ uuid ਲਈ ਦੂਜਾ ਕਾਲ ਇੱਕ ਡਿਸਕ ਪੜ੍ਹਨ ਲਈ ਹੋਵੇ ।
                ਕਿਊਰੀ ਪੈਰਾਮੀਟਰ
                
                    
                        ਪੈਰਾਮੀਟਰ ਲੋੜੀਦਾ ਵੇਰਵਾ
                        
                            uuid ਹਾਂ /v1/tts/ ਜਾਂ /v1/voice-clone/ ਵਲੋਂ ਵਾਪਸ ਕੀਤੀ ਜਾਬ UUID ਹੈ।
                            format ਕੋਈ ਨਹੀਂ srt (ਮੂਲ) ਜਾਂ vtt।
                            download ਕੋਈ ਨਹੀਂ 1 Content-Disposition: attachment ਭੇਜਣ ਲਈ ਤਾਂ ਕਿ ਬਰਾਊਜ਼ਰ ਵੇਖਾਉਣ ਦੀ ਬਜਾਏ ਸੰਭਾਲੇ।
                            language ਕੋਈ ਨਹੀਂ ਇਕਸਾਰਤਾ ਮਾਡਲ ਲਈ ਇਸ਼ਾਰਾ (ਜੇ ਛੱਡਿਆ ਜਾਵੇ ਤਾਂ ਆਟੋ- ਖੋਜਿਆ ਜਾਵੇਗਾ) ।
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                ਉਚਾਰਨ ਡਿਕਸ਼ਨਰੀ ਨਵਾਂ
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                TTS ਇੰਜਣ ਨੂੰ ਦੱਸੋ ਕਿ ਖਾਸ ਸ਼ਬਦ ਕਿਵੇਂ ਉਚਾਰੇ ਜਾਣ। ਸੰਭਾਲੀਆਂ ਐਂਟਰੀਆਂ ਆਟੋਮੈਟਿਕ ਹੀ ਹਰ TTS ਮੰਗ ਉੱਤੇ ਲਾਗੂ ਹੋ ਜਾਂਦੀਆਂ ਹਨ। ਪ੍ਰਤੀ ਅਕਾਊਂਟ 200 ਐਂਟਰੀਆਂ ਦੀ ਸੀਮਾ ਹੈ।
                ਬੇਨਤੀ ਭਾਗ (POST)
                
                    
                        ਪੈਰਾਮੀਟਰ ਟਾਈਪ ਵੇਰਵਾ
                        
                            word string ਉੱਤੇ ਲਿਖਣ ਲਈ ਸ਼ਬਦ (ਜਿਵੇਂ ਕਿ GIF, Anthropic)। ਸ਼ਬਦ-ਬੰਡਲ ਮਿਲਿਆ।
                            replacement string ਮਾਡਲ ਲਈ ਇਸ ਦਾ ਸ਼ਬਦ-ਜੋੜ ਕਿਵੇਂ ਹੈ (ਜਿਵੇਂ jiff, ann THROP ick)।
                            language string ਚੋਣਵਾਂ ISO ਕੋਡ । ਖਾਲੀ = ਸਭ ਭਾਸ਼ਾਵਾਂ ਲਈ ਲਾਗੂ ਹੈ ।
                            case_sensitive boolean ਡਿਫਾਲਟ false ਹੈ। true ਦੇ ਨਾਲ ਕੇਸ ਮਿਲਦਾ ਹੈ।
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                ਤੁਸੀਂ ਬਿਨਾਂ ਸੰਭਾਲੇ ਪਰ- ਮੰਗ ਉੱਤੇ ਲਿਖ ਸਕਦੇ ਹੋ - ਕਿਸੇ ਵੀ /v1/tts/ ਕਾਲ ਉੱਤੇ pronunciations ਨੂੰ ਇੱਕ ਆਬਜੈਕਟ ਜਾਂ ਐਰੇ ਦੇ ਤੌਰ ਤੇ ਸ਼ਾਮਲ ਕਰੋ (TTS ਅੰਤ- ਬਿੰਦੂ ਪੈਰਾਮੀਟਰ ਵੇਖੋ) ।
            

            
            
                ਲੇਖ ਗਾਇਕ ਨਵਾਂ
                ਕਿਸੇ ਵੀ ਲੇਖ ਪੇਜ਼ ਉੱਤੇ ਇੱਕ

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਲੋੜੀਦਾ	ਵੇਰਵਾ
file	file	ਹਾਂ	ਆਡੀਓ ਫਾਇਲ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM) । ਵੱਧੋ- ਵੱਧ 100MB ਹੈ ।
model	string	ਕੋਈ ਨਹੀਂ	STT ਮਾਡਲ: `whisper` (ਮੂਲ), `faster-whisper`, `sensevoice`
language	string	ਕੋਈ ਨਹੀਂ	ਭਾਸ਼ਾ ਕੋਡ। ਆਟੋ-ਖੋਜ ਲਈ `auto` (ਮੂਲ)।
timestamps	boolean	ਕੋਈ ਨਹੀਂ	ਸ਼ਬਦ- ਪੱਧਰ ਟਾਈਮ- ਸਟੈਂਪ ਸ਼ਾਮਲ ਕਰੋ। ਡਿਫਾਲਟ: `false`
diarize	boolean	ਕੋਈ ਨਹੀਂ	ਸਪੀਕਰ ਡਾਇਰੈਕਟਰੀ ਯੋਗ ਕਰੋ । ਮੂਲ: `false`

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਲੋੜੀਦਾ	ਵੇਰਵਾ
reference_audio	file	ਹਾਂ	ਰਿਫਰੈਸ਼ਨ ਵੌਇਸ ਆਡੀਓ (10-30 ਸਕਿੰਟ ਸਿਫਾਰਸ਼ੀ) । ਵੱਧੋ- ਵੱਧ 20MB ਹੈ ।
text	string	ਹਾਂ	ਕਲੋਨ ਕੀਤੀ ਆਵਾਜ਼ ਵਿੱਚ ਬੋਲਣ ਲਈ ਟੈਕਸਟ ਹੈ ।
model	string	ਕੋਈ ਨਹੀਂ	ਕਲੋਨ ਮਾਡਲ: `chatterbox` (ਮੂਲ), `cosyvoice2`, `gpt-sovits`
format	string	ਕੋਈ ਨਹੀਂ	ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: `mp3` (ਮੂਲ), `wav`, `flac`
language	string	ਕੋਈ ਨਹੀਂ	ਟਾਰਗੇਟ ਭਾਸ਼ਾ ਕੋਡ ਹੈ । ਚੁਣੇ ਮਾਡਲ ਵਲੋਂ ਸਹਾਇਕ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ।

file file	ਵਧਾਉਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
denoise boolean	ਡਿਨੋਇਸਿੰਗ ਯੋਗ (ਡਿਫਾਲਟ: ਸੱਚ)
enhance_clarity boolean	ਬੋਲੀ ਸਪੱਸ਼ਟਤਾ ਵਧਾਓ (ਮੂਲ: ਸੱਚ)
super_resolution boolean	ਆਡੀਓ ਕੁਆਲਟੀ ਅੱਪਸਕੇਲ (ਮੂਲ: ਝੂਠਾ)
strength integer	1-3(ਹਲਕਾ, ਦਰਮਿਆਨਾ, ਮਜ਼ਬੂਤ) ਡਿਫਾਲਟ: 2

file file	ਵੱਖ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
model string	`demucs` (ਡਿਫਾਲਟ) ਜਾਂ `spleeter`
stems integer	ਸਟੈਮ ਦੀ ਗਿਣਤੀ: 2, 4, 5, ਜਾਂ6(ਮੂਲ: 2)
format string	ਆਉਟਪੁੱਟ ਫਾਰਮੈਟ: `wav`, `mp3`, `flac`

file file	ਪਰੋਸੈਸ ਕਰਨ ਲਈ ਆਡੀਓ ਫਾਇਲ
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	ਬਦਲਣ ਲਈ ਆਡੀਓ ਫਾਇਲ
format string	ਟਾਰਗੇਟ ਫਾਰਮੈਟ: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	ਆਉਟਪੁੱਟ ਬਿੱਟਰੇਟ kbps ਵਿੱਚ: 64, 128, 192, 256, 320
sample_rate integer	ਸੈਂਪਲ ਰੇਟ: 22050, 44100, 48000
channels string	`mono` ਜਾਂ `stereo`

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਲੋੜੀਦਾ	ਵੇਰਵਾ
audio	file	ਕੋਈ ਨਹੀਂ*	ਆਡੀਓ ਇੰਪੁੱਟ (`audio` ਜਾਂ `text` ਲੋੜੀਦਾ ਹੈ)
text	string	ਕੋਈ ਨਹੀਂ*	ਟੈਕਸਟ ਇੰਪੁੱਟ (`audio` ਜਾਂ `text` ਲੋੜੀਦਾ ਹੈ)
voice	string	ਕੋਈ ਨਹੀਂ	AI ਜਵਾਬ ਲਈ ਆਵਾਜ਼। ਡਿਫਾਲਟ: `af_bella`
tts_model	string	ਕੋਈ ਨਹੀਂ	ਜਵਾਬ ਲਈ TTS ਮਾਡਲ ਹੈ। ਡਿਫਾਲਟ: `kokoro`
system_prompt	string	ਕੋਈ ਨਹੀਂ	AI ਲਈ ਪਸੰਦੀਦਾ ਸਿਸਟਮ ਪੁਆਇੰਟਰ
conversation_id	string	ਕੋਈ ਨਹੀਂ	ਮੌਜੂਦਾ ਗੱਲਬਾਤ ਜਾਰੀ ਰੱਖੋ

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਵੇਰਵਾ
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	ਜਦੋਂ ਬੈਚ ਮੁਕੰਮਲ ਹੋਵੇ ਤਾਂ POST ਨਤੀਜੇ ਲਈ ਚੋਣਵੀਂ URL ਹੈ ।

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਵੇਰਵਾ
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਵੇਰਵਾ
model	string	ਮਾਡਲ ID ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ `kokoro`)
language	string	ਭਾਸ਼ਾ ਕੋਡ ਨਾਲ ਫਿਲਟਰ (ਜਿਵੇਂ ਕਿ `en`)
gender	string	ਲਿੰਗ ਮੁਤਾਬਕ ਫਿਲਟਰ: `male`, `female`, `neutral`

ਪੈਰਾਮੀਟਰ	ਲੋੜੀਦਾ	ਵੇਰਵਾ
uuid	ਹਾਂ	/v1/tts/ ਜਾਂ /v1/voice-clone/ ਵਲੋਂ ਵਾਪਸ ਕੀਤੀ ਜਾਬ UUID ਹੈ।
format	ਕੋਈ ਨਹੀਂ	`srt` (ਮੂਲ) ਜਾਂ `vtt`।
download	ਕੋਈ ਨਹੀਂ	`1` `Content-Disposition: attachment` ਭੇਜਣ ਲਈ ਤਾਂ ਕਿ ਬਰਾਊਜ਼ਰ ਵੇਖਾਉਣ ਦੀ ਬਜਾਏ ਸੰਭਾਲੇ।
language	ਕੋਈ ਨਹੀਂ	ਇਕਸਾਰਤਾ ਮਾਡਲ ਲਈ ਇਸ਼ਾਰਾ (ਜੇ ਛੱਡਿਆ ਜਾਵੇ ਤਾਂ ਆਟੋ- ਖੋਜਿਆ ਜਾਵੇਗਾ) ।

ਪੈਰਾਮੀਟਰ	ਟਾਈਪ	ਵੇਰਵਾ
word	string	ਉੱਤੇ ਲਿਖਣ ਲਈ ਸ਼ਬਦ (ਜਿਵੇਂ ਕਿ `GIF`, `Anthropic`)। ਸ਼ਬਦ-ਬੰਡਲ ਮਿਲਿਆ।
replacement	string	ਮਾਡਲ ਲਈ ਇਸ ਦਾ ਸ਼ਬਦ-ਜੋੜ ਕਿਵੇਂ ਹੈ (ਜਿਵੇਂ `jiff`, `ann THROP ick`)।
language	string	ਚੋਣਵਾਂ ISO ਕੋਡ । ਖਾਲੀ = ਸਭ ਭਾਸ਼ਾਵਾਂ ਲਈ ਲਾਗੂ ਹੈ ।
case_sensitive	boolean	ਡਿਫਾਲਟ `false` ਹੈ। `true` ਦੇ ਨਾਲ ਕੇਸ ਮਿਲਦਾ ਹੈ।