لاسوندونه

زموږ د REST API سره ستاسو غوښتنلیکونو ته د TTS.ai ادغام کړئ. د اسانه مهاجرت لپاره د OpenAI-متوافق بڼه.

REST API OpenAI سمون لرونکی ځوابونه JSON لنډمهاله ملاتړ

سرليک

د TTS.ai API د ټولو پلیټ فارم ځانګړتیاو ته د پروګرام لاسرسی چمتو کوي: د متن څخه د وینا ترکیب، د وینا څخه د متن لیږد، د غږ کلونینګ، د آډیو پراختیا، او نور. API د JSON غوښتنې / ځواب بدنونو سره معیاري REST کنوانسیونونه کاروي.

کيلۍ API

خپل API کیلي ترلاسه کړئ ګڼون امستنې. په پرو او انټرپرایز پلانونو کې شتون لري.

بنسټيز URL

https://api.tts.ai/v1/

باوريول

د لېږونکي توکي له لارې Authorization سريز

کرونه

د ټولو API غوښتنو ته اړتيا لري د تصديق له لارې په يوه Bearer توکي Authorization سريز.

سرۍ HTTP
Authorization: Bearer sk-tts-your-api-key-here
خپل API کيلي پټ وساتئ. دا په مشتري اړخ کې کوډ، عامه ذخیرې یا ریکارډونه نه شریکوي. د خپل حساب تنظیماتو څخه په منظمه توګه کیلي بدل کړئ.

بنسټيز URL

بنسټيز URL: https://api.tts.ai/v1/

ټول پای ټکي د دې بنسټ URL نسبت دي. د بېلګې په توګه، د TTS پای ټکی دی:

POST https://api.tts.ai/v1/tts/

د کچې حدونه

د API نرخ حدونه د پلان له مخې توپیر لري:

پلان غوښتنې/دقيقه هممهاله د ليکنې ټولوجګه اوږدوالی
پرو 60 5 ۵۰۰۰ لوښه
انټرپرایز 300 20 ۵۰۰۰۰ لوښه

د نرخ د حد سرليکونه په هر ځواب شامل دي: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

کریډیټ لګښتونه

پالنه بيه يوون
TTS (د وړيا ماډلونه: Piper، VITS، MeloTTS) ۱ کرېډیټ هر ۱۰۰۰ لوښه
TTS (معيار ماډلونه: Kokoro، CosyVoice 2، او داسې نور) ۲ کرېډېټونه هر ۱۰۰۰ لوښه
TTS (پریمیوم ماډلونه: Tortoise، Chatterbox، او نور) ۴ کرېډېټونه هر ۱۰۰۰ لوښه
ليکنې ته وينا ۲ کرېډېټونه د غږ په منټه کې
غږ نقلول ۴ کرېډېټونه هر ۱۰۰۰ لوښه
غږ بدلوونکی ۳ کرېډېټونه د غږ په منټه کې
غږيز زياتول ۲ کرېډېټونه د غږ په منټه کې
د غږ لرې کول / د غږ جلا کول 3-4 کریډیټونه د غږ په منټه کې
ژباړه ۵ کرېډېټونه د غږ په منټه کې
غږيزه بنډار ۳ کرېډېټونه په پړاو
کيلۍ پلټونی & BPM وړیا --
غږيز ونجوونکی وړیا --

ليکنه وينا ته

POST /v1/tts/

. ليکنه غږيزې وينا ته بدلول. غږيزه دوتنه په غوښتل شوي بڼه راګرځوي

د غوښتنې بدن

پېرامېټرډولاړينسپړاوی
model string هو بېلګه پېژند (د بېلګې په توګه، <کوډ>kokoro، <کوډ>chatterbox، <کوډ>piper)
text string هو متن ته د خبرو بدلولو لپاره (د پرو لپاره 5,000 chars، د انټرپرایز لپاره 50,000)
voice string هو غږ پېژند (د شته غږونو د لړ لپاره <کوډ>/v1/voices/ کارول)
format string نه وتۍ بڼه: <کوډ>mp3 (تلواله)، <کوډ>wav، <کوډ>flac، <کوډ>ogg
speed float نه تلواله: <کوډ>۱.۰. لړ: <کوډ>۰.۵ ته <کوډ>۲.۰
language string نه .د ژبې کوډ (د بېلګې په توګه، <کوډ>en، <کوډ>es). که چېرې پرېښودل شي نو خپلکارې کشفيږي
stream boolean نه تلواله: <کوډ>ناسمه

بېلګه غوښتنه

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

ځوابول

غږيزه دوتنه د دوديز اومتوک په توګه د مناسب <کوډ> منځپانګې-ډول سرۍ سره (<کوډ>غږيز/mpeg، <کوډ>غږيز/wav، او داسې نور) بېرته لېږل کيږي.

غبرګون سرۍ
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498

ليکنې ته وينا

POST /v1/stt/

متن ته غږيز نقل کړئ. د اتومات کشف سره 99 ژبې ملاتړ کوي.

د غوښتنې بدن (multipart/form-data)

پېرامېټرډولاړينسپړاوی
file file هو د غږ دوتنه (MP3، WAV، FLAC، OGG، M4A، MP4، WebM). Max 100MB.
model string نه STT بېلګه: <کوډ>څپاند (تلواله)، <کوډ>ګړندی-څپاند، <کوډ>سم غږ
language string نه .د ژبې کوډ. د خپلکارې کشف لپاره auto (تلواله)
timestamps boolean نه تلواله: <کوډ>ناسمه
diarize boolean نه تلواله: <کوډ>ناسمه

ځوابول

ځواب JSON
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

غږ نقلول

POST /v1/tts/clone/

په يوه نقل شوي غږ کې وينا توليد کړئ. يوه مرجع غږيزه او ليکنه پورته کړئ.

د غوښتنې بدن (multipart/form-data)

پېرامېټرډولاړينسپړاوی
reference_audio file هو د حوالې غږ غږ (د 10-30 ثانیو سپارښتنه کیږي).
text string هو .په کلون شوي غږ کې د ويلو لپاره ليکنه
model string نه : <کوډ>چاټربکس (تلواله)، <کوډ>کوسيواېس۲، <کوډ>ګپټ-سوېټس
format string نه وتۍ بڼه: <کوډ>mp3 (تلواله)، <کوډ>wav، <کوډ>flac
language string نه د موخې ژبې کوډ. بايد د ټاکل شوي نمونې لخوا ملاتړ شي.

ځوابول

غږيزه دوتنه د دوديز اومتوک په توګه راګرځوي، لکه د TTS پای ټکی.

غږ بدلوونکی

POST /v1/voice-convert/

غږيز ته د يو بل غږ په څېر غږ بدل کړئ. د سرچينې غږيز او د موخې غږ وټاکئ.

د غوښتنې بدن (multipart/form-data)

پېرامېټرډولاړينسپړاوی
file file هو سرچينه غږيزه دوتنه (MP3، WAV، FLAC). Max 50MB.
target_voice string هو د بدلولو لپاره موخه غږ پېژند (د شته غږونو د لړ لپاره <کوډ>/v1/voices/ کارول)
model string نه د غږ د بدلولو بېلګه: openvoice (تلواله)، knn-vc
format string نه وتۍ بڼه: <کوډ>wav (تلواله)، <کوډ>mp3، <کوډ>flac

بېلګه غوښتنه

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

ځوابول

.اړول شوې غږيزه دوتنه د دوديز اومتوک په توګه بيايي

ژباړه

POST /v1/speech-translate/

د يوې ژبې څخه بل ته غږیز غږیز ژباړه. په يوه غږيز غږيز غږيز غږيز غږيز غږيز غږيز غږيز غږيز غږيز غږيز غږيز

د غوښتنې بدن (multipart/form-data)

پېرامېټرډولاړينسپړاوی
file file هو سرچينه غږيزه دوتنه په اصلي ژبه. Max 100MB.
target_language string هو د موخې ژبې کوډ (د بېلګې په توګه، <کوډ>es، <کوډ>fr، <کوډ>de، <کوډ>ja)
voice string نه .د ژباړل شوې وتۍ غږ. که پرېښودل شي خپلکارې ټاکل شوی
preserve_voice boolean نه د اصلي غږوونکي ساتلو هڅه کول

ځوابول

ځواب JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

وينا ته وينا

POST /v1/speech-to-speech/

د خبرو طرز، احساس، یا تحویل بدل کړئ پداسې حال کې چې مینځپانګه ساتل کیږي. د تودوخې تنظیم کولو لپاره ګټور، پیچلتیا، او څرګندتیا.

د غوښتنې بدن (multipart/form-data)

پېرامېټرډولاړينسپړاوی
file file هو د سرچينې د وينا غږيزه دوتنه. Max 50MB.
voice string هو د وتۍ وينا لپاره موخه غږ پېژند
model string نه بېلګه: openvoice (تلواله)، chatterbox
emotion string نه موخه احساس: neutral، happy، sad، angry، excited
speed float نه د چټکتيا سمون. تلواله: <کوډ>1.0. لړ: <کوډ>0.5 ته <کوډ>2.0

ځوابول

.بدل شوې غږيزه دوتنه د دوديز اومتوک په توګه بيايي

غږيز توکي

د پراختیا، غږیز لرې کولو، سټیم ویشلو، او نور لپاره د آډیو پروسس پای ټکي.

POST /v1/audio/enhance/

د غږ د کیفیت ښه: denoise، د روښانتیا، سوپر حل ښه.

file fileد زياتولو لپاره غږيزه دوتنه
denoise boolean(تلواله: سم) غږ کمول توانول
enhance_clarity boolean(تلواله: سم) د وينا روښانتيا زياتول
super_resolution boolean(تلواله: ناسم) غږيز کیفیت لوړول
strength integer1-3 (روښانه، منځنۍ، قوي). تلواله: 2
POST /v1/audio/separate/

د غږونو څخه غږونه جلا کړئ (د غږونو لرې کول) یا په سټیمونو کې ویشل شوي.

file fileد بېلولو لپاره غږيزه دوتنه
model stringdemucs (تلواله) يا spleeter
stems integer2، 4، 5، يا 6 (تلواله: 2): د پاڼو شمېر
format stringوتۍ بڼه: <کوډ>wav، <کوډ>mp3، <کوډ>flac
POST /v1/audio/dereverb/

.د غږيزو ثبتونو نه غږ او غږيز غږ لرې کول

file fileد بهيرولو لپاره غږيزه دوتنه
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ وړیا

د کلیدي، BPM، او وخت لاسلیک کشف غږ تحلیل.

file fileد شننولو لپاره غږيزه دوتنه
ځوابول
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ وړیا

د بڼو ترمنځ غږيز بدلول.

file fileد بدلولو لپاره غږيزه دوتنه
format stringموخه بڼه: <کوډ>mp3، <کوډ>wav، <کوډ>flac، <کوډ>ogg، <کوډ>m4a، <کوډ>aac
bitrate integer64، 128، 192، 256، 320: په کيلوبېټس کې د وتلو بيټرېټ
sample_rate integerد نمونې نرخ: 22050، 44100، 48000
channels stringmono يا stereo

غږيزه بنډار

POST /v1/voice-chat/

غږیز یا متن واستوئ او د ترکیب شوي وینا سره د AI ځواب ترلاسه کړئ.

د غوښتنې بدن (multipart/form-data يا JSON)

پېرامېټرډولاړينسپړاوی
audio file نه* غږيز ننوت (يا <کوډ>غږيز يا <کوډ> ليکنه اړين دی)
text string نه* ليکنې ننوت (يا <کوډ>غږيز يا <کوډ> ليکنه اړين دی)
voice string نه د AI ځواب لپاره غږ. تلواله: <کوډ>af_bella
tts_model string نه د ځواب لپاره بېلګه TTS. تلواله: <کوډ>kokoro
system_prompt string نه د AI لپاره د دوديز غونډال خبرتيا
conversation_id string نه اوسنۍ ګپ شپ دوام ورکول

ځوابول

ځواب JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

بېلګه لړ

GET /v1/models/

د ټولو شته ماډلونو سره د هغوی د وړتیاوو يو لړ بېرته.

ځوابول

ځواب JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

غږونه لړ

GET /v1/voices/

.د ټولو شته غږونو لړ راګرځوي، چې په بېلګه يا ژبه چاڼ شوي وي

پوښتنې پېرامېټرونه

پېرامېټرډولسپړاوی
model string چاڼ په بېلګه پېژند (د بېلګې په توګه، <کوډ>کوډ)
language string چاڼ په ژبې کوډ (د بېلګې په توګه، <کوډ>en)
gender string چاڼ پر جنس: <کوډ>نر، <کوډ>ښځه، <کوډ>بې طرفه

ځوابول

ځواب JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

کوډ بېلګه

ليکنه وينا ته

Python - requests
import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

ليکنې ته وينا

Python - requests
# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

غږ نقلول

Python - requests
# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

ليکنه وينا ته

JavaScript - fetch
const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

ليکنې ته وينا

JavaScript - fetch
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

ليکنه وينا ته

cURL
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

ليکنې ته وينا

cURL
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

غږ نقلول

cURL
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

غږيز زياتول

cURL
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

تېروتنه کوډونه

ټولې تېروتنې سره د يو JSON ځواب بېرته error ډګر.

د تېروتنې ځواب بڼه
{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough credits for this request.",
    "credits_required": 4,
    "credits_available": 2
  }
}
انکړ HTTPتېروتنه کوډسپړاوی
400 bad_request ناسم غوښتنه پېرامې. د جزياتو لپاره د تېروتنې استوزه وګورﺉ.
401 unauthorized .ناشته يا ناسمه کيلۍ API
402 insufficient_credits نه کافي کریډیټونه. په / pricing / کې نور وپیرئ.
403 forbidden د API لاسرسي ستاسو په پلان کې شتون نلري.
404 not_found .ډول يا غږ ونه موندل شو
413 file_too_large .ولېښل شوې دوتنه د کچ له حد څخه زياته ده
429 rate_limited ډېرې غوښتنې. د کچې د حد سرۍ وګورﺉ.
500 internal_error پالنګر تېروتنه. وروسته بيا هڅه وکړﺉ.
503 model_loading .ډول لېښل کيږي. په څو سېکېنډو کې بيا هڅه وکړﺉ

وېب هوکسونه

د اوږدې مودې لپاره د کارونو لپاره (سټیم ویش، ګروپ TTS)، تاسو کولی شئ webhook_url پارامتر چمتو کړئ. کله چې دنده بشپړه شي، موږ به ستاسو URL ته پایله پوسټ کړو.

وېب هوک لګښت
{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}
د Webhook پایلې د بشپړیدو وروسته د 24 ساعتونو لپاره د ډاونلوډ لپاره شتون لري. ډاډ ترلاسه کړئ چې دوی سمدلاسه ډاونلوډ کړئ.

د جوړولو لپاره چمتو ياست؟

خپل API کیلي ترلاسه کړئ او خپل غوښتنلیکونو ته د TTS.ai ادغام پیل کړئ.