एपीआई प्रलेखन

हमारे पुनर्देश के साथ आपके अनुप्रयोग को एकीकृत करें. आसान उत्प्रवासन के लिए कृत्रिम प्रारूप खोलें.

रिले API कृत्रिमता खोलें JSON अनुक्रिया स्ट्रीमिंग समर्थन

ओवरव्यू

The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request/response bodies.

एपीआई कुंजी

से अपनी एपीआई कुंजी प्राप्त करें खाता सेटिंग. पहले से योजना बनाइए ।

बेस यूआरएल

https://api.tts.ai/v1/

एटीएन

के द्वारा बीयरर टोकन Authorization शीर्षिका

सत्यापन

सभी एपीआई निवेदन भरोसेक के लिए सत्यापन की आवश्यकता है Authorization शीर्षिका.

एचटीटीपी शीर्षिका
Authorization: Bearer sk-tts-your-api-key-here
एपीआई कुंजी गुप्त रखें. इसे क्लाइंट के किनारे, सार्वजनिक भंडार, या लॉग में साझा नहीं करें. अपने खाते सेटिंग से नियमित रूप से कुंजी घुमाएँ.

बेस यूआरएल

बेस यूआरएल: https://api.tts.ai/v1/

सभी अंतिम बिन्दु इस आधार यूआरएल के सापेक्ष हैं. उदाहरण के लिए, टीएसएसटीपाइंट है:

POST https://api.tts.ai/v1/tts/

दर सीमा

प्लान किया गया है

योजना निवेदन/मिन Concurrent अधिकतम पाठ लंबाई
प्रोग्रेड 60 5 5,000 अक्षर
छोटे - छोटे रंग 300 20 50,000 अक्षर

दर सीमा शीर्षों को प्रत्येक जवाब में शामिल किया जाता है: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

क्रेडिट कास्ट्स

सेवा खर्च इकाई
TTS (फ्री मॉडल: पाइपर, VITS, मेरोटीएस) % 1 क्रेडिट प्रति 1,000 अक्षर
TTS (मानक मॉडल: कोकोरो, कोस 2, etc.) 2 श्रेय प्रति 1,000 अक्षर
टीएसटी (प्रेशियम मॉडल: QShortcut, चैट बाक्स इत्यादि) 4 श्रेय प्रति 1,000 अक्षर
पाठ से वार्ता 2 श्रेय ऑडियो की प्रति मिनट
आवाज कोलोन 4 श्रेय प्रति 1,000 अक्षर
आवाज परिवर्तक 3 श्रेय ऑडियो की प्रति मिनट
ऑडियो संवर्द्धन 2 श्रेय ऑडियो की प्रति मिनट
चोरी / स्मिटिंग 3-4 श्रेय ऑडियो की प्रति मिनट
भाषण अनुवाद 5 श्रेय ऑडियो की प्रति मिनट
आवाज़-चीत 3 श्रेय पलटता है
कुंजी & अपराह्न ढूंढने वाला मुक्त --
ऑडियो परिवर्तक मुक्त --

बोलने के लिए पाठ

POST /v1/tts/

पाठ को ऑडियो ऑडियो में बदलें. निवेदित फॉर्मेट में ऑडियो फ़ाइल वापस लें.

निवेदन शरीर

पैरामीटरक़िस्मआवश्यकवर्णन
model string हाँ मॉडल आईडी (जैसे, <कोड>, , , >
text string हाँ भाषा में परिवर्तन करने के लिए पाठ (50, 50,000 के लिए 50,000 अक्षर)
voice string हाँ आवाज आईडी ( <कोड>/v1/p> उपलब्ध आवाज की सूची में प्रयोग करें)
format string नहीं आउटपुट प्रारूप: <कोड>

, <कोड , <कोड

> <कोड>

speed float नहीं गति गुणक है. तयशुदा: <कोड> <40/कोड>. सीमा <कोड> <कोड> <कोड> <कोड> <कोड2> <कोड> <0>
language string नहीं भाषा कोड (जैसे, <कोड> , <कोड> <> <कोड> . तब पता चला गया यदि रोका गया हो.
stream boolean नहीं स्ट्रीमिंग अनुक्रिया सक्रिय करें. तयशुदा: <कोड> गलत/कोड>

उदाहरण निवेदन

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

प्रतिक्रिया

Returns the audio file as binary data with appropriate Content-Type header (audio/mpeg, audio/wav, etc.).

अनुक्रिया शीर्षक
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498

पाठ से वार्ता

POST /v1/stt/

ऑडियो को पाठ में स्केल करें. समर्थन 99 भाषाओं को स्वतः जाँच के साथ समर्थन करता है.

निवेदन शरीर (multipart/form-data)

पैरामीटरक़िस्मआवश्यकवर्णन
file file हाँ ऑडियो फ़ाइल (एमपी3, WAC, FLAC, ओवेदी, M4A, एमपी4, वेब. अधिकतम 100MB)
model string नहीं SGAR मॉडल: <कोड [तयशुदा], <कोड <कोड> [तयशुदा] <कोड> <कोड> <कोड>
language string नहीं भाषा कोड. <कोड> स्वतः जाँच (तयशुदा रूप से).
timestamps boolean नहीं शब्द- लेवल टाइमस्टैंप शामिल करें. डिफ़ॉल्ट: <कोड> < गलत/कोड>
diarize boolean नहीं स्पीकर विजुअलाइज़ेशन सक्षम करें. डिफ़ॉल्ट: <कोड> गलत

प्रतिक्रिया

JSON अनुक्रिया
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

आवाज कोलोन

POST /v1/tts/clone/

क्लोन किए गए आवाज में भाषण तैयार करें. एक संदर्भ तथा पाठ अपलोड करें.

निवेदन शरीर (multipart/form-data)

पैरामीटरक़िस्मआवश्यकवर्णन
reference_audio file हाँ रेफ़रेंस आवाज (१०- 30 सेकेंड की): अधिकतम २०MB.
text string हाँ क्लोन आवाज में बोलने के लिए पाठ.
model string नहीं क्लोन मॉडल: <कोड> गपशपबॉक्स , <कोड> [तयशुदा], <कोड2
format string नहीं आउटपुट प्रारूप: <कोड>

, <कोड , <कोड

language string नहीं लक्ष्य भाषा कोड. चुना गया मॉडल द्वारा समर्थित होना चाहिए.

प्रतिक्रिया

ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है, जैसे कि टीटीएस के रूप में.

आवाज परिवर्तक

POST /v1/voice-convert/

ध्वनि को भिन्न आवाज की तरह बदलें. अपलोड करने के लिए श्रोत और एक लक्ष्य आवाज चुनें.

निवेदन शरीर (multipart/form-data)

पैरामीटरक़िस्मआवश्यकवर्णन
file file हाँ स्रोत ऑडियो फ़ाइल (एमपी3, WAC) अधिकतम 50MB.
target_voice string हाँ लक्ष्य आवाज आईडी को परिवर्तित करने के लिए ( <कोड>/v1/ Cpp> / दर्ज करें> कुंजी सूची में लागू करने के लिए)
model string नहीं आवाज रूपांतरण मॉडल: <कोड> (तयशुदा रूप से), <कोड>
format string नहीं आउटपुट प्रारूप: <कोड < wav> , <तयशुदा रूप से

<कोड> <कोड> <कोड>,

उदाहरण निवेदन

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

प्रतिक्रिया

परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.

भाषण अनुवाद

POST /v1/speech-translate/

एक से दूसरे भाषा में ऑडियो का अनुवाद किया जा रहा है. पाठ- से- वार्ता, अनुवाद तथा पाठ- से- वार्ता एक ही कॉल में

निवेदन शरीर (multipart/form-data)

पैरामीटरक़िस्मआवश्यकवर्णन
file file हाँ मूल भाषा में ऑडियो फ़ाइल. अधिकतम 100MB.
target_language string हाँ लक्ष्य भाषा कोड (जैसे कि, <कोड> , <कोड>

<कोड>, <कोड>

>

>

voice string नहीं अनुवादित आउटपुट के लिए आवाज. यदि मिट गया है तो स्वचालित रूप से चयनित.
preserve_voice boolean नहीं मूल स्पीकर को संरक्षित करने की कोशिश

प्रतिक्रिया

JSON अनुक्रिया
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

बोलने के लिए भाषण

POST /v1/speech-to-speech/

उन्‍नति करने के लिए उपयोगी स्वर, माप, और भाव - शक्‍ति के लिए ।

निवेदन शरीर (multipart/form-data)

पैरामीटरक़िस्मआवश्यकवर्णन
file file हाँ स्रोत ऑडियो फ़ाइल. अधिकतम 50MB.
voice string हाँ आउटपुट भाषण के लिए लक्ष्य आवाज आईडी
model string नहीं मॉडल: <कोड> <कोड (डिफ़ॉल्ट), <कोड> गपशप- बाक्स
emotion string नहीं लक्ष्य भावना: <कोड> , <कोड < dop>, <कोड> <कोड>

, <कोड>

, <कोड>

speed float नहीं गति समायोजन. डिफ़ॉल्ट: <कोड> <1.0 <. सीमा <कोड> <कोड> <कोड> <कोड2> <कोड> <कोड2>

प्रतिक्रिया

परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.

ऑडियो औज़ार

ध्वनि प्रक्रिया अंत में प्रक्षेपक, मुखक हटाने, विन्यासक विभाजन, और उससे भी अधिक करती है ।

POST /v1/audio/enhance/

ऑडियो गुण: डीनोन, स्पष्टता से सुधार, सुपर प्रस्ताव.

file fileऑडियो फ़ाइल को बेहतर बनाने के लिए
denoise booleanमिटाना सक्षम करें (डिफ़ॉल्ट: सही)
enhance_clarity booleanसाफ शब्दों में कहें तो साफ - सफाई (डिफ़ॉल्ट: सच्चा)
super_resolution booleanश्वेत- स्केल ऑडियो क्वालिटी (डिफ़ॉल्टः गलत)
strength integer1-3 (हला, मीडिया, मजबूत) डिफ़ॉल्ट: 2
POST /v1/audio/separate/

माध्यमों से अलग मुख- पट्टी (वो हटाने) या पुल में विभाजित होता है.

file fileअलग करने के लिए ध्वनि फ़ाइल
model stringdemucs (डिफ़ॉल्ट) या spleeter
stems integerपुल की संख्या: 2, 4, 5, या 6 (डिफ़ॉल्ट: 2)
format stringआउटपुट प्रारूप: <कोड < wav>

, <कोड>

<कोड>, <कोड

POST /v1/audio/dereverb/

ऑडियो रिकॉर्डिंग से इको निरस्तीकरण हटाएँ.

file fileप्रक्रिया में ऑडियो फ़ाइल
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ मुक्त

कुंजी, बीएम, तथा समय हस्ताक्षर का पता लगाने के लिए ऑडियो की जाँच करें.

file fileAudio file to analyze
प्रतिक्रिया
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ मुक्त

फ़ॉर्मेटों के बीच ऑडियो बदलें.

file fileपरिवर्तित करने के लिए ऑडियो फ़ाइल
format stringलक्ष्य प्रारूप: <कोड

, <कोड> <कोड> , '4ap> <कोड> <कोड>

bitrate integerआउटपुट बिटरेट केब में: 64, 128, 192, 256, 320
sample_rate integerसेंपल दर: 22050, 44100, 48000
channels stringmono या stereo

आवाज़-चीत

POST /v1/voice-chat/

ऑडियो या पाठ भेजें और स्लोने वाले शब्दों के साथ एआई प्रतिक्रिया प्राप्त करें.

निवेदन शरीर (multipart/form-data या JSON)

पैरामीटरक़िस्मआवश्यकवर्णन
audio file नहीं* ऑडियो इनपुट (FAS <कोड>oodo या <कोड>

पाठ जरूरी)

text string नहीं* पाठ इनपुट (FSE <कोड>oodio या <कोड>

पाठ जरूरी)

voice string नहीं एआई प्रतिक्रिया के लिए आवाज. डिफ़ॉल्ट: <कोड>fffell_BAR_ blayfell
tts_model string नहीं प्रतिक्रिया के लिए TTS मॉडल. डिफ़ॉल्ट: <कोड> <कोडियो
system_prompt string नहीं एआई के लिए मनपसंद तंत्र प्राम्प्ट
conversation_id string नहीं मौजूदा वार्तालाप को जारी रखें

प्रतिक्रिया

JSON अनुक्रिया
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

मॉडलों की सूची

GET /v1/models/

अपनी क्षमता के साथ सभी उपलब्ध मॉडलों की सूची बताता है.

प्रतिक्रिया

JSON अनुक्रिया
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

स्थिति सूची

GET /v1/voices/

सभी उपलब्ध ध्वनि की सूची लौटाता है, मॉडल या भाषा द्वारा वैकल्पिक रूप से फिल्टर.

क्वैरी पैरामीटर

पैरामीटरक़िस्मवर्णन
model string मॉडल आईडी से फ़िल्टर (उदा. g, <कोड> )
language string भाषा कोड द्वारा फ़िल्टर (उदा.g, <कोड> )
gender string फिल्टर: <कोड>

, <कोड> <कोड , <कोड> <कोड>

प्रतिक्रिया

JSON अनुक्रिया
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

कोड उदाहरण

बोलने के लिए पाठ

Python - requests
import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

पाठ से वार्ता

Python - requests
# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

आवाज कोलोन

Python - requests
# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

बोलने के लिए पाठ

JavaScript - fetch
const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

पाठ से वार्ता

JavaScript - fetch
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

बोलने के लिए पाठ

cURL
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

पाठ से वार्ता

cURL
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

आवाज कोलोन

cURL
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

ऑडियो संवर्द्धन

cURL
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

कोड साफ करने में त्रुटि

सभी त्रुटियों को किसी के साथ JSON प्रतिक्रिया प्राप्त होती है error क्षेत्र.

त्रुटि प्रतिक्रिया फ़ॉर्मेट
{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough credits for this request.",
    "credits_required": 4,
    "credits_available": 2
  }
}
HTTP स्थितिError Codeवर्णन
400 bad_request अवैध निवेदन पैरामीटर. विवरण के लिए त्रुटि संदेश जांचें.
401 unauthorized अनुपस्थित या अवैध कुंजी.
402 insufficient_credits पर्याप्त श्रेय नहीं. // praping/ पर अधिक धन्यवाद.
403 forbidden आपकी योजना पर एपीआई पहुँच उपलब्ध नहीं है.
404 not_found मॉडल या आवाज नहीं मिला.
413 file_too_large फ़ाइल आकार सीमा से अधिक हो गया.
429 rate_limited बहुत से निवेदन हैं. दर सीमा शीर्ष शीर्षिका जांचें.
500 internal_error सर्वर त्रुटि. बाद में फिर कोशिश करें.
503 model_loading मॉडल लोड किया जा रहा है. कुछ सेकंड में फिर कोशिश करें.

न्यूक्लासhaiti. kgm

लंबे सफर किए कार्यों के लिए (स्किक विभाजन, बैच TS), आप एक <कोड_BAR_kturturt _center> पैरामीटर प्रदान कर सकते हैं. जब कार्य पूरा हो जाएगा, हम आपके URL के सिर्फ परिणाम तक पहुँचने के लिए पी सकते हैं.

वेबपरेट खर्च
{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}
इन्हें तुरंत डाउनलोड करने की निश्‍चित कीजिए ।

बिल्ड के लिए तैयार?

अपनी एपीआई कुंजी प्राप्त करें और TTSe.ee को आपके अनुप्रयोगों में शामिल करने के लिए शुरू करें.