एपीआई प्रलेखन
हमारे पुनर्देश के साथ आपके अनुप्रयोग को एकीकृत करें. आसान उत्प्रवासन के लिए कृत्रिम प्रारूप खोलें.
ओवरव्यू
The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request/response bodies.
एपीआई कुंजी
से अपनी एपीआई कुंजी प्राप्त करें खाता सेटिंग. पहले से योजना बनाइए ।
बेस यूआरएल
https://api.tts.ai/v1/
एटीएन
के द्वारा बीयरर टोकन Authorization शीर्षिका
सत्यापन
सभी एपीआई निवेदन भरोसेक के लिए सत्यापन की आवश्यकता है Authorization शीर्षिका.
Authorization: Bearer sk-tts-your-api-key-here
बेस यूआरएल
सभी अंतिम बिन्दु इस आधार यूआरएल के सापेक्ष हैं. उदाहरण के लिए, टीएसएसटीपाइंट है:
दर सीमा
प्लान किया गया है
| योजना | निवेदन/मिन | Concurrent | अधिकतम पाठ लंबाई |
|---|---|---|---|
| प्रोग्रेड | 60 | 5 | 5,000 अक्षर |
| छोटे - छोटे रंग | 300 | 20 | 50,000 अक्षर |
दर सीमा शीर्षों को प्रत्येक जवाब में शामिल किया जाता है: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.
क्रेडिट कास्ट्स
| सेवा | खर्च | इकाई |
|---|---|---|
| TTS (फ्री मॉडल: पाइपर, VITS, मेरोटीएस) | % 1 क्रेडिट | प्रति 1,000 अक्षर |
| TTS (मानक मॉडल: कोकोरो, कोस 2, etc.) | 2 श्रेय | प्रति 1,000 अक्षर |
| टीएसटी (प्रेशियम मॉडल: QShortcut, चैट बाक्स इत्यादि) | 4 श्रेय | प्रति 1,000 अक्षर |
| पाठ से वार्ता | 2 श्रेय | ऑडियो की प्रति मिनट |
| आवाज कोलोन | 4 श्रेय | प्रति 1,000 अक्षर |
| आवाज परिवर्तक | 3 श्रेय | ऑडियो की प्रति मिनट |
| ऑडियो संवर्द्धन | 2 श्रेय | ऑडियो की प्रति मिनट |
| चोरी / स्मिटिंग | 3-4 श्रेय | ऑडियो की प्रति मिनट |
| भाषण अनुवाद | 5 श्रेय | ऑडियो की प्रति मिनट |
| आवाज़-चीत | 3 श्रेय | पलटता है |
| कुंजी & अपराह्न ढूंढने वाला | मुक्त | -- |
| ऑडियो परिवर्तक | मुक्त | -- |
बोलने के लिए पाठ
पाठ को ऑडियो ऑडियो में बदलें. निवेदित फॉर्मेट में ऑडियो फ़ाइल वापस लें.
निवेदन शरीर
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| model | string | हाँ | मॉडल आईडी (जैसे, <कोड>, |
| text | string | हाँ | भाषा में परिवर्तन करने के लिए पाठ (50, 50,000 के लिए 50,000 अक्षर) |
| voice | string | हाँ | आवाज आईडी ( <कोड>/v1/p> उपलब्ध आवाज की सूची में |
| format | string | नहीं | आउटपुट प्रारूप: <कोड>
> <कोड> |
| speed | float | नहीं | गति गुणक है. तयशुदा: <कोड> <40/कोड>. सीमा <कोड> <कोड> <कोड> <कोड> <कोड2> <कोड> <0> |
| language | string | नहीं | भाषा कोड (जैसे, <कोड> कोड>, <कोड> <>> <कोड> कोड>. तब पता चला गया यदि रोका गया हो. |
| stream | boolean | नहीं | स्ट्रीमिंग अनुक्रिया सक्रिय करें. तयशुदा: <कोड> गलत/कोड> |
उदाहरण निवेदन
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"text": "Hello from TTS.ai! This is a test.",
"voice": "af_bella",
"format": "mp3"
}' \
--output output.mp3
प्रतिक्रिया
Returns the audio file as binary data with appropriate Content-Type header (audio/mpeg, audio/wav, etc.).
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498
पाठ से वार्ता
ऑडियो को पाठ में स्केल करें. समर्थन 99 भाषाओं को स्वतः जाँच के साथ समर्थन करता है.
निवेदन शरीर (multipart/form-data)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| file | file | हाँ | ऑडियो फ़ाइल (एमपी3, WAC, FLAC, ओवेदी, M4A, एमपी4, वेब. अधिकतम 100MB) |
| model | string | नहीं | SGAR मॉडल: <कोड |
| language | string | नहीं | भाषा कोड. <कोड> स्वतः जाँच (तयशुदा रूप से). |
| timestamps | boolean | नहीं | शब्द- लेवल टाइमस्टैंप शामिल करें. डिफ़ॉल्ट: <कोड> < गलत/कोड> |
| diarize | boolean | नहीं | स्पीकर विजुअलाइज़ेशन सक्षम करें. डिफ़ॉल्ट: <कोड> गलत कोड> |
प्रतिक्रिया
{
"text": "Hello, this is a transcription test.",
"language": "en",
"duration": 3.5,
"segments": [
{
"start": 0.0,
"end": 1.8,
"text": "Hello, this is",
"speaker": "SPEAKER_00"
},
{
"start": 1.8,
"end": 3.5,
"text": "a transcription test.",
"speaker": "SPEAKER_00"
}
]
}
आवाज कोलोन
क्लोन किए गए आवाज में भाषण तैयार करें. एक संदर्भ तथा पाठ अपलोड करें.
निवेदन शरीर (multipart/form-data)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| reference_audio | file | हाँ | रेफ़रेंस आवाज (१०- 30 सेकेंड की): अधिकतम २०MB. |
| text | string | हाँ | क्लोन आवाज में बोलने के लिए पाठ. |
| model | string | नहीं | क्लोन मॉडल: <कोड> गपशपबॉक्स कोड>, <कोड> [तयशुदा], <कोड2 कोड> |
| format | string | नहीं | आउटपुट प्रारूप: <कोड>
|
| language | string | नहीं | लक्ष्य भाषा कोड. चुना गया मॉडल द्वारा समर्थित होना चाहिए. |
प्रतिक्रिया
ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है, जैसे कि टीटीएस के रूप में.
आवाज परिवर्तक
ध्वनि को भिन्न आवाज की तरह बदलें. अपलोड करने के लिए श्रोत और एक लक्ष्य आवाज चुनें.
निवेदन शरीर (multipart/form-data)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| file | file | हाँ | स्रोत ऑडियो फ़ाइल (एमपी3, WAC) अधिकतम 50MB. |
| target_voice | string | हाँ | लक्ष्य आवाज आईडी को परिवर्तित करने के लिए ( <कोड>/v1/ Cpp> / दर्ज करें> कुंजी सूची में लागू करने के लिए) |
| model | string | नहीं | आवाज रूपांतरण मॉडल: <कोड> |
| format | string | नहीं | आउटपुट प्रारूप: <कोड < wav> <कोड> <कोड> <कोड>, |
उदाहरण निवेदन
curl -X POST https://api.tts.ai/v1/voice-convert/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@source_audio.mp3" \
-F "target_voice=af_bella" \
-F "model=openvoice" \
-o converted.wav
प्रतिक्रिया
परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.
भाषण अनुवाद
एक से दूसरे भाषा में ऑडियो का अनुवाद किया जा रहा है. पाठ- से- वार्ता, अनुवाद तथा पाठ- से- वार्ता एक ही कॉल में
निवेदन शरीर (multipart/form-data)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| file | file | हाँ | मूल भाषा में ऑडियो फ़ाइल. अधिकतम 100MB. |
| target_language | string | हाँ | लक्ष्य भाषा कोड (जैसे कि, <कोड> कोड>, <कोड> <कोड>, <कोड> > > |
| voice | string | नहीं | अनुवादित आउटपुट के लिए आवाज. यदि मिट गया है तो स्वचालित रूप से चयनित. |
| preserve_voice | boolean | नहीं | मूल स्पीकर को संरक्षित करने की कोशिश |
प्रतिक्रिया
{
"original_text": "Hello, how are you?",
"translated_text": "Hola, como estas?",
"source_language": "en",
"target_language": "es",
"audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
"credits_used": 5
}
बोलने के लिए भाषण
उन्नति करने के लिए उपयोगी स्वर, माप, और भाव - शक्ति के लिए ।
निवेदन शरीर (multipart/form-data)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| file | file | हाँ | स्रोत ऑडियो फ़ाइल. अधिकतम 50MB. |
| voice | string | हाँ | आउटपुट भाषण के लिए लक्ष्य आवाज आईडी |
| model | string | नहीं | मॉडल: <कोड> <कोड कोड> (डिफ़ॉल्ट), <कोड> गपशप- बाक्स कोड> |
| emotion | string | नहीं | लक्ष्य भावना: <कोड> , <कोड> , <कोड> |
| speed | float | नहीं | गति समायोजन. डिफ़ॉल्ट: <कोड> <1.0 <कोड>. सीमा <कोड> <कोड> <कोड> <कोड2> <कोड> <कोड2> |
प्रतिक्रिया
परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.
ऑडियो औज़ार
ध्वनि प्रक्रिया अंत में प्रक्षेपक, मुखक हटाने, विन्यासक विभाजन, और उससे भी अधिक करती है ।
ऑडियो गुण: डीनोन, स्पष्टता से सुधार, सुपर प्रस्ताव.
| file file | ऑडियो फ़ाइल को बेहतर बनाने के लिए |
| denoise boolean | मिटाना सक्षम करें (डिफ़ॉल्ट: सही) |
| enhance_clarity boolean | साफ शब्दों में कहें तो साफ - सफाई (डिफ़ॉल्ट: सच्चा) |
| super_resolution boolean | श्वेत- स्केल ऑडियो क्वालिटी (डिफ़ॉल्टः गलत) |
| strength integer | 1-3 (हला, मीडिया, मजबूत) डिफ़ॉल्ट: 2 |
माध्यमों से अलग मुख- पट्टी (वो हटाने) या पुल में विभाजित होता है.
| file file | अलग करने के लिए ध्वनि फ़ाइल |
| model string | demucs (डिफ़ॉल्ट) या spleeter |
| stems integer | पुल की संख्या: 2, 4, 5, या 6 (डिफ़ॉल्ट: 2) |
| format string | आउटपुट प्रारूप: <कोड < wav> , <कोड>
<कोड>, <कोड
|
ऑडियो रिकॉर्डिंग से इको निरस्तीकरण हटाएँ.
| file file | प्रक्रिया में ऑडियो फ़ाइल |
| type string | echo or reverb (default: both) |
| intensity integer | 1-5 (default: 3) |
कुंजी, बीएम, तथा समय हस्ताक्षर का पता लगाने के लिए ऑडियो की जाँच करें.
| file file | Audio file to analyze |
{
"key": "C",
"scale": "Major",
"bpm": 120.0,
"time_signature": "4/4",
"camelot": "8B",
"compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
फ़ॉर्मेटों के बीच ऑडियो बदलें.
| file file | परिवर्तित करने के लिए ऑडियो फ़ाइल |
| format string | लक्ष्य प्रारूप: <कोड
|
| bitrate integer | आउटपुट बिटरेट केब में: 64, 128, 192, 256, 320 |
| sample_rate integer | सेंपल दर: 22050, 44100, 48000 |
| channels string | mono या stereo |
आवाज़-चीत
ऑडियो या पाठ भेजें और स्लोने वाले शब्दों के साथ एआई प्रतिक्रिया प्राप्त करें.
निवेदन शरीर (multipart/form-data या JSON)
| पैरामीटर | क़िस्म | आवश्यक | वर्णन |
|---|---|---|---|
| audio | file | नहीं* | ऑडियो इनपुट (FAS <कोड>oodo कोड> या <कोड> पाठ कोड> जरूरी) |
| text | string | नहीं* | पाठ इनपुट (FSE <कोड>oodio कोड> या <कोड> पाठ कोड> जरूरी) |
| voice | string | नहीं | एआई प्रतिक्रिया के लिए आवाज. डिफ़ॉल्ट: <कोड>fffell_BAR_ blayfell कोड> |
| tts_model | string | नहीं | प्रतिक्रिया के लिए TTS मॉडल. डिफ़ॉल्ट: <कोड> <कोडियो कोड> |
| system_prompt | string | नहीं | एआई के लिए मनपसंद तंत्र प्राम्प्ट |
| conversation_id | string | नहीं | मौजूदा वार्तालाप को जारी रखें |
प्रतिक्रिया
{
"conversation_id": "conv_abc123",
"user_text": "What is the capital of France?",
"ai_text": "The capital of France is Paris.",
"audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
"credits_used": 3
}
मॉडलों की सूची
अपनी क्षमता के साथ सभी उपलब्ध मॉडलों की सूची बताता है.
प्रतिक्रिया
{
"models": [
{
"id": "kokoro",
"name": "Kokoro",
"type": "tts",
"tier": "standard",
"languages": ["en", "ja", "ko", "zh", "fr"],
"supports_cloning": false,
"supports_streaming": true,
"credits_per_1k_chars": 2
},
{
"id": "chatterbox",
"name": "Chatterbox",
"type": "tts",
"tier": "premium",
"languages": ["en"],
"supports_cloning": true,
"supports_streaming": true,
"credits_per_1k_chars": 4
}
]
}
स्थिति सूची
सभी उपलब्ध ध्वनि की सूची लौटाता है, मॉडल या भाषा द्वारा वैकल्पिक रूप से फिल्टर.
क्वैरी पैरामीटर
| पैरामीटर | क़िस्म | वर्णन |
|---|---|---|
| model | string | मॉडल आईडी से फ़िल्टर (उदा. g, <कोड> |
| language | string | भाषा कोड द्वारा फ़िल्टर (उदा.g, <कोड> कोड>) |
| gender | string | फिल्टर: <कोड>
, <कोड> <कोड कोड>, <कोड> <कोड> |
प्रतिक्रिया
{
"voices": [
{
"id": "af_bella",
"name": "Bella",
"model": "kokoro",
"language": "en",
"gender": "female",
"preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
}
],
"total": 142
}
कोड उदाहरण
बोलने के लिए पाठ
import requests
API_KEY = "sk-tts-your-key"
# Text to Speech
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
"format": "mp3"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
print(f"Credits used: {response.headers.get('X-Credits-Used')}")
पाठ से वार्ता
# Speech to Text
with open("recording.mp3", "rb") as f:
response = requests.post(
"https://api.tts.ai/v1/stt/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"file": f},
data={"model": "faster-whisper", "timestamps": "true"}
)
result = response.json()
print(result["text"])
आवाज कोलोन
# Voice Cloning
with open("reference.wav", "rb") as ref:
response = requests.post(
"https://api.tts.ai/v1/tts/clone/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"reference_audio": ref},
data={
"text": "This speech uses a cloned voice.",
"model": "chatterbox"
}
)
with open("cloned_output.mp3", "wb") as f:
f.write(response.content)
बोलने के लिए पाठ
const API_KEY = 'sk-tts-your-key';
// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
method: 'POST',
headers: {
'Authorization': `Bearer ${API_KEY}`,
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'kokoro',
text: 'Hello from TTS.ai!',
voice: 'af_bella',
format: 'mp3'
})
});
const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();
पाठ से वार्ता
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');
const response = await fetch('https://api.tts.ai/v1/stt/', {
method: 'POST',
headers: { 'Authorization': `Bearer ${API_KEY}` },
body: formData
});
const result = await response.json();
console.log(result.text);
बोलने के लिए पाठ
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
-o output.mp3
पाठ से वार्ता
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@recording.mp3" \
-F "model=faster-whisper" \
-F "timestamps=true"
आवाज कोलोन
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "reference_audio=@reference.wav" \
-F "text=This uses a cloned voice." \
-F "model=chatterbox" \
-o cloned.mp3
ऑडियो संवर्द्धन
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@noisy_audio.mp3" \
-F "denoise=true" \
-F "enhance_clarity=true" \
-o enhanced.mp3
कोड साफ करने में त्रुटि
सभी त्रुटियों को किसी के साथ JSON प्रतिक्रिया प्राप्त होती है error क्षेत्र.
{
"error": {
"code": "insufficient_credits",
"message": "You do not have enough credits for this request.",
"credits_required": 4,
"credits_available": 2
}
}
| HTTP स्थिति | Error Code | वर्णन |
|---|---|---|
| 400 | bad_request |
अवैध निवेदन पैरामीटर. विवरण के लिए त्रुटि संदेश जांचें. |
| 401 | unauthorized |
अनुपस्थित या अवैध कुंजी. |
| 402 | insufficient_credits |
पर्याप्त श्रेय नहीं. // praping/ पर अधिक धन्यवाद. |
| 403 | forbidden |
आपकी योजना पर एपीआई पहुँच उपलब्ध नहीं है. |
| 404 | not_found |
मॉडल या आवाज नहीं मिला. |
| 413 | file_too_large |
फ़ाइल आकार सीमा से अधिक हो गया. |
| 429 | rate_limited |
बहुत से निवेदन हैं. दर सीमा शीर्ष शीर्षिका जांचें. |
| 500 | internal_error |
सर्वर त्रुटि. बाद में फिर कोशिश करें. |
| 503 | model_loading |
मॉडल लोड किया जा रहा है. कुछ सेकंड में फिर कोशिश करें. |
न्यूक्लासhaiti. kgm
लंबे सफर किए कार्यों के लिए (स्किक विभाजन, बैच TS), आप एक <कोड_BAR_kturturt _center> पैरामीटर प्रदान कर सकते हैं. जब कार्य पूरा हो जाएगा, हम आपके URL के सिर्फ परिणाम तक पहुँचने के लिए पी सकते हैं.
{
"event": "task.completed",
"task_id": "task_abc123",
"status": "success",
"result_url": "https://api.tts.ai/v1/results/task_abc123",
"credits_used": 12,
"created_at": "2025-01-15T10:30:00Z",
"completed_at": "2025-01-15T10:30:45Z"
}
बिल्ड के लिए तैयार?
अपनी एपीआई कुंजी प्राप्त करें और TTSe.ee को आपके अनुप्रयोगों में शामिल करने के लिए शुरू करें.