मैं एक एपीआई कुंजी कैसे मिलता है?

एक मुक्त TTS.ai खाता के लिए साइन अप, फिर अपने खाता डेंटबोर्ड पर नेविगेट करें और "रिकार्ड कुंजी" पर क्लिक करें. आपकी कुंजी उपयोग में लिया जाएगा sct-ts-ts के साथ और तुरंत उपयोग में लिया जा सकता है. फ्री खाता 15,000 अक्षर प्राप्त करें.

HAV के फ़ॉर्मेट के साथ क्या एपीआई संगत है?

जी हाँ, हमारे एपीआई GAREARMAT निवेदन और प्रतिक्रिया स्वरूपों के अनुसार चलती है. यदि आपके पास मौजूदा कोड है जो मौजूदा बुद्धि का प्रयोग करता है तो आप आधार यूआरएल और न्यूनतम कोड परिवर्तनों के साथ TTS.ai000 तक स्विच कर सकते हैं.

क्या प्रोग्रामिंग भाषा समर्थित हैं?

REST API किसी भी भाषा के साथ काम करता है जो एचटीटीपी निवेदन कर सकता है. हम पायथन, जावास्क्रिप्ट (कोई नहीं), callse और ब्राउज़र में कोड उदाहरण प्रदान करते हैं. किसी भी भाषा में कोई भी एचटीटीपी क्लाएंट, रूबी, जावा, CHIG, CHOND.

एपीआई दर क्या है?

उपलब्ध खाता प्रति घंटे 3 निवेदन करने के लिए सीमित हैं. Pideid योजनाओं में आपके सदस्यता के लिए उच्च सीमाएँ हैं: प्रारंभ करें (60/ घंटे), व्यावसायिक (300/ घंटे). दर सीमा शीर्ष जवाब में शामिल हैं सभी एपीआई प्रतिक्रिया में.

काम कैसे किया जा रहा है?

Y का उपयोग मॉडल टाईटर और पाठ लंबाई पर आधारित अक्षरों को खाते हैं. मुक्त मॉडल 0 अक्षर का उपयोग करते हैं, मानक मॉडल 2x अक्षरों का उपयोग करते हैं, और प्रीफिक्स मॉडल 4x अक्षरों का उपयोग करते हैं. अक्षर सभी भुगतान योजनाओं में शामिल हैं और वे भी अलग से खरीदा जा सकता है.

कौन - से अंत - विषय उपलब्ध हैं?

एपीआई पाठ- से- वार्ता के लिए अंत बिन्दु प्रदान करता है (सामान्य: // v1/ typ1/ tys/ twit), पाठ- से- वार्ता (संत्र/ twny- Cypon/ Consephys), (संब्स / Cy- Con/ Cuts), और अधिक सुधार.

एपीआई में क्या लिखा है?

EVENV प्रारूप में ऑडियो को डिफ़ॉल्ट रूप में बताता है. आप आउटपुट प्रारूप में निर्धारित कर सकते हैं (एमपी3, वेवेव, वीआईएस) प्रतिक्रिया के प्रयोग से. एमपी3 को वेब ऑडियो प्रक्रिया के लिए सलाह दी जाती है.

क्या वास्तविक समय TTS के लिए एक धारा एपीआई है?

जी हाँ, हमारे MATIV का परिणाम बताता है कि आप परिणाम के लिए सर्वे कर सकते हैं. कोकोरो की तरह समर्थित मॉडलों के लिए, ऑडियो पीढ़ी पास के समय के अनुप्रयोगों के लिए पर्याप्त तेज है. रिपोर्ट अंत में जब प्रक्रिया पूरी हो जाती है तब ऑडियो यूआरएल को लौटाती है.

मैं कैसे एपीआई में त्रुटिएं संभालता हूँ?

API का परिणाम होगा मानक HTTP स्थिति कोड (जैसे कि गलत अनुरोधों के लिए400, CH1, दर सीमा के लिए 429, सर्वर त्रुटि संदेश के लिए 500). हमेशा स्थिति कोड और त्रुटि कोड को सही प्रकार से लागू करने के लिए जांचें.

क्या मैं व्यापारिक अनुप्रयोगों के लिए एपीआई इस्तेमाल कर सकते हैं?

जी हाँ, एपीआई व्यावसायिक प्रयोग के लिए बनाया गया है. आपके उत्पादों, अनुप्रयोगों, और सेवाओं के माध्यम से वीडियो उत्पन्न किया जा सकता है. सभी मॉडल खुले स्रोत लाइसेंस का उपयोग करते हैं, और यहां पर कोई अतिरिक्त राजस्वार्थात्मक गणना नहीं है.

क्या कोई सेंडबाक्स या जाँच - पड़ताल वातावरण है?

फ्री-टियर मॉडल (केरो, पाइपो, VI, VIFS) एक उत्तम सेकंड के रूप में सेवा करते हैं - वे शून्य अक्षर का प्रयोग करते हैं और सभी खातों के लिए उपलब्ध हैं. उत्पादन के लिए स्विच मॉडलों को बदलने से पहले अपने स्वतंत्र मॉडलों की जाँच करें.

मैं किस तरह एपीआई के माध्यम से उपलब्ध आवाज और मॉडलों की सूची देता हूँ?

सभी उपलब्ध आवाजों की सूची देने के लिए /v1/ Conks का उपयोग करें फिल्टर के साथ सभी उपलब्ध आवाजों की सूची में.

TTS.ai एपीआई प्रलेखन - भाषा में भाषण देने के लिए पाठ

ओवरव्यू

TTS.ai API सभी मंच विशेषताओं को प्रोग्राम संगत पहुँच प्रदान करता है: पाठ- से- वार्ता, पाठ- से- वार्ता, भाषा- से- वार्ता, आवाज- वार्ता, ऑडियो सुधार, और अधिक. API का प्रयोग JSON/ mutionion शरीर के साथ मानक रिव्विंग अधिवेशनों के साथ करता है.

एपीआई कुंजी

से अपनी एपीआई कुंजी प्राप्त करें खाता सेटिंग. पहले से योजना बनाइए ।

बेस यूआरएल

https://api.tts.ai/v1/

एटीएन

के द्वारा बीयरर टोकन Authorization शीर्षिका

सत्यापन

मुफ्त टाई की ज़रूरत नहीं । अज्ञात पीअर से /v1/tts/ किसी भी प्राधिकार के बिना काम करें, प्रति आईपी/ दिन 5,000 अक्षरों के लिए, हमारे किसी भी मुक्त मॉडल का उपयोग करते हुए (piper, vits, melotts, kokoro). 15,000 ब्रीस अक्षर प्राप्त करने और पूर्वनियम मॉडलों तक पहुँचने के लिए एक स्वतंत्र वृत्तांत के लिए हस्ताक्षर करें.

प्रीमियम मॉडल तथा उच्च दर सीमा के लिए, एक बीयर टोकन के साथ सत्यापन Authorization शीर्षिका.

एचटीटीपी शीर्षिका

Authorization: Bearer sk-tts-your-api-key-here

एपीआई कुंजी गुप्त रखें. इसे क्लाइंट के किनारे, सार्वजनिक भंडार, या लॉग में साझा नहीं करें. अपने खाते सेटिंग से नियमित रूप से कुंजी घुमाएँ.

के डीकेस

आधिकारिक SKSKINK आपके अनुप्रयोग में TTS.ai को एकीकृत करने के लिए आसान कर देता है. दोनों खुले स्रोत हैं और Hhb पर उपलब्ध हैं.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

बेस यूआरएल

बेस यूआरएल: https://api.tts.ai/v1/

सभी अंतिम बिन्दु इस आधार यूआरएल के सापेक्ष हैं. उदाहरण के लिए, टीएसएसटीपाइंट है:

POST https://api.tts.ai/v1/tts/

दर सीमा

प्लान किया गया है

योजना	निवेदन/मिन	कॉन्कर	अधिकतम पाठ लंबाई
मुक्त	10	2	500 अक्षर
प्रारंभ	30	3	1 करोड़ अक्षर
प्रोग्रेड	60	5	1 करोड़ अक्षर
छोटे - छोटे रंग	300	20	50,000 अक्षर

दर सीमा शीर्षों को प्रत्येक जवाब में शामिल किया जाता है: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

क्रेडिट कास्ट्स

सेवा	खर्च	इकाई
TTS (फ्री मॉडल: पाइपर, VITS, मेरोटीएस)	1,000 अक्षर	प्रति 1,000 अक्षर
TTS (मानक मॉडल: कोकोरो, कोस 2, etc.)	2,000 वर्ण	प्रति 1,000 अक्षर
टीएसटी (प्रेशियम मॉडल: QShortcut, चैट बाक्स इत्यादि)	४,००० अक्षर	प्रति 1,000 अक्षर
पाठ से वार्ता	2,000 वर्ण	ऑडियो की प्रति मिनट
आवाज कोलोन	४,००० अक्षर	प्रति 1,000 अक्षर
आवाज परिवर्तक	3,000 वर्ण	ऑडियो की प्रति मिनट
ऑडियो संवर्द्धन	2,000 वर्ण	ऑडियो की प्रति मिनट
चोरी / स्मिटिंग	3,000-4 वर्ण	ऑडियो की प्रति मिनट
भाषण अनुवाद	5,000 अक्षर	ऑडियो की प्रति मिनट
आवाज़-चीत	3,000 वर्ण	पलटता है
कुंजी & अपराह्न ढूंढने वाला	मुक्त	--
ऑडियो परिवर्तक	मुक्त	--

बोलने के लिए पाठ

POST /v1/tts/

पाठ को ऑडियो ऑडियो में बदलें. निवेदित फॉर्मेट में ऑडियो फ़ाइल वापस लें.

निवेदन शरीर

पैरामीटर	क़िस्म	आवश्यक	वर्णन
model	string	नहीं	मॉडल आईडी (जैसे, <कोड करें , गलत है. यदि नहीं, तो हम एक मॉडल को समर्थन करते हैं apt/puti> अन्य भाषाओं के लिए समर्थन करता है.
text	string	हाँ	बोलने के लिए पाठ को परिवर्तित करने के लिए. प्रति-रेप टोपी: 500 अक्षर (नोनीनी), 5,000 (पाइम खाता), 1, 1,00,000 (पावर्ड योजना). लंबा इनपुट स्वचालित सर्वर के किनारे है.
voice	string	हाँ	आवाज आईडी ( <कोड>/v1/p> उपलब्ध आवाज की सूची में प्रयोग करें)
format	string	नहीं	आउटपुट प्रारूप: <कोड> , <कोड , <कोड > <कोड>
speed	float	नहीं	गति गुणक है. तयशुदा: <कोड> <40/कोड>. सीमा <कोड> <कोड2> <कोड> <0>
language	string	नहीं	भाषा कोड (जैसे, <कोड> , <कोड> <> <कोड> . तब पता चला गया यदि रोका गया हो.
instructions	string	नहीं	काम कर रहा है / जोड़ता है (0.500 अक्षर). उदाहरण के लिए <कोड>\
pronunciations	object \| array	नहीं	पर- कर्ट उच्चारण ओवरराइड करता है. या तो <कोड> =\
stream	boolean	नहीं	स्ट्रीमिंग अनुक्रिया सक्रिय करें. तयशुदा: <कोड> गलत/कोड>

उदाहरण निवेदन

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSएमएल टैग

संख्या, तारीख़, करेंसी, फोन नंबर, तथा caconms <कोड>

सोम- व्याख्या करें	इनपुट	असके रूप में
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	दिसम्बर तीसवीं, उन्नीस पंचानवे
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A

तारीख प्रारूप <कोड> " को अंग्रेजी के लिए मूलभूत रूप से सेट करता है और <कोड>

[बन्द /] अन्य में <कोड>

उदाहरण

{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

प्रतिक्रिया

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)

{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)

{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}

Polling response (still processing)

{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

पूरा उदाहरण

Python

import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

पाठ से वार्ता

POST /v1/stt/

ऑडियो को पाठ में स्केल करें. समर्थन 99 भाषाओं को स्वतः जाँच के साथ समर्थन करता है.

निवेदन शरीर (multipart/form-data)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
file	file	हाँ	ऑडियो फ़ाइल (एमपी3, WAC, FLAC, ओवेदी, M4A, एमपी4, वेब. अधिकतम 100MB)
model	string	नहीं	SGAR मॉडल: <कोड [तयशुदा], <कोड <कोड> [तयशुदा] <कोड>
language	string	नहीं	भाषा कोड. <कोड> स्वतः जाँच (तयशुदा रूप से).
timestamps	boolean	नहीं	शब्द- लेवल टाइमस्टैंप शामिल करें. डिफ़ॉल्ट: <कोड> < गलत/कोड>
diarize	boolean	नहीं	स्पीकर विजुअलाइज़ेशन सक्षम करें. डिफ़ॉल्ट: <कोड> गलत

प्रतिक्रिया

JSON अनुक्रिया

{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

आवाज कोलोन

POST /v1/tts/clone/

क्लोन किए गए आवाज में भाषण तैयार करें. एक संदर्भ तथा पाठ अपलोड करें.

निवेदन शरीर (multipart/form-data)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
reference_audio	file	हाँ	रेफ़रेंस आवाज (१०- 30 सेकेंड की): अधिकतम २०MB.
text	string	हाँ	क्लोन आवाज में बोलने के लिए पाठ.
model	string	नहीं	क्लोन मॉडल: <कोड> गपशपबॉक्स , <कोड> [तयशुदा], <कोड2
format	string	नहीं	आउटपुट प्रारूप: <कोड> , <कोड , <कोड
language	string	नहीं	लक्ष्य भाषा कोड. चुना गया मॉडल द्वारा समर्थित होना चाहिए.

प्रतिक्रिया

ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है, जैसे कि टीटीएस के रूप में.

आवाज परिवर्तक

POST /v1/voice-convert/

ध्वनि को भिन्न आवाज की तरह बदलें. अपलोड करने के लिए श्रोत और एक लक्ष्य आवाज चुनें.

निवेदन शरीर (multipart/form-data)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
file	file	हाँ	स्रोत ऑडियो फ़ाइल (एमपी3, WAC) अधिकतम 50MB.
target_voice	string	हाँ	लक्ष्य आवाज आईडी को परिवर्तित करने के लिए ( <कोड>/v1/ Cpp> / दर्ज करें> कुंजी सूची में लागू करने के लिए)
model	string	नहीं	आवाज रूपांतरण मॉडल: <कोड> (तयशुदा रूप से), <कोड>
format	string	नहीं	आउटपुट प्रारूप: <कोड < wav> , <तयशुदा रूप से <कोड>,

उदाहरण निवेदन

cURL

curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

प्रतिक्रिया

परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.

भाषण अनुवाद

POST /v1/speech-translate/

एक से दूसरे भाषा में ऑडियो का अनुवाद किया जा रहा है. पाठ- से- वार्ता, अनुवाद तथा पाठ- से- वार्ता एक ही कॉल में

निवेदन शरीर (multipart/form-data)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
file	file	हाँ	मूल भाषा में ऑडियो फ़ाइल. अधिकतम 100MB.
target_language	string	हाँ	लक्ष्य भाषा कोड (जैसे कि, <कोड> , <कोड> <कोड>, <कोड> > >
voice	string	नहीं	अनुवादित आउटपुट के लिए आवाज. यदि मिट गया है तो स्वचालित रूप से चयनित.
preserve_voice	boolean	नहीं	मूल स्पीकर की आवाज विशेषताओं को बनाए रखने की कोशिश. डिफ़ॉल्ट: <कोड> गलत <कोड>

प्रतिक्रिया

JSON अनुक्रिया

{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

बोलने के लिए भाषण

POST /v1/speech-to-speech/

उन्‍नति करने के लिए उपयोगी स्वर, माप, और भाव - शक्‍ति के लिए ।

निवेदन शरीर (multipart/form-data)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
file	file	हाँ	स्रोत ऑडियो फ़ाइल. अधिकतम 50MB.
voice	string	हाँ	आउटपुट भाषण के लिए लक्ष्य आवाज आईडी
model	string	नहीं	मॉडल: <कोड> <कोड (डिफ़ॉल्ट), <कोड> गपशप- बाक्स
emotion	string	नहीं	लक्ष्य भावना: <कोड> , <कोड < dop>, <कोड> <कोड> , <कोड> , <कोड>
speed	float	नहीं	गति समायोजन. डिफ़ॉल्ट: <कोड> <1.0 <. सीमा <कोड> <कोड2> <कोड> <कोड2>

प्रतिक्रिया

परिवर्तित ऑडियो फ़ाइल को द्विचर डाटा के रूप में बताता है.

ऑडियो औज़ार

ध्वनि प्रक्रिया अंत में प्रक्षेपक, मुखक हटाने, विन्यासक विभाजन, और उससे भी अधिक करती है ।

POST /v1/audio/enhance/

ऑडियो गुण: डीनोन, स्पष्टता से सुधार, सुपर प्रस्ताव.

file file	ऑडियो फ़ाइल को बेहतर बनाने के लिए
denoise boolean	मिटाना सक्षम करें (डिफ़ॉल्ट: सही)
enhance_clarity boolean	साफ शब्दों में कहें तो साफ - सफाई (डिफ़ॉल्ट: सच्चा)
super_resolution boolean	श्वेत- स्केल ऑडियो क्वालिटी (डिफ़ॉल्टः गलत)
strength integer	1-3 (हला, मीडिया, मजबूत) डिफ़ॉल्ट: 2

POST /v1/audio/separate/

माध्यमों से अलग मुख- पट्टी (वो हटाने) या पुल में विभाजित होता है.

file file	अलग करने के लिए ध्वनि फ़ाइल
model string	`demucs` (डिफ़ॉल्ट) या `spleeter`
stems integer	पुल की संख्या: 2, 4, 5, या 6 (डिफ़ॉल्ट: 2)
format string	आउटपुट प्रारूप: <कोड < wav> , <कोड> <कोड>, <कोड

POST /v1/audio/dereverb/

ऑडियो रिकॉर्डिंग से इको निरस्तीकरण हटाएँ.

file file	प्रक्रिया में ऑडियो फ़ाइल
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

POST /v1/audio/analyze/ मुक्त

कुंजी, बीएम, तथा समय हस्ताक्षर का पता लगाने के लिए ऑडियो की जाँच करें.

file file

जाँचने के लिए ऑडियो फ़ाइल

प्रतिक्रिया

{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}

POST /v1/audio/convert/ मुक्त

फ़ॉर्मेटों के बीच ऑडियो बदलें.

file file	परिवर्तित करने के लिए ऑडियो फ़ाइल
format string	लक्ष्य प्रारूप: <कोड , <कोड> <कोड> , '4ap> <कोड> <कोड>
bitrate integer	आउटपुट बिटरेट केब में: 64, 128, 192, 256, 320
sample_rate integer	सेंपल दर: 22050, 44100, 48000
channels string	`mono` या `stereo`

आवाज़-चीत

POST /v1/voice-chat/

ऑडियो या पाठ भेजें और स्लोने वाले शब्दों के साथ एआई प्रतिक्रिया प्राप्त करें.

निवेदन शरीर (multipart/form-data या JSON)

पैरामीटर	क़िस्म	आवश्यक	वर्णन
audio	file	नहीं*	ऑडियो इनपुट (FAS <कोड>oodo या <कोड> पाठ जरूरी)
text	string	नहीं*	पाठ इनपुट (FSE <कोड>oodio या <कोड> पाठ जरूरी)
voice	string	नहीं	एआई प्रतिक्रिया के लिए आवाज. डिफ़ॉल्ट: <कोड>fffell_BAR_ blayfell
tts_model	string	नहीं	प्रतिक्रिया के लिए TTS मॉडल. डिफ़ॉल्ट: <कोड> <कोडियो
system_prompt	string	नहीं	एआई के लिए मनपसंद तंत्र प्राम्प्ट
conversation_id	string	नहीं	मौजूदा वार्तालाप को जारी रखें

प्रतिक्रिया

JSON अनुक्रिया

{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

बैच टीएस

POST /v1/tts/batch/

समानांतर टीटीसी पीढ़ी के लिए बहुत से पाठ जमा करें. जब सभी कार्य पूरा हों तो वैकल्पिक रूप से वेब कॉलबैक प्राप्त करें.

पैरामीटर्स

पैरामीटर	क़िस्म	वर्णन
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	जब मिटाया जा रहा हो तो वास्तविक परिणाम प्राप्त करने के लिए वैकल्पिक यूआरएल.

प्रतिक्रिया

JSON अनुक्रिया

{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

मिल /v1/ ttk/ tttp/?

आवाज एम्बेडिंग

POST /v1/voice-embed/

ऑडियो से गुप्त रूप से एक आवाज पैकिंग दर्ज करें. बाद में विडगेट के लिए कनेक्ट_BAR_रिकार्ड निवेदन पास की पीढ़ी के लिए करता है.

पैरामीटर्स

पैरामीटर	क़िस्म	वर्णन
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

प्रतिक्रिया

JSON अनुक्रिया

{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

स्वास्थ्य जाँच

GET /v1/health/

जीपीयू सर्वर स्थिति, लोड मॉडल तथा कतार आकार जाँचें. कोई प्रमाणीकरण आवश्यक नहीं. कैश 30 सेकेंड के लिए कैश्ड.

प्रतिक्रिया

JSON अनुक्रिया

{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

मॉडलों की सूची

GET /v1/models/

अपनी क्षमता के साथ सभी उपलब्ध मॉडलों की सूची बताता है.

प्रतिक्रिया

JSON अनुक्रिया

{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

स्थिति सूची

GET /v1/voices/

सभी उपलब्ध ध्वनि की सूची लौटाता है, मॉडल या भाषा द्वारा वैकल्पिक रूप से फिल्टर.

क्वैरी पैरामीटर

पैरामीटर	क़िस्म	वर्णन
model	string	मॉडल आईडी से फ़िल्टर (उदा. g, <कोड> )
language	string	भाषा कोड द्वारा फ़िल्टर (उदा.g, <कोड> )
gender	string	फिल्टर: <कोड> , <कोड> <कोड , <कोड> <कोड>

पैरामीटर

क़िस्म

वर्णन

model

string

मॉडल आईडी से फ़िल्टर (उदा. g, <कोड> )

language

string

भाषा कोड द्वारा फ़िल्टर (उदा.g, <कोड> )

gender

string

फिल्टर: <कोड>

, <कोड> <कोड , <कोड> <कोड>

प्रतिक्रिया

JSON अनुक्रिया

{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

सबटाइटल (टीटी / वीटी) नया

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

किसी भी पूर्ण टीएसटी कार्य के लिए एसटीटीएस सबटाइटल उत्पन्न करता है. ऑडियो के बारे में बार- बार जब SRT या वेब प्लेयर को पलटता है तो परिणाम डिस्क में कैश किया जाता है ताकि एक ही विजुअल डिस्क में एक बार पढ़ने के लिए दूसरा कॉल है.

क्वैरी पैरामीटर

पैरामीटर	आवश्यक	वर्णन
uuid	हाँ	कार्य UV_v1/ tt1/ या /v1/ ic1/क्लास
format	नहीं	<कोड> (डिफ़ॉल्ट) या <कोड> > >.
download	नहीं	<कोड> <कोड' को भेजने के लिए: संलग्नक तो ब्राउज़र प्रदर्शन के बजाय सहेजता है.
language	नहीं	संरेखण मॉडल पर संकेत (यदि सहेजा गया हो तो अपने आप पता लगाएँ).

cURL

curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

उच्चारण शब्दकोश नया

GET POST DELETE /api/v1/pronunciations/

TTS इंजिन को विशिष्ट शब्दों को कैसे घोषित करें. प्रविष्टियों को प्रत्येक टीईएस निवेदन के लिए स्वचालित सहेजें

निवेदन शरीर (POST)

पैरामीटर	क़िस्म	वर्णन
word	string	ओवरराइड करने के लिए शब्द (जैसे कि, <कोड> , <कोड> Adral ). वर्ड्ड मेल खाता है.
replacement	string	मॉडल के लिए यह कैसे टाइप करें (जैसे कि -g> <कोडff , <कोड> .
language	string	वैकल्पिक आईएसओ कोड. खाली = सभी भाषाओं में लागू होता है.
case_sensitive	boolean	तयशुदा <कोड> गलत <कोड>. मिलान सही जब <कोड> <कोड>

cURL

# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

आप उन्हें बचाने के बिना आगे भी आगे बढ़ सकते हैं — शामिल करें उच्चारण किसी भी /v1/ t/ या तो वस्तु के रूप में कॉल / एक ऐक्सीडें (TTSstadad tad tams देखें.

आलेख उत्पत्तिर नया

एक एकल <कोड> टैग किसी भी आलेख पृष्ठ पर टैग रखें और यात्रा करनेवाले एक स्थिर पाठक पट्टी पाते हैं जो कि पृष्ठ क्लिक पर वर्णन करता है. स्वतः आलेख के मुख्य भाग को निर्धारित करते हैं, पसंदीदा आवाज / भाषा में / भाषा रंग का रंग समर्थन करता है.

HTML

<script src="https://tts.ai/narrator.js"
    data-pk="pk-tts-your-publishable-key"
    data-voice="af_bella"
    data-model="kokoro"
    data-extract="auto"
    data-position="bottom"
    data-color="#e60000"
    data-locale="en"></script>

विकल्प

पैरामीटर	वर्णन
`data-pk`	अनुमति योग्य कुंजी (pt- tont-ts). डोमेन प्रतिबंध कुंजी के द्वारा लागू किया गया है <कोड> 'domin_ dofects क्षेत्र स्वीकारें.
`data-voice`	आवाज आईडी. तयशुदा <कोड>forf_BAR_ fel_/कोड>.
`data-model`	TTS मॉडल आईडी. डिफ़ॉल्ट <कोड>kokoo .
`data-extract`	<कोड> <कोड> - (डिफ़ॉल्ट) - आलेख/man/. compons की कोशिश करता है, गहरा अनुच्छेद गुच्छ में वापस गिरता है. या कोई सीएसएस टेप टेप चलाने के लिए किसी विशिष्ट तत्व को लक्ष्य के लिए पास जाता है.
`data-position`	<कोड> (डिफ़ॉल्ट) या <कोड> <कोड>>
`data-color`	AARACK रंग (कोई सीएसएस रंग नहीं). डिफ़ॉल्ट <कोड> # 100 < 150 <कोड>.
`data-min-chars` / `data-max-chars`	बार छोड़ें अगर यह लेख मि-Te से कम है (डिफ़ॉल्ट 200). कैप अधि. केक्स में सेड इनपुट (तयशुदा रूप से 50,000.)

GiB पर स्रोत: < abon=\

बटन विज़ेट सुनें

इनलाइन बटन शैली. इसके अगले बटन को रेंडर करता है <कोड> टैग और एक बटन-ponting छोटा है. ऊपर से आलेख के अलग आकार (जो कि पेज-ning बार बंद करता है और सारे आलेख का वर्णन करता है.

HTML

<script src="https://tts.ai/widget.js"
    data-voice="af_bella"
    data-model="kokoro"
    data-style="full"
    data-theme="light"></script>

सहेजा गया उपयोक्ता (प्रयोगक डाउनलोड)

एक संदर्भ ऑडियो अपलोड करें, एक बार एक आग्रहित आवाज वापस लाएँ, तब संदर्भ है कि टीएसएस निवेदन में हर कॉल के बजाए i- अप ऑडियो को फिर से लोड करने के लिए निवेदन करता है. मैं उच्च-वोल संयोजन के लिए आदर्श हूँ.

प्राक्की: भंडार मुक्त है (कोई दैनिक किराया नहीं है) अपलोड: एक बार प्रति ध्वनि पर 500 अक्षर प्रति समय

आवाज़ अपलोड करें

POST https://tts.ai/api/v1/user-voices/ एटीएम आवश्‍यक

मल्टीरे फ़ॉर्म. क्षेत्र: फ़ाइल (re-30, 5-30 ऑडियो), भाषा (वैकल्पिक, डिफ़ॉल्ट, मॉडल (वैकल्पिक), मॉडल (वैकल्पिक), स्वतः ejk/kosefak/Owakeue2 के लिए स्वचालित समर्थन, upphat_BAR_ Andine (किसी भी सत्य मूल्य आवश्यक है).

curl -X POST https://tts.ai/api/v1/user-voices/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@reference.wav" \
  -F "name=My Narrator" \
  -F "language=en" \
  -F "consent_confirmed=true"

# Response:
{
  "public_id": "uv_a1b2c3d4e5f6",
  "id": 42,
  "name": "My Narrator",
  "model_name": "openvoice",
  "language": "en",
  "reference_audio_url": "https://tts.ai/media/user-voices/....wav",
  "storage_status": "active",
  "created_at": "2026-04-17T03:45:00+00:00"
}

टी में सहेजे गए आवाज का प्रयोग करें

उपयोक्ता के साथ /ap/v1/ tpe/ (कोई नहीं): वेब Wepephys, कोई pepaphs. ocs) नहीं है। हम आपका ऑडियो लोड कर रहे हैं और क्षमा करने के लिए मार्ग।

curl -X POST https://tts.ai/api/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'

# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.

सूची / मिटाएँ

GET    https://tts.ai/api/v1/user-voices/           # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6

अभिलेख / फिर से सक्रिय करें (फ्री)

अभिलेखित आवाज आपके खाते में रहती है लेकिन TTSTS में उपयोग नहीं किया जा सकता. उपयोगी अंत उपयोक्ता के लिए उपयोगी है ताकि आपकी सूची साफ रहे.

POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/

कोड उदाहरण

बोलने के लिए पाठ

पायथन - निवेदन

import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

पाठ से वार्ता

पायथन - निवेदन

# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

आवाज कोलोन

पायथन - निवेदन

# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

बोलने के लिए पाठ

जावास्क्रिप्ट - लाओ

const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

पाठ से वार्ता

जावास्क्रिप्ट - लाओ

// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

बोलने के लिए पाठ

cURL

# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

पाठ से वार्ता

cURL

# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

आवाज कोलोन

cURL

# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

ऑडियो संवर्द्धन

cURL

# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

कोड साफ करने में त्रुटि

सभी त्रुटियों को किसी के साथ JSON प्रतिक्रिया प्राप्त होती है error क्षेत्र.

त्रुटि प्रतिक्रिया फ़ॉर्मेट

{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough characters for this request.",
    "characters_required": 4000,
    "characters_available": 2000
  }
}

HTTP स्थिति	कोड त्रुटि	वर्णन
400	`bad_request`	अवैध निवेदन पैरामीटर. विवरण के लिए त्रुटि संदेश जांचें.
401	`unauthorized`	अनुपस्थित या अवैध कुंजी.
402	`insufficient_credits`	पर्याप्त अक्षर नहीं हैं. / etc/.
403	`forbidden`	इस रिसोर्स पर पहुँच के लिए आपके पास अनुमति नहीं है (जैसे कि अन्य उपयोक्ता का कार्य). एपीआई पहुँच प्रत्येक योजना में शामिल है.
404	`not_found`	मॉडल या आवाज नहीं मिला.
413	`file_too_large`	फ़ाइल आकार सीमा से अधिक हो गया.
429	`rate_limited`	बहुत से निवेदन हैं. दर सीमा शीर्ष शीर्षिका जांचें.
500	`internal_error`	सर्वर त्रुटि. बाद में फिर कोशिश करें.
503	`model_loading`	मॉडल लोड किया जा रहा है. कुछ सेकंड में फिर कोशिश करें.

न्यूक्लासhaiti. kgm

लंबे सफर किए कार्यों के लिए (स्किक विभाजन, बैच TS), आप एक <कोड_BAR_kturturt _center> पैरामीटर प्रदान कर सकते हैं. जब कार्य पूरा हो जाएगा, हम आपके URL के सिर्फ परिणाम तक पहुँचने के लिए पी सकते हैं.

वेबपरेट खर्च

{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}

इन्हें तुरंत डाउनलोड करने की निश्‍चित कीजिए ।

बिल्ड के लिए तैयार?

अपनी एपीआई कुंजी प्राप्त करें और अपने अनुप्रयोगों में TTS.ai को ध्यान में रखते हुए शुरू करें.

मुक्त पर हस्ताक्षर करें प्लान्स देखें