APIపత్రరచన
మీ కార్యదర్శులకు TTSieని ఉద్భవింపచేయండి మా RSTAPI. ఓపెన్ అసంతృప్తి రూపం సులభంగా వలస కోసం.
సవరింపు
The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request/response bodies.
API కీ
మీ API కీని బయటకు పొందండి ఖాతా అమరికలు. ప్రొ అండ్ ఇండెక్స్ పథకాల్లో అందుబాటులో ఉంది.
మూల యూఆర్ఎల్
https://api.tts.ai/v1/
నిసాన్
ట్రాన్సియంట్ ద్వారా కర్రర్ (careder) సంకేతం Authorization ఎగువ సూచి
ధృవీకరణ
అన్ని API అభ్యర్ధనలకు థైనాకర్ ను ద్వారా ధృవీకరణ అవసరము Authorization ఎగువ సూచి.
Authorization: Bearer sk-tts-your-api-key-here
మూల యూఆర్ఎల్
ఈ మూల URLకు సంబంధించిన అన్ని ముగింపు పాయింట్లు. ఉదాహరణకు TTS ముగింపు పాయింట్:
రేటు పరిమితులు
API రేటు ప్రణాళిక ద్వారా భేదిస్తుంది:
| పథకం | అభ్యర్ధనలు/నిం | Concurrent | గరిష్ఠ వాచకం పొడవు |
|---|---|---|---|
| పధ్ధతి | 60 | 5 | 5,000 అక్షరములు |
| ఎన్లైట్బాక్స్Name | 300 | 20 | 50,000 అక్షరములు |
ప్రతి ప్రతిస్పందననందు రేట్ శీర్షికలు జతచేయబడినవి: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.
రుణాలు
| సేవ | విలువ | Unit |
|---|---|---|
| TTS (ఫ్రెడ్ మోడల్: Pyper, VITS, మెలోట్సిస్) | 1 పేరు | 1,000 అక్షరాలకు |
| TTS (సమావేశపు మోడల్లు: కోకోరో, కొసీవోసిస్ 2 [.]) | 2 మినాలు | 1,000 అక్షరాలకు |
| TTS (ప్రిమమ్ మోడల్లు: టోర్టోజెస్, చాటర్బాక్స్, మొదలైన) | 4 మెరీలు | 1,000 అక్షరాలకు |
| (w) వచనముకు మాట్లాడు | 2 మినాలు | ఆడియోకు ఒక నిమిషం |
| శబ్డం క్లుంకింగ్ | 4 మెరీలు | 1,000 అక్షరాలకు |
| ధ్వని మార్చునది | 3 మెరీలు | ఆడియోకు ఒక నిమిషం |
| ఆడియో అభివృద్ది | 2 మినాలు | ఆడియోకు ఒక నిమిషం |
| క్లోమం / స్టేజ్చేయడం | 3- 4 గుణములు | ఆడియోకు ఒక నిమిషం |
| (e) సంభాషణ అనువాదముName | 5 రుగుళ్లు | ఆడియోకు ఒక నిమిషం |
| ధ్వని చాట్ | 3 మెరీలు | ప్రతి స్పీచ్ |
| కీ (BPM శోధన) కనుగొనునది | ఖాళీ | -- |
| ఆడియో మార్పుకారి | ఖాళీ | -- |
మాట్లాడటానికి వచనం
పాఠ్యమును భాషా ఆడియోకు మార్చుము. అభ్యర్దించిన ఫార్మాట్లో ఆడియో ఫైల్ను తిరిగివుంచుతుంది.
అభ్యర్దించిన శరీరము
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| model | string | అవును | మోడల్ ID (ఉ. దా., |
| text | string | అవును | మాట్లాడుటకు వచనమును మార్చు (పోర్టు కొరకు 78 5,000 అక్షరాలు, 50,000 అక్షరాలు) |
| voice | string | అవును | నంబర్ ఐడి (అంటే ) |
| format | string | వద్దు | అవుట్పుట్ ఫార్మేట్: |
| speed | float | వద్దు | వేగం అధికం చేయుచున్నది. అప్రమేయం: >> < |
| language | string | వద్దు | భాష కోడ్ (ఉ. దా., , < కోడ్>). వదిలివేయబడినట్లైతే స్వయంచాలక-వేడించబడుతుంది. |
| stream | boolean | వద్దు | స్ట్రీమ్ స్పందనను చేతనముచేయుము. అప్రమేయం: |
ఉదాహరణలు అభ్యర్ధన
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"text": "Hello from TTS.ai! This is a test.",
"voice": "af_bella",
"format": "mp3"
}' \
--output output.mp3
స్పందన
Returns the audio file as binary data with appropriate Content-Type header (audio/mpeg, audio/wav, etc.).
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498
(w) వచనముకు మాట్లాడు
ఆడియోను పాఠ్యానికి పంపుము. స్వయంచాలక- డిక్లరేషన్ తో 99 భాషలకు మద్దతిస్తుంది.
అభ్యర్దించిన శరీరము (multipart/form-data)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| file | file | అవును | ఆడియో ఫైల్ (MP3, WAV, OGG, MGA, MP4, వెబ్సైట్. Mac 100MB) |
| model | string | వద్దు | STD మోడల్: |
| language | string | వద్దు | భాష కోడ్. <కోడ్> യാന്ത്രിക-దిశాంశం (అప్రమేయంగా) కోసం |
| timestamps | boolean | వద్దు | పదము- స్థాయి సమయాలను జోడించు. అప్రమేయం: |
| diarize | boolean | వద్దు | స్పీకర్ డిజైన్ను చేతనముచేయుము. అప్రమేయం: |
స్పందన
{
"text": "Hello, this is a transcription test.",
"language": "en",
"duration": 3.5,
"segments": [
{
"start": 0.0,
"end": 1.8,
"text": "Hello, this is",
"speaker": "SPEAKER_00"
},
{
"start": 1.8,
"end": 3.5,
"text": "a transcription test.",
"speaker": "SPEAKER_00"
}
]
}
శబ్డం క్లుంకింగ్
రిఫరెన్స్ వాయిడ్ ధ్వనిలో భాషను తయారుచేయి. రిఫరెన్స్ ఆడియో మరియు వచనమును తిరిగిలోడు చేయుము.
అభ్యర్దించిన శరీరము (multipart/form-data)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| reference_audio | file | అవును | రిఫరెన్స్ ఆడియో 10-30 సెకనుల సిఫార్సు చేసింది. మాక్స్ 20MB. |
| text | string | అవును | క్లోన్ వాయిస్ లో మాట్లాడటానికి వచనము. |
| model | string | వద్దు | క్లోన్ మోడల్: |
| format | string | వద్దు | అవుట్పుట్ ఫార్మేట్: |
| language | string | వద్దు | లక్ష్యపు భాష కోడ్. ఎంచుకొన్న మోడల్ తో మద్దతీయబడాలి. |
స్పందన
ఆడియో ఫైల్ను TTS ముగింపు పాయింట్ వంటి, ద్విముఖ డాటా వలె తిరిగివుంచుతుంది.
ధ్వని మార్చునది
ఆడియోను వేరొక శబ్దమువలె మారుము. మూల ఆడియోను లోడుచేసి లక్ష్యపు శబ్దమును యెంపికచేయుము.
అభ్యర్దించిన శరీరము (multipart/form-data)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| file | file | అవును | సోర్స్ ఆడియో ఫైల్ (MP3, WAV, FLAC) మాస్ 50MB. |
| target_voice | string | అవును | టాగ్సు ID (అవుట్ వాయిస్లను జాబితాకు బదిలీ చేయించుటకు |
| model | string | వద్దు | మెళకువ మోడల్: |
| format | string | వద్దు | అవుట్పుట్ ఫార్మాట్: |
ఉదాహరణలు అభ్యర్ధన
curl -X POST https://api.tts.ai/v1/voice-convert/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@source_audio.mp3" \
-F "target_voice=af_bella" \
-F "model=openvoice" \
-o converted.wav
స్పందన
మార్చబడిన ఆడియో ఫైల్ను ద్విముఖ డాటాగా తిరిగివుంచుతుంది.
(e) సంభాషణ అనువాదముName
ఒక భాష నుండి మరో దానికి ఆడియోను అనువదించండి. ఒకే కాల్లో పదాలు, పదాలు, అనువాదము, మరియు పాఠ్యము- నుండి పదాలు అనువదించడానికి కాంబెన్లు.
అభ్యర్దించిన శరీరము (multipart/form-data)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| file | file | అవును | అసలు భాషలోని మూల ఆడియో ఫైల్. మాస్ 100MB. |
| target_language | string | అవును | లక్ష్యపు భాష కోడ్ (e.g., |
| voice | string | వద్దు | అనువదించిన అవుట్పుట్కు ఆబ్జక్టు. విడిచినట్లైతే స్వయంచాలక- ఎంపికచేయు. |
| preserve_voice | boolean | వద్దు | తొలి ప్రసంగీకుని కోసం ప్రయత్నించడం |
స్పందన
{
"original_text": "Hello, how are you?",
"translated_text": "Hola, como estas?",
"source_language": "en",
"target_language": "es",
"audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
"credits_used": 5
}
మాట్లాడేటప్పుడు
ఆంతరంగిక సంభాషణా శైలిని, భావావేశాన్ని, పోషణను మార్చండి.
అభ్యర్దించిన శరీరము (multipart/form-data)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| file | file | అవును | సోర్స్ ఆడియో ఫైల్. మాస్ 50MB |
| voice | string | అవును | అవుట్పుట్ పదమునకు టార్గెట్ వర్డ్ స్వరము ఐడి |
| model | string | వద్దు | మోడల్: |
| emotion | string | వద్దు | లక్ష్యము: |
| speed | float | వద్దు | వేగము సవరించబడింది. అప్రమేయ: > < |
స్పందన
మార్చబడిన ఆడియో ఫైల్ను ద్విముఖ డాటాగా తిరిగివుంచుతుంది.
ఆడియో పనిముట్లు
ఆ తర్వాత, వాటి ట్యూబ్లు తెరుచుకుని, ఆ తర్వాత ఆ తర్వాత వాటిపై దాడి చేయడం ప్రారంభిస్తాయి.
ఆడియో నాణ్యతను మెరుగుపరుచుము: డినోజెజ్, స్పష్టత, సూపర్వైజ్ రెజొల్యూషన్ను మెరుగుపరుచుము.
| file file | పెద్దదిచేయుటకు ఆడియో ఫైల్ |
| denoise boolean | రౌలానింగ్ను చేతనముచేయుము (అప్రమేయ: సత్యం) |
| enhance_clarity boolean | పెద్దదిచేసిన పద స్పష్టము (default: rue) |
| super_resolution boolean | పైకి పెద్దదిచేసిన ఆడియో నాణ్యత ( అప్రమేయ: తప్పు) |
| strength integer | 1- 3 (వెలుగు, మధ్యలో, బలమైన). అప్రమేయ: 2 |
ఆ యంత్రాలు (ప్రత్యేకత తీసివేయబడిన) నుండి విడివిడిగా పాడండి లేదా roots (విరమించడం) roots (విరమించడం) లోకి విడగొట్టండి.
| file file | విడగొట్టుటకు ఆడియో ఫైల్ |
| model string | demucs (అప్రమెయం) లేదా spleeter |
| stems integer | మూలాల సంఖ్య: 2, 4, 5, 6 ( అప్రమేయం: 2) |
| format string | అవుట్పుట్ ఫార్మాట్: |
ఆడియో రికార్డింగుల నుండి ఓవర్రైడ్ మరియు reverbను తీసివేయండి.
| file file | ప్రాసెస్ చేయుటకు ఆడియో దస్త్రము |
| type string | echo or reverb (default: both) |
| intensity integer | 1-5 (default: 3) |
కీ, BPM, మరియు సమయ సంతకంను శోధించుటకు ఆడియోను విశ్లేషించుము.
| file file | Audio file to analyze |
{
"key": "C",
"scale": "Major",
"bpm": 120.0,
"time_signature": "4/4",
"camelot": "8B",
"compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
ఫార్మాట్ల మధ్య ఆడియోను మార్చుము
| file file | మార్చుటకు ఆడియో ఫైల్ను |
| format string | లక్ష్యం: , |
| bitrate integer | అవుట్పుట్ బిట్రేట్: 64, 128, 192, 256,320 లో |
| sample_rate integer | మాదిరి రేటు: 22050, 44100, 48000 |
| channels string | mono లేదా stereo |
ధ్వని చాట్
ఆడియో లేదా పాఠ్యమును పంపించి అభ్యర్ధమైన సంభాషణతో AI ప్రతిస్పందనను పొందుము.
అభ్యర్దించిన శరీరము (multipart/form-data లేదా JSON)
| పెరామీటరు | రకము | అవసరం | విశదీకరణము |
|---|---|---|---|
| audio | file | వద్దు* | ఆడియో ఇన్పుట్ (పరుడుకు |
| text | string | వద్దు* | వాచకం ఇన్పుట్ (టీఫ్ |
| voice | string | వద్దు | AI స్పందన కొరకు శబ్దము. అప్రమేయ: |
| tts_model | string | వద్దు | సమాధానం కొరకు TTS మోడల్. అప్రమేయ: |
| system_prompt | string | వద్దు | నిర్దేశిత వ్యవస్థ AI కు ప్రాధాన్యాన్నిస్తుంది |
| conversation_id | string | వద్దు | ప్రస్తుతం వున్న సంభాషణ కొనసాగించుము |
స్పందన
{
"conversation_id": "conv_abc123",
"user_text": "What is the capital of France?",
"ai_text": "The capital of France is Paris.",
"audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
"credits_used": 3
}
జాబితా మోడల్లు
అందుబాటులో వున్న మోడల్సు జాబితాను వాటి సామర్ధ్యములతో తిరిగివుంచుము
స్పందన
{
"models": [
{
"id": "kokoro",
"name": "Kokoro",
"type": "tts",
"tier": "standard",
"languages": ["en", "ja", "ko", "zh", "fr"],
"supports_cloning": false,
"supports_streaming": true,
"credits_per_1k_chars": 2
},
{
"id": "chatterbox",
"name": "Chatterbox",
"type": "tts",
"tier": "premium",
"languages": ["en"],
"supports_cloning": true,
"supports_streaming": true,
"credits_per_1k_chars": 4
}
]
}
జాబితా శబ్ధముల జాబితా
అందుబాటులో వున్న అన్ని స్వరాల జాబితాను తిరిగివుంచుము, ఐచ్చికంగా మోడల్ ద్వారా లేదా భాష ద్వారా నవీకరించబడినవి.
ప్రశ్న పారామితులు
| పెరామీటరు | రకము | విశదీకరణము |
|---|---|---|
| model | string | నమూనా ఐడి ద్వారా ఫిల్టర్ (ఉ. దా., |
| language | string | భాష కోడ్నుండి ఫిల్టర్ను వడపోయుము (ఉ. దా., |
| gender | string | లిపి ద్వారా ఫిల్టర్: |
స్పందన
{
"voices": [
{
"id": "af_bella",
"name": "Bella",
"model": "kokoro",
"language": "en",
"gender": "female",
"preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
}
],
"total": 142
}
కోడ్ ఉదాహరణలు
మాట్లాడటానికి వచనం
import requests
API_KEY = "sk-tts-your-key"
# Text to Speech
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
"format": "mp3"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
print(f"Credits used: {response.headers.get('X-Credits-Used')}")
(w) వచనముకు మాట్లాడు
# Speech to Text
with open("recording.mp3", "rb") as f:
response = requests.post(
"https://api.tts.ai/v1/stt/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"file": f},
data={"model": "faster-whisper", "timestamps": "true"}
)
result = response.json()
print(result["text"])
శబ్డం క్లుంకింగ్
# Voice Cloning
with open("reference.wav", "rb") as ref:
response = requests.post(
"https://api.tts.ai/v1/tts/clone/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"reference_audio": ref},
data={
"text": "This speech uses a cloned voice.",
"model": "chatterbox"
}
)
with open("cloned_output.mp3", "wb") as f:
f.write(response.content)
మాట్లాడటానికి వచనం
const API_KEY = 'sk-tts-your-key';
// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
method: 'POST',
headers: {
'Authorization': `Bearer ${API_KEY}`,
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'kokoro',
text: 'Hello from TTS.ai!',
voice: 'af_bella',
format: 'mp3'
})
});
const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();
(w) వచనముకు మాట్లాడు
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');
const response = await fetch('https://api.tts.ai/v1/stt/', {
method: 'POST',
headers: { 'Authorization': `Bearer ${API_KEY}` },
body: formData
});
const result = await response.json();
console.log(result.text);
మాట్లాడటానికి వచనం
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
-o output.mp3
(w) వచనముకు మాట్లాడు
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@recording.mp3" \
-F "model=faster-whisper" \
-F "timestamps=true"
శబ్డం క్లుంకింగ్
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "reference_audio=@reference.wav" \
-F "text=This uses a cloned voice." \
-F "model=chatterbox" \
-o cloned.mp3
ఆడియో అభివృద్ది
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@noisy_audio.mp3" \
-F "denoise=true" \
-F "enhance_clarity=true" \
-o enhanced.mp3
దోషము కూర్పులు
అన్ని దోషములు Jone సమాధానంతో తిరిగివుంచబడతాయి error ఫీల్.
{
"error": {
"code": "insufficient_credits",
"message": "You do not have enough credits for this request.",
"credits_required": 4,
"credits_available": 2
}
}
| హెచ్ టిటిపి స్థితి | Error Code | విశదీకరణము |
|---|---|---|
| 400 | bad_request |
చెల్లని అభ్యర్ధన పారామితి. వివరముల కొరకు దోషము సందేశమును పరిశీలించుము. |
| 401 | unauthorized |
API కీ తప్పిపోయింది లేదా చెల్లనిది. |
| 402 | insufficient_credits |
సరిపడే రుణాలు కావు. / pricting / నందు మరింత కొనుగోలు చేయండి. |
| 403 | forbidden |
మీ ప్రణాళికనందు API యాక్సెస్ అందుబాటులో లేదు. |
| 404 | not_found |
మోడల్ లేదా స్వరం దొరకలేదు. |
| 413 | file_too_large |
ఎక్కించిన ఫైల్ పరిమాణము గరిష్టం అయింది. |
| 429 | rate_limited |
చాలా ఎక్కువ అభ్యర్ధనలు. రేటు పరిమితి శీర్షికలను పరిశీలించుము. |
| 500 | internal_error |
సెర్వర్ దోషం. తరువాత మళ్ళీ ప్రయత్నించండి. |
| 503 | model_loading |
మోడల్ లోడవుతోంది. కొన్ని సెకన్లలో తిరిగి ప్రయత్నించు. |
వెబ్ టాగ్స్Comment
ఎక్కువ నిగూఢమైన కర్తవ్యాలు (స్కోడ్ విభజన, Carbed TTS), మీరు
{
"event": "task.completed",
"task_id": "task_abc123",
"status": "success",
"result_url": "https://api.tts.ai/v1/results/task_abc123",
"credits_used": 12,
"created_at": "2025-01-15T10:30:00Z",
"completed_at": "2025-01-15T10:30:45Z"
}
నిర్మాణం రెడీ?
మీ కార్యక్షేత్రాలు లోకి API కీ పొందండి మరియు మీ దరఖాస్తుల లో TTS STS కీ ప్రారంభించండి.