APIపత్రరచన

మీ కార్యదర్శులకు TTSieని ఉద్భవింపచేయండి మా RSTAPI. ఓపెన్ అసంతృప్తి రూపం సులభంగా వలస కోసం.

పరీక్షా యంత్రాల ఓపెన్ ఏసియాName జోసన్ ప్రతిస్పందనలు స్ట్రీమింగ్ మద్దతు

సవరింపు

The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request/response bodies.

API కీ

మీ API కీని బయటకు పొందండి ఖాతా అమరికలు. ప్రొ అండ్‌ ఇండెక్స్ పథకాల్లో అందుబాటులో ఉంది.

మూల యూఆర్ఎల్

https://api.tts.ai/v1/

నిసాన్

ట్రాన్సియంట్ ద్వారా కర్రర్ (careder) సంకేతం Authorization ఎగువ సూచి

ధృవీకరణ

అన్ని API అభ్యర్ధనలకు థైనాకర్ ను ద్వారా ధృవీకరణ అవసరము Authorization ఎగువ సూచి.

హెచ్ టిటిపి హెడర్
Authorization: Bearer sk-tts-your-api-key-here
మీ API కీ రహస్య ఉంచండి. మీ ఖాతా అమరికలనుండి క్రమంగా కీలను తిప్పివుంచుము.

మూల యూఆర్ఎల్

మూల యూఆర్ఎల్: https://api.tts.ai/v1/

ఈ మూల URLకు సంబంధించిన అన్ని ముగింపు పాయింట్లు. ఉదాహరణకు TTS ముగింపు పాయింట్:

POST https://api.tts.ai/v1/tts/

రేటు పరిమితులు

API రేటు ప్రణాళిక ద్వారా భేదిస్తుంది:

పథకం అభ్యర్ధనలు/నిం Concurrent గరిష్ఠ వాచకం పొడవు
పధ్ధతి 60 5 5,000 అక్షరములు
ఎన్‌లైట్‌బాక్‍స్Name 300 20 50,000 అక్షరములు

ప్రతి ప్రతిస్పందననందు రేట్ శీర్షికలు జతచేయబడినవి: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

రుణాలు

సేవ విలువ Unit
TTS (ఫ్రెడ్ మోడల్‌: Pyper, VITS, మెలోట్సిస్) 1 పేరు 1,000 అక్షరాలకు
TTS (సమావేశపు మోడల్‌లు: కోకోరో, కొసీవోసిస్ 2 [.]) 2 మినాలు 1,000 అక్షరాలకు
TTS (ప్రిమమ్ మోడల్లు: టోర్టోజెస్, చాటర్బాక్స్, మొదలైన) 4 మెరీలు 1,000 అక్షరాలకు
(w) వచనముకు మాట్లాడు 2 మినాలు ఆడియోకు ఒక నిమిషం
శబ్డం క్లుంకింగ్ 4 మెరీలు 1,000 అక్షరాలకు
ధ్వని మార్చునది 3 మెరీలు ఆడియోకు ఒక నిమిషం
ఆడియో అభివృద్ది 2 మినాలు ఆడియోకు ఒక నిమిషం
క్లోమం / స్టేజ్‌చేయడం 3- 4 గుణములు ఆడియోకు ఒక నిమిషం
(e) సంభాషణ అనువాదముName 5 రుగుళ్లు ఆడియోకు ఒక నిమిషం
ధ్వని చాట్ 3 మెరీలు ప్రతి స్పీచ్
కీ (BPM శోధన) కనుగొనునది ఖాళీ --
ఆడియో మార్పుకారి ఖాళీ --

మాట్లాడటానికి వచనం

POST /v1/tts/

పాఠ్యమును భాషా ఆడియోకు మార్చుము. అభ్యర్దించిన ఫార్మాట్‌లో ఆడియో ఫైల్‌ను తిరిగివుంచుతుంది.

అభ్యర్దించిన శరీరము

పెరామీటరురకముఅవసరంవిశదీకరణము
model string అవును మోడల్ ID (ఉ. దా., కోడ్ , > బాక్స్‌,
text string అవును మాట్లాడుటకు వచనమును మార్చు (పోర్టు కొరకు 78 5,000 అక్షరాలు, 50,000 అక్షరాలు)
voice string అవును నంబర్ ఐడి (అంటే /v1/sumber/)
format string వద్దు అవుట్‌పుట్ ఫార్మేట్: ( అప్రమేయం), , >, ,
speed float వద్దు వేగం అధికం చేయుచున్నది. అప్రమేయం: .0. పరిధి: > > <>> <>>
language string వద్దు భాష కోడ్ (ఉ. దా., , , < కోడ్>). వదిలివేయబడినట్లైతే స్వయంచాలక-వేడించబడుతుంది.
stream boolean వద్దు స్ట్రీమ్ స్పందనను చేతనముచేయుము. అప్రమేయం:

ఉదాహరణలు అభ్యర్ధన

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

స్పందన

Returns the audio file as binary data with appropriate Content-Type header (audio/mpeg, audio/wav, etc.).

(e) స్పందన హెడర్లు
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498

(w) వచనముకు మాట్లాడు

POST /v1/stt/

ఆడియోను పాఠ్యానికి పంపుము. స్వయంచాలక- డిక్లరేషన్ తో 99 భాషలకు మద్దతిస్తుంది.

అభ్యర్దించిన శరీరము (multipart/form-data)

పెరామీటరురకముఅవసరంవిశదీకరణము
file file అవును ఆడియో ఫైల్ (MP3, WAV, OGG, MGA, MP4, వెబ్‌సైట్. Mac 100MB)
model string వద్దు STD మోడల్: (default), ,
language string వద్దు భాష కోడ్. <కోడ్> യാന്ത്രിക-దిశాంశం (అప్రమేయంగా) కోసం >.
timestamps boolean వద్దు పదము- స్థాయి సమయాలను జోడించు. అప్రమేయం:
diarize boolean వద్దు స్పీకర్ డిజైన్‌ను చేతనముచేయుము. అప్రమేయం:

స్పందన

Jone సమాధానం
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

శబ్డం క్లుంకింగ్

POST /v1/tts/clone/

రిఫరెన్స్ వాయిడ్ ధ్వనిలో భాషను తయారుచేయి. రిఫరెన్స్ ఆడియో మరియు వచనమును తిరిగిలోడు చేయుము.

అభ్యర్దించిన శరీరము (multipart/form-data)

పెరామీటరురకముఅవసరంవిశదీకరణము
reference_audio file అవును రిఫరెన్స్ ఆడియో 10-30 సెకనుల సిఫార్సు చేసింది. మాక్స్ 20MB.
text string అవును క్లోన్ వాయిస్ లో మాట్లాడటానికి వచనము.
model string వద్దు క్లోన్ మోడల్: chatk> (default), ,
format string వద్దు అవుట్‌పుట్ ఫార్మేట్: ( అప్రమేయం), , >, /nick>
language string వద్దు లక్ష్యపు భాష కోడ్. ఎంచుకొన్న మోడల్ తో మద్దతీయబడాలి.

స్పందన

ఆడియో ఫైల్‌ను TTS ముగింపు పాయింట్ వంటి, ద్విముఖ డాటా వలె తిరిగివుంచుతుంది.

ధ్వని మార్చునది

POST /v1/voice-convert/

ఆడియోను వేరొక శబ్దమువలె మారుము. మూల ఆడియోను లోడుచేసి లక్ష్యపు శబ్దమును యెంపికచేయుము.

అభ్యర్దించిన శరీరము (multipart/form-data)

పెరామీటరురకముఅవసరంవిశదీకరణము
file file అవును సోర్స్ ఆడియో ఫైల్ (MP3, WAV, FLAC) మాస్ 50MB.
target_voice string అవును టాగ్సు ID (అవుట్ వాయిస్‌లను జాబితాకు బదిలీ చేయించుటకు /v1/rues/ను వుపయోగించుము)
model string వద్దు మెళకువ మోడల్: పాదిరీ ( అప్రమేయం),
format string వద్దు అవుట్‌పుట్ ఫార్మాట్: (default), , /nick>

ఉదాహరణలు అభ్యర్ధన

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

స్పందన

మార్చబడిన ఆడియో ఫైల్‌ను ద్విముఖ డాటాగా తిరిగివుంచుతుంది.

(e) సంభాషణ అనువాదముName

POST /v1/speech-translate/

ఒక భాష నుండి మరో దానికి ఆడియోను అనువదించండి. ఒకే కాల్‌లో పదాలు, పదాలు, అనువాదము, మరియు పాఠ్యము- నుండి పదాలు అనువదించడానికి కాంబెన్లు.

అభ్యర్దించిన శరీరము (multipart/form-data)

పెరామీటరురకముఅవసరంవిశదీకరణము
file file అవును అసలు భాషలోని మూల ఆడియో ఫైల్. మాస్ 100MB.
target_language string అవును లక్ష్యపు భాష కోడ్ (e.g., , , , ,
voice string వద్దు అనువదించిన అవుట్పుట్‌కు ఆబ్జక్టు. విడిచినట్లైతే స్వయంచాలక- ఎంపికచేయు.
preserve_voice boolean వద్దు తొలి ప్రసంగీకుని కోసం ప్రయత్నించడం

స్పందన

Jone సమాధానం
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

మాట్లాడేటప్పుడు

POST /v1/speech-to-speech/

ఆంతరంగిక సంభాషణా శైలిని, భావావేశాన్ని, పోషణను మార్చండి.

అభ్యర్దించిన శరీరము (multipart/form-data)

పెరామీటరురకముఅవసరంవిశదీకరణము
file file అవును సోర్స్ ఆడియో ఫైల్. మాస్ 50MB
voice string అవును అవుట్పుట్ పదమునకు టార్గెట్ వర్డ్ స్వరము ఐడి
model string వద్దు మోడల్: OpenPread (default), <కోడ్chatork>
emotion string వద్దు లక్ష్యము: , , , > , < కోడ్ ,
speed float వద్దు వేగము సవరించబడింది. అప్రమేయ: 1.0. పరిధి: > > <> <>

స్పందన

మార్చబడిన ఆడియో ఫైల్‌ను ద్విముఖ డాటాగా తిరిగివుంచుతుంది.

ఆడియో పనిముట్లు

ఆ తర్వాత, వాటి ట్యూబ్‌లు తెరుచుకుని, ఆ తర్వాత ఆ తర్వాత వాటిపై దాడి చేయడం ప్రారంభిస్తాయి.

POST /v1/audio/enhance/

ఆడియో నాణ్యతను మెరుగుపరుచుము: డినోజెజ్, స్పష్టత, సూపర్‌వైజ్ రెజొల్యూషన్‌ను మెరుగుపరుచుము.

file fileపెద్దదిచేయుటకు ఆడియో ఫైల్
denoise booleanరౌలానింగ్‌ను చేతనముచేయుము (అప్రమేయ: సత్యం)
enhance_clarity booleanపెద్దదిచేసిన పద స్పష్టము (default: rue)
super_resolution booleanపైకి పెద్దదిచేసిన ఆడియో నాణ్యత ( అప్రమేయ: తప్పు)
strength integer1- 3 (వెలుగు, మధ్యలో, బలమైన). అప్రమేయ: 2
POST /v1/audio/separate/

ఆ యంత్రాలు (ప్రత్యేకత తీసివేయబడిన) నుండి విడివిడిగా పాడండి లేదా roots (విరమించడం) roots (విరమించడం) లోకి విడగొట్టండి.

file fileవిడగొట్టుటకు ఆడియో ఫైల్‌
model stringdemucs (అప్రమెయం) లేదా spleeter
stems integerమూలాల సంఖ్య: 2, 4, 5, 6 ( అప్రమేయం: 2)
format stringఅవుట్‌పుట్ ఫార్మాట్: / కోడ్>, , >,
POST /v1/audio/dereverb/

ఆడియో రికార్డింగుల నుండి ఓవర్‌రైడ్ మరియు reverbను తీసివేయండి.

file fileప్రాసెస్ చేయుటకు ఆడియో దస్త్రము
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ ఖాళీ

కీ, BPM, మరియు సమయ సంతకంను శోధించుటకు ఆడియోను విశ్లేషించుము.

file fileAudio file to analyze
స్పందన
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ ఖాళీ

ఫార్మాట్ల మధ్య ఆడియోను మార్చుము

file fileమార్చుటకు ఆడియో ఫైల్‌ను
format stringలక్ష్యం: /కోడ్> , , >, > , , , ,
bitrate integerఅవుట్‌పుట్‌ బిట్‌రేట్: 64, 128, 192, 256,320 లో
sample_rate integerమాదిరి రేటు: 22050, 44100, 48000
channels stringmono లేదా stereo

ధ్వని చాట్

POST /v1/voice-chat/

ఆడియో లేదా పాఠ్యమును పంపించి అభ్యర్ధమైన సంభాషణతో AI ప్రతిస్పందనను పొందుము.

అభ్యర్దించిన శరీరము (multipart/form-data లేదా JSON)

పెరామీటరురకముఅవసరంవిశదీకరణము
audio file వద్దు* ఆడియో ఇన్పుట్ (పరుడుకు లేదా లేదా < కోడ్> కావలసి ఉంటుంది)
text string వద్దు* వాచకం ఇన్పుట్ (టీఫ్ లేదా < కోడ్ స్ట్రీమ్> కావలసివుంటుంది)
voice string వద్దు AI స్పందన కొరకు శబ్దము. అప్రమేయ:
tts_model string వద్దు సమాధానం కొరకు TTS మోడల్. అప్రమేయ:
system_prompt string వద్దు నిర్దేశిత వ్యవస్థ AI కు ప్రాధాన్యాన్నిస్తుంది
conversation_id string వద్దు ప్రస్తుతం వున్న సంభాషణ కొనసాగించుము

స్పందన

Jone సమాధానం
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

జాబితా మోడల్‌లు

GET /v1/models/

అందుబాటులో వున్న మోడల్సు జాబితాను వాటి సామర్ధ్యములతో తిరిగివుంచుము

స్పందన

Jone సమాధానం
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

జాబితా శబ్ధముల జాబితా

GET /v1/voices/

అందుబాటులో వున్న అన్ని స్వరాల జాబితాను తిరిగివుంచుము, ఐచ్చికంగా మోడల్ ద్వారా లేదా భాష ద్వారా నవీకరించబడినవి.

ప్రశ్న పారామితులు

పెరామీటరురకమువిశదీకరణము
model string నమూనా ఐడి ద్వారా ఫిల్టర్ (ఉ. దా., )
language string భాష కోడ్‌నుండి ఫిల్టర్‌ను వడపోయుము (ఉ. దా., )
gender string లిపి ద్వారా ఫిల్టర్: , < కోడ్>>, , ,

స్పందన

Jone సమాధానం
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

కోడ్ ఉదాహరణలు

మాట్లాడటానికి వచనం

Python - requests
import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

(w) వచనముకు మాట్లాడు

Python - requests
# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

శబ్డం క్లుంకింగ్

Python - requests
# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

మాట్లాడటానికి వచనం

JavaScript - fetch
const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

(w) వచనముకు మాట్లాడు

JavaScript - fetch
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

మాట్లాడటానికి వచనం

cURL
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

(w) వచనముకు మాట్లాడు

cURL
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

శబ్డం క్లుంకింగ్

cURL
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

ఆడియో అభివృద్ది

cURL
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

దోషము కూర్పులు

అన్ని దోషములు Jone సమాధానంతో తిరిగివుంచబడతాయి error ఫీల్.

దోషము ప్రతిస్పందన ఫార్మేట్
{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough credits for this request.",
    "credits_required": 4,
    "credits_available": 2
  }
}
హెచ్ టిటిపి స్థితిError Codeవిశదీకరణము
400 bad_request చెల్లని అభ్యర్ధన పారామితి. వివరముల కొరకు దోషము సందేశమును పరిశీలించుము.
401 unauthorized API కీ తప్పిపోయింది లేదా చెల్లనిది.
402 insufficient_credits సరిపడే రుణాలు కావు. / pricting / నందు మరింత కొనుగోలు చేయండి.
403 forbidden మీ ప్రణాళికనందు API యాక్సెస్ అందుబాటులో లేదు.
404 not_found మోడల్ లేదా స్వరం దొరకలేదు.
413 file_too_large ఎక్కించిన ఫైల్ పరిమాణము గరిష్టం అయింది.
429 rate_limited చాలా ఎక్కువ అభ్యర్ధనలు. రేటు పరిమితి శీర్షికలను పరిశీలించుము.
500 internal_error సెర్వర్ దోషం. తరువాత మళ్ళీ ప్రయత్నించండి.
503 model_loading మోడల్ లోడవుతోంది. కొన్ని సెకన్లలో తిరిగి ప్రయత్నించు.

వెబ్ టాగ్స్Comment

ఎక్కువ నిగూఢమైన కర్తవ్యాలు (స్కోడ్ విభజన, Carbed TTS), మీరు వర్తిస్తాయి. కర్తవ్యము ముగుస్తుండగా, మేము మీ URL‌కు వెలుపలివేస్తాము.

వెబ్ ట్యూబ్ చెల్లింపు లోడ్
{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}
Webhook results are available for download for 24 hours after completion. Make sure to download them promptly.

నిర్మాణం రెడీ?

మీ కార్యక్షేత్రాలు లోకి API కీ పొందండి మరియు మీ దరఖాస్తుల లో TTS STS కీ ప్రారంభించండి.