എപിഐ സഹായക്കുറിപ്പുകള്
നിങ്ങളുടെ അപേക്ഷകളില് TTS.ai പേരെ, ഞങ്ങളുടെ റെസ്റ്റ് API-ല് ചേര്ത്ത് നിര്ത്തുക. എളുപ്പത്തില് കുടിയേറാന്.
പരിശോധിയ്ക്കുക
TTS.ai API പ്രോഗ്രാം എല്ലാ പ്ലാറ്റ്ഫോമിലുള്ള മണ്ഡലങ്ങളിലും സാങ്കേതികമായ പ്രവേശനം ലഭ്യമാക്കുന്നു: ലേഖന- വായനാ- വായനാ- ശബ്ദ- വാക്യം, ശബ്ദസംഭരണി, ശബ്ദത്തിന്റെ വര്ദ്ധന, ശബ്ദത്തിന്റെ കൂടുതല് വര്ദ്ധനവ്, കൂടുതല്. API ജോസണ്/ response commanages- ല് regrap settings.
API കീ
നിങ്ങളുടെ API കീ ഇവിടെ നിന്നും എടുക്കുക അക്കൌണ്ടിന്റെ സജ്ജീകരണങ്ങള്. പ്രൊ ആൻഡ് എൻസൈക്ലോപീഡിയ പദ്ധതികളിൽ ലഭ്യമാണ്.
അടിസ്ഥാന യുആര്എല്
https://api.tts.ai/v1/
അഥ്
ബീറ്റര് അടയാളം വഴി Authorization ഹെഡ്ഡര്
ആധികാരകത ഉറപ്പുവരുത്തല്
/v1/tts/ ഒരു ഔട്ട് ഇല്ലാതെ ജോലി ചെയ്യുക, ഒരു ഐപി/ഡേ വരെ 5,000 അക്ഷരങ്ങള്, നമ്മുടെ സ്വമേധയാ മോഡലുകള്, (piper, vits, melotts, kokoro). 15,000 ബോണസ് ക്യാരക്ടറുകളും മോണിറ്ററുകളും ലഭ്യമാകുന്നതിന് ഒരു സ്വതന്ത്ര അക്കൗണ്ട് അക്കൗണ്ട് എടുക്കുക.
മുന്കരുതല് മോഡ്യൂളുകള്ക്കും ഉയര്ന്ന നിരക്കുകള്ക്കും, ഒരു കരടിന് സൂചകം നല്കുന്ന സൂചകത്തില് ആധികാരികത ഉറപ്പാക്കുക Authorization ഹെഡ്ഡര്.
Authorization: Bearer sk-tts-your-api-key-here
എസ്ഡികെസ്Comment
ഔദ്യോഗിക SDKs നിങ്ങളുടെ പ്രയോഗത്തില് TTS.ai ലഭ്യമാക്കാന് എളുപ്പമാക്കുന്നു. രണ്ടും തുറന്ന ഉറവിടങ്ങളാണ്, ഗിറ്റ്ഹബ്-ല് ലഭ്യമാണ്.
Python
pip install ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
text="Hello world!",
model="kokoro"
)
client.save(audio, "output.wav")
JavaScript / Node.js
npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');
const client = new TTSClient({
apiKey: 'sk-tts-...'
});
const audio = await client.generate({
input: 'Hello world!',
model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
അടിസ്ഥാന യുആര്എല്
ഈ അടിസ്ഥാന യുആര്എല്ലിനോടുള്ള ബന്ധമാണു് എല്ലാ അവസാന പോയിന്റ്കളും. ഉദാഹരണമായി TTS അവസാനബിന്ദു:
പരിധികള്
പദ്ധതിയില് API നിരക്കില് വ്യത്യാസം ഉണ്ട്:
| പദ്ധതി | ആവശ്യങ്ങള്/നിവര്ത്തി | കോണ്സ്റ്റന്റ് | ഏറ്റവും കൂടിയ ടെക്സ്റ്റ് ദൈര്ഘ്യം |
|---|---|---|---|
| ഫ്രീ | 10 | 2 | 500 അക്ഷരങ്ങള് |
| ആരംഭകന് | 30 | 3 | 10 ലക്ഷം കിലോഗ്രാം |
| പ്രൊഫൈല് | 60 | 5 | 10 ലക്ഷം കിലോഗ്രാം |
| ഇന്റര്നാഷണല് | 300 | 20 | 50,000 അക്ഷരങ്ങള് |
എല്ലാ മറുപടിയിലും റേറ്റ് തലക്കെട്ടുകള് ഉള്ക്കൊള്ളുന്നു: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.
കടങ്ങൾ
| സേവനം | വില | യൂണിറ്റ് |
|---|---|---|
| ടിടിഎസ് (ഫ്രീ മോഡല്: Pyper, VITS, മെലോട്ടിക്സ്) | 1,000 അക്ഷരങ്ങള് | 1,000 അക്ഷരങ്ങള്ക്കു് |
| ടിടിഎസ് (സാര്ഡ് മോഡല്: കോക്കോറോ, കൊസിവ്യൂസ് 2 [.]) | 2,000 അക്ഷരങ്ങള് | 1,000 അക്ഷരങ്ങള്ക്കു് |
| TTS (പെരിമിയം മോഡല്: ടോര്ട്ടോയിസ്, ചാറ്റര്ബോക്സ്, എന്നിവ.) | 4,000 അക്ഷരങ്ങള് | 1,000 അക്ഷരങ്ങള്ക്കു് |
| പദാവലിയുമായുള്ള സംസാരം | 2,000 അക്ഷരങ്ങള് | ഒരു മിനിറ്റ് ഓഡിയോയില് |
| ശബ്ദ ക്ളൈനിങ്ങ് | 4,000 അക്ഷരങ്ങള് | 1,000 അക്ഷരങ്ങള്ക്കു് |
| ശബ്ദം മാറ്റുന്നയാള് | 3,000 അക്ഷരങ്ങള് | ഒരു മിനിറ്റ് ഓഡിയോയില് |
| ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്Name | 2,000 അക്ഷരങ്ങള് | ഒരു മിനിറ്റ് ഓഡിയോയില് |
| വോള്ഡ്ലോഡ് / സ്റ്റാം വിരിയല് | 3,000- 3,000 അക്ഷരങ്ങള് | ഒരു മിനിറ്റ് ഓഡിയോയില് |
| സംസാരപരിഭാഷName | 5,000 അക്ഷരങ്ങള് | ഒരു മിനിറ്റ് ഓഡിയോയില് |
| ശബ്ദം സല്ലാപം | 3,000 അക്ഷരങ്ങള് | ഒരു ഊഴത്തില് |
| കീ & BPM തിരയല് | ഫ്രീ | -- |
| ശബ്ദമാറ്റംName | ഫ്രീ | -- |
സംസാരത്തിനുള്ള വാചകം
വാചകം സംസാരസഞ്ചയത്തിലേക്കു് മാറ്റുക. ആവശ്യപ്പെട്ട ഫയലില് ഓഡിയോ ഫയല് തിരിച്ചുവിടുന്നു.
അഭ്യര്ത്ഥനാ ശരീരം
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| model | string | ഇല്ല | മോഡല് ID (e.e., >>>> |
| text | string | അതെ | സംസാരത്തിലേക്കു് മാറ്റേണ്ട പദാവലി. പ്രൊ- റൈറ്റ് അപ്പ്: 500 അക്ഷരങ്ങള് (നമ്മള്), 5,000 അക്ഷരങ്ങള് (സ്വയമായ അക്കങ്ങള്), 10 ലക്ഷം (പൈഡ് പദ്ധതി). നീണ്ട ഇന്പുട്ടുകള് യാന്ത്രിക സര്വറിന്റെ ഭാഗമാണ്. |
| voice | string | അതെ | ശബ്ദത്തിന്റെ ഐഡി ( |
| format | string | ഇല്ല | ഔട്ട്പുട്ട് ഫോര്മാറ്റ്: |
| speed | float | ഇല്ല | വേഗത വര്ദ്ധിപ്പിക്കുന്നു. സ്വതവേയുള്ള: >> < |
| language | string | ഇല്ല | ഭാഷാ കോഡ് (e.g., |
| instructions | string | ഇല്ല | പ്രവര്ത്തിപ്പിക്കുന്ന/ റിലേഡ് ചെയ്യുന്ന ക്യുകള് (ടിആര്എല് അക്ഷരങ്ങള്). ഉദാ. |
| pronunciations | object | array | ഇല്ല | പ്രൊ- റിഗ്രഷന് ഉച്ചാരണം മുന്ഗണനകള്. അല്ലെങ്കില് |
| stream | boolean | ഇല്ല | സ്റ്റ്രീമിലെ മറുപടി പ്രവര്ത്തന സജ്ജമാക്കുക. സഹജമായി: |
ഉദാഹരണ അപേക്ഷ
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"text": "Hello from TTS.ai! This is a test.",
"voice": "af_bella",
"format": "mp3"
}' \
--output output.mp3
SSSML ടാഗുകള്
പൊതിക്കെട്ട് നമ്പര്, തീയതികള്, നാണയം, ഫോണ് നമ്പര്, അക്രോണിംകള് എന്നിവ
| അര്ത്ഥങ്ങള് | ഇന്പുട്ട് | എക്സിക്യൂട്ടിവ് പോലെ |
|---|---|---|
cardinal | 1234 | one thousand two hundred thirty-four |
ordinal | 21 | twenty-first |
date | 1999-12-31 | December thirty-first, nineteen ninety-nine |
time | 14:30 | two thirty PM |
telephone | +1-555-867-5309 | plus one five five five eight six seven… |
currency | $1,234.56 | one thousand two hundred thirty-four dollars and fifty-six cents |
spell-out | NASA | N A S A |
തീയതി ഫോര്മാറ്റ്
{
"model": "kokoro",
"voice": "af_bella",
"text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
മറുപടി
The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.
Step 1: Submit request
{
"uuid": "77b71db532874ce98e84a69a2d740d4c",
"job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
"status": "queued",
"credits_used": 11,
"credits_remaining": 15000
}
Step 2: Poll for result
Poll this endpoint every 1-2 seconds until status is completed or failed.
{
"status": "completed",
"result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
{
"status": "processing"
}
Step 3: Download audio
Fetch the result_url from the completed response to download the audio file.
Full example
import requests, time
API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"
# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]
# 2. Poll for result
while True:
result = requests.get(f"{BASE}/v1/speech/results/",
params={"uuid": uuid}).json()
if result["status"] == "completed":
# 3. Download audio
audio = requests.get(result["result_url"])
with open("output.mp3", "wb") as f:
f.write(audio.content)
break
elif result["status"] == "failed":
raise Exception(result.get("error", "Generation failed"))
time.sleep(1.5)
Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.
പദാവലിയുമായുള്ള സംസാരം
ഓഡിയോ ടെക്സ്റ്റിലേക്ക് പകര്ത്തുക. തനിയെയുള്ള 99 ഭാഷകള് പിന്തുണയ്ക്കുന്നു.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| file | file | അതെ | ഓഡിയോ ഫയല് (എംപി3, WAV, OGG, MGA, MP4, വെബ്M. Max 100MB) |
| model | string | ഇല്ല | STD മോഡ്: |
| language | string | ഇല്ല | ഭാഷാ കോഡ്. |
| timestamps | boolean | ഇല്ല | വാക്കുകളുടെ തലകെട്ടുകള് ഉള്പ്പെടുത്തുക. സ്വതവേയുള്ള: |
| diarize | boolean | ഇല്ല | സ്പര്ട്ടര് ഡയറേഷന് പ്രാവര്ത്തികമാക്കുക. സ്വതവേയുള്ള: |
മറുപടി
{
"text": "Hello, this is a transcription test.",
"language": "en",
"duration": 3.5,
"segments": [
{
"start": 0.0,
"end": 1.8,
"text": "Hello, this is",
"speaker": "SPEAKER_00"
},
{
"start": 1.8,
"end": 3.5,
"text": "a transcription test.",
"speaker": "SPEAKER_00"
}
]
}
ശബ്ദ ക്ളൈനിങ്ങ്
വിപരീത ശബ്ദത്തില് സംസാരം ഉണ്ടാക്കുക. ഒരു റിഫേഴ്സ് ഓഡിയോയും പദാവലിയും അപ്ലോഡ് ചെയ്യുക.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| reference_audio | file | അതെ | റഫറന്സ് ഓഡിയോ (10-30 സെക്കന്ഡുകള്) ശുപാര്ശ ചെയ്തു. മാക്സ് 20MB. |
| text | string | അതെ | ക്ലോണ്ഡ് ശബ്ദത്തില് സംസാരിക്കാന് ടെക്സ്റ്റ്. |
| model | string | ഇല്ല | ക്ലോണ് മോഡ്: |
| format | string | ഇല്ല | ഔട്ട്പുട്ട് ഫോര്മാറ്റ്: |
| language | string | ഇല്ല | ലക്ഷ്യഭാഷാ കോഡ്. തെരഞ്ഞെടുത്ത മോഡ് പിന്തുണയ്ക്കണം. |
മറുപടി
ശബ്ദ ഫയല് TTS അവസാന പോയിന്റ് പോലെ ബൈനറി ഡാറ്റയായി തിരിച്ചുവിടുന്നു.
ശബ്ദം മാറ്റുന്നയാള്
മറ്റൊരു ശബ്ദം പോലെ ഓഡിയോ ശബ്ദത്തിലേക്കു് ശബ്ദമുണ്ടാക്കുക. ശ്രോതസ്സ് ഓഡിയോ അപ്ഗ്രേഡ് ചെയ്തു് ലക്ഷ്യശബ്ദം തെരഞ്ഞെടുക്കുക.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| file | file | അതെ | സോഴ്സ് ഓഡിയോ ഫയല് (MP3, WAV, FLAC). മാക്സ് 50MB. |
| target_voice | string | അതെ | മാറ്റേണ്ട ലക്ഷ്യത്തിന്റെ ID ( |
| model | string | ഇല്ല | ശബ്ദം മാറ്റം വരുത്തല് മാതൃക: |
| format | string | ഇല്ല | ഔട്ട്പുട്ട് ഫോര്മാറ്റ്: /കോഡ് ചെയ്യുക |
ഉദാഹരണ അപേക്ഷ
curl -X POST https://api.tts.ai/v1/voice-convert/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@source_audio.mp3" \
-F "target_voice=af_bella" \
-F "model=openvoice" \
-o converted.wav
മറുപടി
മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല് ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.
സംസാരപരിഭാഷName
ഒരു ഭാഷയില് നിന്നും മറ്റൊരു ഭാഷയിലേക്കു് ശബ്ദമിശ്രണോപാധികള് പരിഭാഷപ്പെടുത്തുക. സംസാരം, പരിഭാഷ, പദാവലി എന്നിവ ഒരേ കോളില് ചേര്ക്കുക.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| file | file | അതെ | യഥാര്ത്ഥ ഭാഷയില് ഓഡിയോ ഫയല്. മാക്സ് 100എം.എം.എം. |
| target_language | string | അതെ | ലക്ഷ്യ ഭാഷാ കോഡ് (e.g., |
| voice | string | ഇല്ല | പരിഭാഷപ്പെടുത്തിയിരിക്കുന്ന ഔട്ട്പുട്ടിനുള്ള ശബ്ദം. വേണ്ടെങ്കില് സ്വയം തെരഞ്ഞെടുത്തതാണു്. |
| preserve_voice | boolean | ഇല്ല | യഥാര്ത്ഥ സ്പീക്കറിന്റെ ശബ്ദ വിശേഷതകള് സംരക്ഷിക്കുവാന് ശ്രമിക്കുന്നു. സ്വതവേയുള്ള: |
മറുപടി
{
"original_text": "Hello, how are you?",
"translated_text": "Hola, como estas?",
"source_language": "en",
"target_language": "es",
"audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
"credits_used": 5
}
സംസാരം
വസ്തുവകകൾ സൂക്ഷിക്കുമ്പോൾ സംസാരരീതി, വികാരങ്ങൾ, പ്രസവപ്പെടുത്തൽ എന്നിവ രൂപാന്തരപ്പെടുത്തുക.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| file | file | അതെ | സോഴ്സ് ഓഡിയോ ഫയല്. മാക്സ് 50MB |
| voice | string | അതെ | ഔട്ട്പുട്ട് സംസാരത്തിനുള്ള ലക്ഷ്യമായ ശബ്ദ ഐഡി |
| model | string | ഇല്ല | മോഡല്: |
| emotion | string | ഇല്ല | ലക്ഷ്യ: |
| speed | float | ഇല്ല | വേഗതയില് പൊരുത്തപ്പെടുത്തല്. സ്വതവേയുള്ള: > < |
മറുപടി
മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല് ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.
ഓഡിയോ ഉപകരണങ്ങള്
ശബ്ദത്തിന്റെ ഗുണമേന്മയ്ക്കു വേണ്ടിയുള്ള ഓഡിയോ അറ്റകുറ്റപ്പണികൾ, ശബ്ദനഷ്ടം, ബ്രിഡ്ജ്, ബ്രിഡ്ജ് വിച്ഛേദം എന്നിവയ്ക്കു വേണ്ടിയുള്ളവയാണ്.
ഓഡിയോ ഗുണമേന്മ മെച്ചപ്പെടുത്തുക: ഡീനോയിസ്, വ്യക്തമാക്കുക, സൂപ്പര് റെഡിഫ്യൂഷന് മെച്ചപ്പെടുത്തുക.
| file file | വര്ദ്ധിപ്പിക്കുന്നതിനായി ഓഡിയോ ഫയല് |
| denoise boolean | മറോയിസിങ്ങ് പ്രാവര്ത്തികമാക്കുക (സഹജമായി: ശരി) |
| enhance_clarity boolean | ലളിതമായ സംസാരം (സഹജം: ശരി) Name |
| super_resolution boolean | മുകളിലേക്ക് ഓഡിയോ ഗുണമേന്മ (സഹജം: തെറ്റ്) |
| strength integer | 1- 3 (വെളിച്ച, മാധ്യമത്തില്, ശക്തം). സഹജമായ: 2 |
എഞ്ചിനീയറുകളില് നിന്ന് (വലിയ നീക്കം) അല്ലെങ്കില് ഞെട്ടലായി പിളരുക.
| file file | വേര്പെടുത്തുന്നതിനായി ഓഡിയോ ഫയല് |
| model string | demucs (സഹജമായ) അല്ലെങ്കില് spleeter |
| stems integer | മൂലകങ്ങളുടെ എണ്ണം: 2, 4, 5, 6 (default: 2) |
| format string | ഔട്ട്പുട്ട് ഫോര്മാറ്റ്: |
ഓഡിയോ റെക്കോര്ഡുകളില് നിന്നും ആവര്ത്തിക്കുക.
| file file | പാകപ്പെടുത്താനുള്ള ഓഡിയോ ഫയല് |
| type string | echo or reverb (default: both) |
| intensity integer | 1-5 (default: 3) |
കീ, BPM, ടൈം ഒപ്പു് എന്നിവ കണ്ടുപിടിക്കുന്നതിനായി ഓഡിയോ വിവരങ്ങള് പരിശോധിയ്ക്കുക.
| file file | വിശകലനം ചെയ്യാനുള്ള ഓഡിയോ ഫയല് |
{
"key": "C",
"scale": "Major",
"bpm": 120.0,
"time_signature": "4/4",
"camelot": "8B",
"compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
ഓഡിയോ ഫോര്മാറ്റുകള് തമ്മില് മാറ്റുക.
| file file | മാറ്റേണ്ട ശബ്ദ ഫയല് |
| format string | ലക്ഷ്യക്രമം: , |
| bitrate integer | ഔട്ട്പുട്ട് ബിറ്റ്വെയര് kbsp: 64, 128, 192, 256, 320 |
| sample_rate integer | സാമ്പിളിന്റെ നിരക്ക്: 22050, 44100, 48000 |
| channels string | mono അല്ലെങ്കില് stereo |
ശബ്ദം സല്ലാപം
ഓഡിയോ അല്ലെങ്കില് പാഠങ്ങള് അയക്കുക. ശബ്ദസങ്കലമായ സംസാരത്താല് AI മറുപടി ലഭിക്കുന്നു.
അഭ്യര്ത്ഥനാ ശരീരം (multipart/form-data അല്ലെങ്കില് JSON)
| പരാമീറ്റര് | തരം | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|---|
| audio | file | ഇല്ല* | ഓഡിയോ ഇന്പുട്ട് (ഐച്ഛികമായി സിന്ക് ആവശ്യമുണ്ട്) |
| text | string | ഇല്ല* | വാചകത്തിനുള്ള ഇന്പുട്ട് (തെറ്റായത് |
| voice | string | ഇല്ല | AI മറുപടിയുടെ ശബ്ദം. സ്വതവേയുള്ള: |
| tts_model | string | ഇല്ല | മറുപടിയുടെ TTS മാതൃക. സ്വതവേയുള്ള: |
| system_prompt | string | ഇല്ല | ആവശ്യമുളള സിസ്റ്റം AI- നായി ആസൂത്രണം ചെയ്യുക |
| conversation_id | string | ഇല്ല | നിലവിലുള്ള ഒരു വര്ത്തമാനം തുടരുക |
മറുപടി
{
"conversation_id": "conv_abc123",
"user_text": "What is the capital of France?",
"ai_text": "The capital of France is Paris.",
"audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
"credits_used": 3
}
ട്രെഡിസ്
TTS തനത് തലമുറയ്ക്കായി അനവധി പാഠങ്ങള് സമര്പ്പിക്കുക. എല്ലാ ജോലികളും പൂര്ത്തിയാകുമ്പോള് ഒരു വെബ് കൊളുത്ത് ബാക്ക് സ്വീകരിക്കുക.
പരാമീറ്ററുകള്
| പരാമീറ്റര് | തരം | വിവരണം |
|---|---|---|
| texts | array | Array of objects: {text, model, voice}. Max 50 items. |
| webhook_url | string | Optional URL to POST results when batch completes. |
മറുപടി
{
"batch_id": "abc123",
"total": 3,
"completed": 0,
"status": "processing"
}
ep/v1/ttts/batch/burt/resutt/? badch=dibc3-നോടൊപ്പം പോള് പുരോഗതി
എംബഡ്ഡിംഗ് ശബ്ദം
ഒരു ശബ്ദത്തിന്റെ മുന്കൂര് ഓഡിയോയില് നിന്നും നീക്കം ചെയ്യുക. പിന്നീടു് കണ്സോളിന്റെ അപേക്ഷകള് അടുത്തുള്ള അഭ്യര്ത്ഥനകളില് തിരികെ നല്കിയ അഡ്മിനിസ്ട്രേറ്റ് _ഐഡി ഉപയോഗിക്കുക.
പരാമീറ്ററുകള്
| പരാമീറ്റര് | തരം | വിവരണം |
|---|---|---|
| file | file | Reference audio file (WAV, MP3, FLAC). |
| model | string | Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts. |
മറുപടി
{
"embed_id": "emb_abc123",
"model": "chatterbox",
"duration_ms": 450
}
ആരോഗ്യപരിപാടി
GPU സര്വര് അവസ്ഥ പരിശോധിക്കുക, മോഡിഫയര്, വരിയുടെ വലിപ്പം എന്നിവ ലോഡ് ചെയ്യുക. ഒരു ആധികാരികതയും ഇല്ല. കാഷ് 30 സെക്കന്ഡുകള്ക്കുള്ളവ.
മറുപടി
{
"status": "online",
"latency_ms": 45,
"queue_size": 3,
"models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
പട്ടിക മോഡലുകള്
ലഭ്യമായ എല്ലാ മോഡലുകള്ക്കും അവയുടെ കഴിവുകള് നല്കുന്നു.
മറുപടി
{
"models": [
{
"id": "kokoro",
"name": "Kokoro",
"type": "tts",
"tier": "standard",
"languages": ["en", "ja", "ko", "zh", "fr"],
"supports_cloning": false,
"supports_streaming": true,
"credits_per_1k_chars": 2
},
{
"id": "chatterbox",
"name": "Chatterbox",
"type": "tts",
"tier": "premium",
"languages": ["en"],
"supports_cloning": true,
"supports_streaming": true,
"credits_per_1k_chars": 4
}
]
}
ലിസ്റ്റിന്റെ ശബ്ദങ്ങള്
ലഭ്യമായ എല്ലാ ശബ്ദങ്ങളുടെയും പട്ടിക വീണ്ടും കൊണ്ടുവരുന്നു, സാമ്പിള് അല്ലെങ്കില് ഭാഷയനുസരിച്ചു് ഫില്റ്റര് ചെയ്തിരിയ്ക്കുന്നു.
ചോദ്യമിശ്രണോപാധികള്
| പരാമീറ്റര് | തരം | വിവരണം |
|---|---|---|
| model | string | മാതൃകയുടെ ഐഡി അനുസരിച്ച് ഫില്റ്റര് (ഉദാ, |
| language | string | ഭാഷാ കോഡ് ഫില്റ്റര് (ഉദാ., |
| gender | string | ലിംഗത്താല് ഫില്റ്റര്: |
മറുപടി
{
"voices": [
{
"id": "af_bella",
"name": "Bella",
"model": "kokoro",
"language": "en",
"gender": "female",
"preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
}
],
"total": 142
}
സബ്ടൈറ്റുകള് (എസ്ആര്ടി / വിടിടി) പുതിയ
പൂര്ത്തിയാക്കിയ ടിടിഎസ് ജോലിക്ക് സമീകരിക്കപ്പെട്ട സബ്ടൈറ്റുകള് നിര്മ്മിക്കുക. ശബ്ദക്രമത്തില് Whisper ഓഡിയോ അല്ലെങ്കില് WRTT അല്ലെങ്കില് WevTT നല്കുന്നു. ഫലം ഡിസ്കില് കാഷിങ് നല്കുന്നു അതുകൊണ്ട് അതേ യൂഐഡിനായുള്ള രണ്ടാമത്തെ കോള് ഡിസ്കില് ലഭ്യമാകുന്നു.
ചോദ്യമിശ്രണോപാധികള്
| പരാമീറ്റര് | ആവശ്യമുണ്ട് | വിവരണം |
|---|---|---|
| uuid | അതെ | JOBUPUNI /v1/tts/അല്ലെങ്കില് /v1/sublicon/icons. |
| format | ഇല്ല | |
| download | ഇല്ല | |
| language | ഇല്ല | ക്രമീകരിക്കല് മോഡലിനു് സൂചന. (സ്വയം-നോക്കിക്കൊടുത്താല് മതി). |
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
ഉച്ചാരണം നിഘണ്ടുQuery പുതിയ
TTS എഞ്ചിന് പറയൂ. ഓരോ TTS-നും നിങ്ങള് ആവശ്യമുളള രീതിയില് സ്വയം സൂക്ഷിക്കപ്പെട്ട എന്ട്രികള്. ഒരു കോംകൌണ്ട് പരിധിയില്.
അഭ്യര്ത്ഥനാ ശരീരം (POST)
| പരാമീറ്റര് | തരം | വിവരണം |
|---|---|---|
| word | string | മറിച്ചുകളയാനുള്ള വാക്ക് (e.g: |
| replacement | string | മാതൃകയ്ക്കായി അതെങ്ങനെ രഹസ്യഭാഷയിലാക്കണമെന്ന് (ഉദാ., |
| language | string | ഐഎസ്ഒ കോഡ്. ശൂന്യം = എല്ലാ ഭാഷകള്ക്കും ബാധകമാണ്. |
| case_sensitive | boolean | ഡീഫോള്ട്ട് |
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
-H "Authorization: Bearer sk-tts-..." \
-H "Content-Type: application/json" \
-d '{"word": "GIF", "replacement": "jiff"}'
# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."
# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
സംരക്ഷിക്കാതെ നിങ്ങള്ക്ക് ഓരോ റിക്കോര്ഡ് റാന്ഡര്കളും പാസ് ചെയ്യുവാന് സാധിക്കുന്നു — ഏതെങ്കിലും /v1/tts/tits ല് നിന്നും ഒരു വസ്തു അല്ലെങ്കില് ഒരു അഗ്രകോടിയായി വിളിയ്ക്കുന്നു. (ടിടിടിഎസ് ഫോര്മെന്റ് പാരസുകള് കാണുക)
ലേഖനം നിരീക്ഷകന് പുതിയ
ഒരു
<script src="https://tts.ai/narrator.js"
data-pk="pk-tts-your-publishable-key"
data-voice="af_bella"
data-model="kokoro"
data-extract="auto"
data-position="bottom"
data-color="#e60000"
data-locale="en"></script>
ഐച്ഛികങ്ങള്
| പരാമീറ്റര് | വിവരണം |
|---|---|
data-pk | പ്രസദ്ധീകരിക്കാവുന്ന കീ (pk-ts-...). മണ്ഡലത്തിന്റെ മണ്ഡലം |
data-voice | നെറ്റ്വര്ക്ക് ID. സ്വതവേയുള്ള |
data-model | TTS മാതൃകാ ഐഡി. സ്വതവേയുള്ള |
data-extract | അല്ലെങ്കില് ഒരു പ്രത്യേക എലമെന്റ് ലക്ഷ്യത്തിലേക്ക് CSS തെരഞ്ഞെടുപ്പ് നടത്താന് ഏതെങ്കിലും CSS തെരഞ്ഞെടുപ്പ് നടത്തുക. |
data-position | |
data-color | കണ്സ്ട്രക്ടര് നിറം (ഏതു CSS നിറം). സ്വതവേയുള്ള |
data-min-chars / data-max-chars | ലേഖനം min- പാര്ഡുകളില് കുറവാണെങ്കില് ബാര് ഉപേക്ഷിക്കുക (സ്വന്തം 200). മാക്സ്-പാര്ഡുകളില് ക്യാപ് അപ്പ് (ഡീഫോള്ട്ട് 50,000). |
ഗിറ്റ് ഹബ്-ല് ഉറവിടം: < ahref=\
ബട്ടണിന്റെ വിഡ്ജറ്റ് കേള്ക്കുക
<script src="https://tts.ai/widget.js"
data-voice="af_bella"
data-model="kokoro"
data-style="full"
data-theme="light"></script>
സൂക്ഷിച്ച ശബ്ദങ്ങള് (പെസ്റ്റന്റ് ക്ലോണ്സ്)
ഒരിക്കല് ഒരു റിക്കോര്ഡ് ഓഡിയോ അപ്ലോഡ് ചെയ്യുക, ഒരു സ്ഥിരമായ ശബ്ദ_ ID തിരിച്ചു് വീണ്ടും ചേര്ക്കുക, ഓരോ വിളിയും വീണ്ടും ലഭ്യമാക്കുന്നതിനു പകരം TTS ക്യാരക്റ്റില് ഐഡിയുടെ ഐഡി സൂചിപ്പിക്കുക. ഉയര്ന്നുവരുന്ന നിരീക്ഷകതകള്ക്കു് അനുയോജ്യമായിരിക്കുന്നു.
ശബ്ദം അപ്ലോഡ് ചെയ്യുക
POST
https://tts.ai/api/v1/user-voices/
Auth ആവശ്യമുണ്ട്
മള്ട്ടിപാര്ട്ട് ഫോള്ഡറുകള്. ഫീള്ഡുകള്: ഫയല് (തെറ്റായതു്, 5- 30 ഓഡിയോ), ഭാഷ (വേര്ഡ്), മാതൃക, മോഡല് (ഐച്ഛികം), zH/J/കോ ഓപ്പണ്-ഓപ്പണ് (സാധാരണ), സമ്മതിയ്ക്കുക (ഏതെങ്കിലും സത്യമൂല്യം).
curl -X POST https://tts.ai/api/v1/user-voices/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@reference.wav" \
-F "name=My Narrator" \
-F "language=en" \
-F "consent_confirmed=true"
# Response:
{
"public_id": "uv_a1b2c3d4e5f6",
"id": 42,
"name": "My Narrator",
"model_name": "openvoice",
"language": "en",
"reference_audio_url": "https://tts.ai/media/user-voices/....wav",
"storage_status": "active",
"created_at": "2026-04-17T03:45:00+00:00"
}
ടിടിഎസ്- യില് സൂക്ഷിച്ചിരിക്കുന്ന ശബ്ദം ഉപയോഗിക്കുക
/api/v1/tts/ (NOTY: വെബ്പിസ് ഹോസ്റ്റും, ഉപയോക്താവിന്റെ_ pass. txts. i. i. id അല്ല. ഞങ്ങള് നിങ്ങള് സൂക്ഷിച്ചിരിക്കുന്ന ഓഡിയോയും വഴിയും ടോഗിള് പൈപ്പറ്റിലേക്ക് ചേര്ക്കുന്നു.
curl -X POST https://tts.ai/api/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'
# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.
പട്ടിക / നീക്കം ചെയ്യുക
GET https://tts.ai/api/v1/user-voices/ # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6
ശേഖരം / വീണ്ടും പ്രവര്ത്തന സജ്ജമാക്കുക (ഫ്ളാഷ്)
ആര്ക്കൈവ് ചെയ്ത ശബ്ദം നിങ്ങളുടെ അക്കൌണ്ടില് തന്നെയുണ്ട്, പക്ഷേ ടിടിഎസ്-യില് ഉപയോഗിക്കാന് കഴിയില്ല. നിര്ജ്ജീവമായ ഉപയോക്താക്കള്ക്ക് ഉപയോഗപ്രദമാണ്. അതുകൊണ്ട് നിങ്ങളുടെ പട്ടിക വൃത്തിയായി തുടരുന്നു.
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/
കോഡ് ഉദാഹരണങ്ങള്
സംസാരത്തിനുള്ള വാചകം
import requests
API_KEY = "sk-tts-your-key"
# Text to Speech
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
"format": "mp3"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
print(f"Credits used: {response.headers.get('X-Credits-Used')}")
പദാവലിയുമായുള്ള സംസാരം
# Speech to Text
with open("recording.mp3", "rb") as f:
response = requests.post(
"https://api.tts.ai/v1/stt/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"file": f},
data={"model": "faster-whisper", "timestamps": "true"}
)
result = response.json()
print(result["text"])
ശബ്ദ ക്ളൈനിങ്ങ്
# Voice Cloning
with open("reference.wav", "rb") as ref:
response = requests.post(
"https://api.tts.ai/v1/tts/clone/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"reference_audio": ref},
data={
"text": "This speech uses a cloned voice.",
"model": "chatterbox"
}
)
with open("cloned_output.mp3", "wb") as f:
f.write(response.content)
സംസാരത്തിനുള്ള വാചകം
const API_KEY = 'sk-tts-your-key';
// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
method: 'POST',
headers: {
'Authorization': `Bearer ${API_KEY}`,
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'kokoro',
text: 'Hello from TTS.ai!',
voice: 'af_bella',
format: 'mp3'
})
});
const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();
പദാവലിയുമായുള്ള സംസാരം
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');
const response = await fetch('https://api.tts.ai/v1/stt/', {
method: 'POST',
headers: { 'Authorization': `Bearer ${API_KEY}` },
body: formData
});
const result = await response.json();
console.log(result.text);
സംസാരത്തിനുള്ള വാചകം
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
-o output.mp3
പദാവലിയുമായുള്ള സംസാരം
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@recording.mp3" \
-F "model=faster-whisper" \
-F "timestamps=true"
ശബ്ദ ക്ളൈനിങ്ങ്
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "reference_audio=@reference.wav" \
-F "text=This uses a cloned voice." \
-F "model=chatterbox" \
-o cloned.mp3
ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്Name
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@noisy_audio.mp3" \
-F "denoise=true" \
-F "enhance_clarity=true" \
-o enhanced.mp3
പിശകിന്റെ കോഡ്
എല്ലാ പിശകുകളും ഒരു ജോണ് മറുപടിയായി നല്കുന്നു error ഫീൽഡ്.
{
"error": {
"code": "insufficient_credits",
"message": "You do not have enough characters for this request.",
"characters_required": 4000,
"characters_available": 2000
}
}
| എച്ച്ടിടിപി സ്ഥിതി | പിഴവ് കോഡ് | വിവരണം |
|---|---|---|
| 400 | bad_request |
അസാധുവായ ആവശ്യം പരാമീറ്ററുകള്. വിവരങ്ങള്ക്കായി പിശകിന്റെ സന്ദേശം പരിശോധിക്കുക. |
| 401 | unauthorized |
API കീ ലഭ്യമല്ല അല്ലെങ്കില് അസാധുവാണ്. |
| 402 | insufficient_credits |
മതിയായ അക്ഷരങ്ങള് ലഭ്യമല്ല. / pricting/ ല് കൂടുതല് വിലയ്ക്ക് വാങ്ങുക. |
| 403 | forbidden |
നിങ്ങള്ക്കു് ഈ വിഭവം ഉപയോഗിക്കാനുള്ള അനുവാദമില്ല (ഉദാ. മറ്റൊരു ഉപയോക്താവിന്റെ ജോലി പരിശോധിക്കുന്നു). API സമീപനത്തിനു് എല്ലാ പദ്ധതിയിലും അനുബന്ധമുണ്ട്. |
| 404 | not_found |
സാമ്പിളോ ശബ്ദമോ കണ്ടില്ല. |
| 413 | file_too_large |
അപ്ലോഡ് ചെയ്ത ഫയല് വ്യാപ്തിയേക്കാള് കൂടുതലാണു്. |
| 429 | rate_limited |
വളരെയധികം ആവശ്യങ്ങള്. നിരക്കിന്റെ പരിധി തലക്കെട്ടുകള് പരിശോധിയ്ക്കുക. |
| 500 | internal_error |
സര്വര് പിശക്. പിന്നീട് വീണ്ടും ശ്രമിക്കുക. |
| 503 | model_loading |
മോഡല് ലഭ്യമാക്കുന്നു, കുറച്ച് സെക്കന്റിനുള്ളില് വീണ്ടും ശ്രമിക്കുക. |
വെബിലെ ഹൂക്കുകള്Name
ദീര്ഘകാല ജോലികള്ക്കു് (stem, TTS വേര്പെടുത്തല്), നിങ്ങള്ക്കു്
{
"event": "task.completed",
"task_id": "task_abc123",
"status": "success",
"result_url": "https://api.tts.ai/v1/results/task_abc123",
"credits_used": 12,
"created_at": "2025-01-15T10:30:00Z",
"completed_at": "2025-01-15T10:30:45Z"
}
നിര്മ്മിക്കാൻ തയ്യാറാണോ?
നിങ്ങളുടെ API കീ എടുത്തിട്ട് നിങ്ങളുടെ പ്രവര്ത്തികളില് TTS.ai രൂപ തുടങ്ങുക.