എപിഐ സഹായക്കുറിപ്പുകള്‍

നിങ്ങളുടെ അപേക്ഷകളില്‍ TTS.ai പേരെ, ഞങ്ങളുടെ റെസ്റ്റ് API-ല്‍ ചേര്‍ത്ത് നിര്‍ത്തുക. എളുപ്പത്തില്‍ കുടിയേറാന്‍.

റെയ്‌ഡ്‌ എപിഐ ഓപ്പണ്‍AI കോംപസ് ജോസണ്‍ മറുപടി സ്ട്രീമിങ് പിന്തുണ

പരിശോധിയ്ക്കുക

TTS.ai API പ്രോഗ്രാം എല്ലാ പ്ലാറ്റ്ഫോമിലുള്ള മണ്ഡലങ്ങളിലും സാങ്കേതികമായ പ്രവേശനം ലഭ്യമാക്കുന്നു: ലേഖന- വായനാ- വായനാ- ശബ്ദ- വാക്യം, ശബ്ദസംഭരണി, ശബ്ദത്തിന്റെ വര്‍ദ്ധന, ശബ്ദത്തിന്റെ കൂടുതല്‍ വര്‍ദ്ധനവ്, കൂടുതല്‍. API ജോസണ്‍/ response commanages- ല്‍ regrap settings.

API കീ

നിങ്ങളുടെ API കീ ഇവിടെ നിന്നും എടുക്കുക അക്കൌണ്ടിന്റെ സജ്ജീകരണങ്ങള്‍. പ്രൊ ആൻഡ്‌ എൻസൈക്ലോപീഡിയ പദ്ധതികളിൽ ലഭ്യമാണ്.

അടിസ്ഥാന യുആര്‍എല്‍

https://api.tts.ai/v1/

അഥ്

ബീറ്റര്‍ അടയാളം വഴി Authorization ഹെഡ്ഡര്‍

ആധികാരകത ഉറപ്പുവരുത്തല്‍

എല്ലാ API അഭ്യര്‍ത്ഥനകളും ആവശ്യമുണ്ട്, ഇതിന്റെ ബീറ്റര്‍ സൂക്കറിലൂടെയുളള ആധികാരികത ഉറപ്പാക്കല്‍. Authorization ഹെഡ്ഡര്‍.

എച്ച്ടിടിപി തലക്കെട്ട്
Authorization: Bearer sk-tts-your-api-key-here
നിങ്ങളുടെ എപിഐ കീ രഹസ്യം സൂക്ഷിക്കണം. ക്ലയന്റ്- പാര്‍ട്ടി കോഡ്, പൊതു ശേഖരം, അല്ലെങ്കില്‍ ലോഗുകള്‍ എന്നിവയില്‍ ഇത് പങ്കു വെക്കരുത്. നിങ്ങളുടെ അക്കൌണ്ടിന്റെ ക്രമീകരണങ്ങളില്‍ നിന്നും കീകള്‍ ക്രമമായി കറക്കുക.

എസ്ഡികെസ്Comment

ഔദ്യോഗിക SDKs നിങ്ങളുടെ പ്രയോഗത്തില്‍ TTS.ai ലഭ്യമാക്കാന്‍ എളുപ്പമാക്കുന്നു. രണ്ടും തുറന്ന ഉറവിടങ്ങളാണ്, ഗിറ്റ്ഹബ്-ല്‍ ലഭ്യമാണ്.

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

അടിസ്ഥാന യുആര്‍എല്‍

അടിസ്ഥാന യുആര്‍എല്‍: https://api.tts.ai/v1/

ഈ അടിസ്ഥാന യുആര്‍എല്ലിനോടുള്ള ബന്ധമാണു് എല്ലാ അവസാന പോയിന്റ്കളും. ഉദാഹരണമായി TTS അവസാനബിന്ദു:

POST https://api.tts.ai/v1/tts/

പരിധികള്‍

പദ്ധതിയില്‍ API നിരക്കില്‍ വ്യത്യാസം ഉണ്ട്:

പദ്ധതി ആവശ്യങ്ങള്‍/നിവര്‍ത്തി കോണ്‍സ്റ്റന്റ് ഏറ്റവും കൂടിയ ടെക്സ്റ്റ് ദൈര്‍ഘ്യം
ഫ്രീ 10 2 500 അക്ഷരങ്ങള്‍
ആരംഭകന്‍ 30 3 1,00,000 അക്ഷരങ്ങള്‍
പ്രൊഫൈല്‍ 60 5 1,00,000 അക്ഷരങ്ങള്‍
ഇന്‍റര്‍നാഷണല്‍ 300 20 50,000 അക്ഷരങ്ങള്‍

എല്ലാ മറുപടിയിലും റേറ്റ് തലക്കെട്ടുകള്‍ ഉള്‍‌ക്കൊള്ളുന്നു: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

കടങ്ങൾ

സേവനം വില യൂണിറ്റ്
ടിടിഎസ് (ഫ്രീ മോഡല്‍: Pyper, VITS, മെലോട്ടിക്സ്) 1,000 അക്ഷരങ്ങള്‍ 1,000 അക്ഷരങ്ങള്‍ക്കു്
ടിടിഎസ് (സാര്‍ഡ് മോഡല്‍: കോക്കോറോ, കൊസിവ്യൂസ് 2 [.]) 2,000 അക്ഷരങ്ങള്‍ 1,000 അക്ഷരങ്ങള്‍ക്കു്
TTS (പെരിമിയം മോഡല്‍: ടോര്‍ട്ടോയിസ്, ചാറ്റര്‍ബോക്സ്, എന്നിവ.) 4,000 അക്ഷരങ്ങള്‍ 1,000 അക്ഷരങ്ങള്‍ക്കു്
പദാവലിയുമായുള്ള സംസാരം 2,000 അക്ഷരങ്ങള്‍ ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദ ക്ളൈനിങ്ങ് 4,000 അക്ഷരങ്ങള്‍ 1,000 അക്ഷരങ്ങള്‍ക്കു്
ശബ്ദം മാറ്റുന്നയാള്‍ 3,000 അക്ഷരങ്ങള്‍ ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്‍Name 2,000 അക്ഷരങ്ങള്‍ ഒരു മിനിറ്റ് ഓഡിയോയില്‍
വോള്‍ഡ്ലോഡ് / സ്റ്റാം വിരിയല്‍ 3,000- 3,000 അക്ഷരങ്ങള്‍ ഒരു മിനിറ്റ് ഓഡിയോയില്‍
സംസാരപരിഭാഷName 5,000 അക്ഷരങ്ങള്‍ ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദം സല്ലാപം 3,000 അക്ഷരങ്ങള്‍ ഒരു ഊഴത്തില്‍
കീ & BPM തിരയല്‍ ഫ്രീ --
ശബ്ദമാറ്റംName ഫ്രീ --

സംസാരത്തിനുള്ള വാചകം

POST /v1/tts/

വാചകം സംസാരസഞ്ചയത്തിലേക്കു് മാറ്റുക. ആവശ്യപ്പെട്ട ഫയലില്‍ ഓഡിയോ ഫയല്‍ തിരിച്ചുവിടുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
model string അതെ മോഡല്‍ ID (e.g: ), , >> , )
text string അതെ സംസാരത്തിലേക്കു് മാറ്റേണ്ട പദാവലി (പ്രവര്‍ത്തിയ്ക്കായി കൂടിയ 1,00,000 അക്ഷരങ്ങള്‍)
voice string അതെ ശബ്ദത്തിന്റെ ഐഡി ( /v1/sumber/ ലഭ്യമാകുന്ന ശബ്ദങ്ങള്‍ ലിസ്റ്റില്‍ ഉപയോഗിക്കുക)
format string ഇല്ല ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: (default), , ,
speed float ഇല്ല വേഗത വര്‍ദ്ധിപ്പിക്കുന്നു. സ്വതവേയുള്ള: .0 > > > <>> <>>>
language string ഇല്ല ഭാഷാ കോഡ് (e.g., ), , . ഉപേക്ഷിച്ചാല്‍ ഓട്ടോ-തെരഞ്ഞെടുക്കുന്നു.
stream boolean ഇല്ല സ്റ്റ്രീമിലെ മറുപടി പ്രവര്‍ത്തന സജ്ജമാക്കുക. സഹജമായി:

ഉദാഹരണ അപേക്ഷ

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

മറുപടി

ഉചിതമായ -type>-ന്‍റെ ഹെഡര്‍ ഓഡിയോ ഡേറ്റായായി ഓഡിയോ ഫയല്‍ തിരിച്ചുവിടുന്നു (=daudio/moege>, , ,.

മറുപടി തലക്കെട്ടുകള്‍
Content-Type: audio/mpeg
Content-Length: 48256
X-Credits-Used: 2
X-Credits-Remaining: 498

പദാവലിയുമായുള്ള സംസാരം

POST /v1/stt/

ഓഡിയോ ടെക്സ്റ്റിലേക്ക് പകര്‍ത്തുക. തനിയെയുള്ള 99 ഭാഷകള്‍ പിന്തുണയ്ക്കുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
file file അതെ ഓഡിയോ ഫയല്‍ (എംപി3, WAV, OGG, MGA, MP4, വെബ്M. Max 100MB)
model string ഇല്ല STD മോഡ്: (default), ,
language string ഇല്ല ഭാഷാ കോഡ്. യാന്ത്രികമായ/കോഡ് ചെയ്യാന്‍ '%s'. default-default (default)
timestamps boolean ഇല്ല വാക്കുകളുടെ തലകെട്ടുകള്‍ ഉള്‍പ്പെടുത്തുക. സ്വതവേയുള്ള: folder>
diarize boolean ഇല്ല സ്പര്‍ട്ടര്‍ ഡയറേഷന്‍ പ്രാവര്‍ത്തികമാക്കുക. സ്വതവേയുള്ള: false/കോഡ് ചെയ്യുക>

മറുപടി

ജോസണ്‍ മറുപടി
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

ശബ്ദ ക്ളൈനിങ്ങ്

POST /v1/tts/clone/

വിപരീത ശബ്ദത്തില്‍ സംസാരം ഉണ്ടാക്കുക. ഒരു റിഫേഴ്സ് ഓഡിയോയും പദാവലിയും അപ്‌ലോഡ് ചെയ്യുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
reference_audio file അതെ റഫറന്‍സ് ഓഡിയോ (10-30 സെക്കന്‍ഡുകള്‍) ശുപാര്‍ശ ചെയ്തു. മാക്സ് 20MB.
text string അതെ ക്ലോണ്‍ഡ് ശബ്ദത്തില്‍ സംസാരിക്കാന്‍ ടെക്സ്റ്റ്.
model string ഇല്ല ക്ലോണ്‍ മോഡ്: chatlebox (default), ,
format string ഇല്ല ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: /കോഡ്> (default), , /കോഡ് ചെയ്യുക
language string ഇല്ല ലക്ഷ്യ‌‌ഭാഷാ കോഡ്. തെരഞ്ഞെടുത്ത മോഡ് പിന്തുണയ്ക്കണം.

മറുപടി

ശബ്ദ ഫയല്‍ TTS അവസാന പോയിന്റ് പോലെ ബൈനറി ഡാറ്റയായി തിരിച്ചുവിടുന്നു.

ശബ്ദം മാറ്റുന്നയാള്‍

POST /v1/voice-convert/

മറ്റൊരു ശബ്ദം പോലെ ഓഡിയോ ശബ്ദത്തിലേക്കു് ശബ്ദമുണ്ടാക്കുക. ശ്രോതസ്സ് ഓഡിയോ അപ്ഗ്രേഡ് ചെയ്തു് ലക്ഷ്യ‌‌ശബ്ദം തെരഞ്ഞെടുക്കുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
file file അതെ സോഴ്സ് ഓഡിയോ ഫയല്‍ (MP3, WAV, FLAC). മാക്സ് 50MB.
target_voice string അതെ മാറ്റേണ്ട ലക്ഷ്യ‌ത്തിന്റെ ID ( /v1/rues/ ലഭ്യമാകുന്ന ശബ്ദങ്ങളുടെ പട്ടികയില്‍ സിന്‍ക് ചെയ്യുക)
model string ഇല്ല ശബ്ദം മാറ്റം വരുത്തല്‍ മാതൃക: OpenPGen (default),
format string ഇല്ല ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: (default), , /കോഡ് ചെയ്യുക

ഉദാഹരണ അപേക്ഷ

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

മറുപടി

മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല്‍ ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.

സംസാരപരിഭാഷName

POST /v1/speech-translate/

ഒരു ഭാഷയില്‍ നിന്നും മറ്റൊരു ഭാഷയിലേക്കു് ശബ്ദമിശ്രണോപാധികള്‍ പരിഭാഷപ്പെടുത്തുക. സംസാരം, പരിഭാഷ, പദാവലി എന്നിവ ഒരേ കോളില്‍ ചേര്‍ക്കുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
file file അതെ യഥാര്‍ത്ഥ ഭാഷയില്‍ ഓഡിയോ ഫയല്‍. മാക്സ് 100എം.എം.എം.
target_language string അതെ ലക്ഷ്യ ഭാഷാ കോഡ് (e.g., , , , ,
voice string ഇല്ല പരിഭാഷപ്പെടുത്തിയിരിക്കുന്ന ഔട്ട്പുട്ടിനുള്ള ശബ്ദം. വേണ്ടെങ്കില്‍ സ്വയം തെരഞ്ഞെടുത്തതാണു്.
preserve_voice boolean ഇല്ല യഥാര്‍ത്ഥ സ്പീക്കറിന്‍റെ ശബ്ദ വിശേഷതകള്‍ സംരക്ഷിക്കുവാന്‍ ശ്രമിക്കുന്നു. സ്വതവേയുള്ള: confault/code>

മറുപടി

ജോസണ്‍ മറുപടി
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

സംസാരം

POST /v1/speech-to-speech/

വസ്‌തുവകകൾ സൂക്ഷിക്കുമ്പോൾ സംസാരരീതി, വികാരങ്ങൾ, പ്രസവപ്പെടുത്തൽ എന്നിവ രൂപാന്തരപ്പെടുത്തുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
file file അതെ സോഴ്സ് ഓഡിയോ ഫയല്‍. മാക്സ് 50MB
voice string അതെ ഔട്ട്പുട്ട് സംസാരത്തിനുള്ള ലക്ഷ്യമായ ശബ്ദ ഐഡി
model string ഇല്ല മോഡല്‍: OpenPread (default), >
emotion string ഇല്ല ലക്ഷ്യ‌‌: , , , ,
speed float ഇല്ല വേഗതയില്‍ പൊരുത്തപ്പെടുത്തല്‍. സ്വതവേയുള്ള: 1.0 <. പരിധി: >> <> <>>

മറുപടി

മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല്‍ ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.

ഓഡിയോ ഉപകരണങ്ങള്‍

ശബ്ദത്തിന്‍റെ ഗുണമേന്മയ്‌ക്കു വേണ്ടിയുള്ള ഓഡിയോ അറ്റകുറ്റപ്പണികൾ, ശബ്ദനഷ്ടം, ബ്രിഡ്‌ജ്‌, ബ്രിഡ്‌ജ്‌ വിച്ഛേദം എന്നിവയ്‌ക്കു വേണ്ടിയുള്ളവയാണ്‌.

POST /v1/audio/enhance/

ഓഡിയോ ഗുണമേന്മ മെച്ചപ്പെടുത്തുക: ഡീനോയിസ്, വ്യക്തമാക്കുക, സൂപ്പര്‍ റെഡിഫ്യൂഷന്‍ മെച്ചപ്പെടുത്തുക.

file fileവര്‍ദ്ധിപ്പിക്കുന്നതിനായി ഓഡിയോ ഫയല്‍
denoise booleanമറോയിസിങ്ങ് പ്രാവര്‍ത്തികമാക്കുക (സഹജമായി: ശരി)
enhance_clarity booleanലളിതമായ സംസാരം (സഹജം: ശരി) Name
super_resolution booleanമുകളിലേക്ക് ഓഡിയോ ഗുണമേന്മ (സഹജം: തെറ്റ്)
strength integer1- 3 (വെളിച്ച, മാധ്യമത്തില്‍, ശക്തം). സഹജമായ: 2
POST /v1/audio/separate/

എഞ്ചിനീയറുകളില്‍ നിന്ന് (വലിയ നീക്കം) അല്ലെങ്കില്‍ ഞെട്ടലായി പിളരുക.

file fileവേര്‍പെടുത്തുന്നതിനായി ഓഡിയോ ഫയല്‍
model stringdemucs (സഹജമായ) അല്ലെങ്കില്‍ spleeter
stems integerമൂലകങ്ങളുടെ എണ്ണം: 2, 4, 5, 6 (default: 2)
format stringഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: , >> > >>, >
POST /v1/audio/dereverb/

ഓഡിയോ റെക്കോര്‍ഡുകളില്‍ നിന്നും ആവര്‍ത്തിക്കുക.

file fileപാകപ്പെടുത്താനുള്ള ഓഡിയോ ഫയല്‍
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ ഫ്രീ

കീ, BPM, ടൈം ഒപ്പു് എന്നിവ കണ്ടുപിടിക്കുന്നതിനായി ഓഡിയോ വിവരങ്ങള്‍ പരിശോധിയ്ക്കുക.

file fileവിശകലനം ചെയ്യാനുള്ള ഓഡിയോ ഫയല്‍
മറുപടി
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ ഫ്രീ

ഓഡിയോ ഫോര്‍മാറ്റുകള്‍ തമ്മില്‍ മാറ്റുക.

file fileമാറ്റേണ്ട ശബ്ദ ഫയല്‍
format stringലക്ഷ്യ‌‌‌ക്രമം: /കോഡ് , > > > >, , , ,
bitrate integerഔട്ട്പുട്ട് ബിറ്റ്‌വെയര്‍ kbsp: 64, 128, 192, 256, 320
sample_rate integerസാമ്പിളിന്റെ നിരക്ക്: 22050, 44100, 48000
channels stringmono അല്ലെങ്കില്‍ stereo

ശബ്ദം സല്ലാപം

POST /v1/voice-chat/

ഓഡിയോ അല്ലെങ്കില്‍ പാഠങ്ങള്‍ അയക്കുക. ശബ്ദസങ്കലമായ സംസാരത്താല്‍ AI മറുപടി ലഭിക്കുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data അല്ലെങ്കില്‍ JSON)

പരാമീറ്റര്‍തരംആവശ്യമുണ്ട്വിവരണം
audio file ഇല്ല* ഓഡിയോ ഇന്‍പുട്ട് (ഐച്ഛികമായി സിന്‍ക് അല്ലെങ്കില്‍ അല്ലെങ്കില്‍ ആവശ്യമുണ്ട്)
text string ഇല്ല* വാചകത്തിനുള്ള ഇന്‍പുട്ട് (തെറ്റായത് അല്ലെങ്കില്‍ അല്ലെങ്കില്‍
ആവശ്യമുണ്ട്)
voice string ഇല്ല AI മറുപടിയുടെ ശബ്ദം. സ്വതവേയുള്ള:
tts_model string ഇല്ല മറുപടിയുടെ TTS മാതൃക. സ്വതവേയുള്ള:
system_prompt string ഇല്ല ആവശ്യമുളള സിസ്റ്റം AI- നായി ആസൂത്രണം ചെയ്യുക
conversation_id string ഇല്ല നിലവിലുള്ള ഒരു വര്‍ത്തമാനം തുടരുക

മറുപടി

ജോസണ്‍ മറുപടി
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

ട്രെഡിസ്‌

POST /v1/tts/batch/

TTS തനത് തലമുറയ്ക്കായി അനവധി പാഠങ്ങള്‍ സമര്‍പ്പിക്കുക. എല്ലാ ജോലികളും പൂര്‍ത്തിയാകുമ്പോള്‍ ഒരു വെബ് കൊളുത്ത് ബാക്ക് സ്വീകരിക്കുക.

പരാമീറ്ററുകള്‍

പരാമീറ്റര്‍തരംവിവരണം
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringOptional URL to POST results when batch completes.

മറുപടി

ജോസണ്‍ മറുപടി
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

ep/v1/ttts/batch/burt/resutt/? badch=dibc3-നോടൊപ്പം പോള്‍ പുരോഗതി

എംബഡ്ഡിംഗ് ശബ്ദം

POST /v1/voice-embed/

ഒരു ശബ്ദത്തിന്റെ മുന്‍‌കൂര്‍ ഓഡിയോയില്‍ നിന്നും നീക്കം ചെയ്യുക. പിന്നീടു് കണ്‍സോളിന്‍റെ അപേക്ഷകള്‍ അടുത്തുള്ള അഭ്യര്‍ത്ഥനകളില്‍ തിരികെ നല്‍കിയ അഡ്മിനിസ്ട്രേറ്റ് _ഐഡി ഉപയോഗിക്കുക.

പരാമീറ്ററുകള്‍

പരാമീറ്റര്‍തരംവിവരണം
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

മറുപടി

ജോസണ്‍ മറുപടി
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

ആരോഗ്യപരിപാടി

GET /v1/health/

GPU സര്‍വര്‍ അവസ്ഥ പരിശോധിക്കുക, മോഡിഫയര്‍, വരിയുടെ വലിപ്പം എന്നിവ ലോഡ് ചെയ്യുക. ഒരു ആധികാരികതയും ഇല്ല. കാഷ് 30 സെക്കന്‍ഡുകള്‍ക്കുള്ളവ.

മറുപടി

ജോസണ്‍ മറുപടി
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

പട്ടിക മോഡലുകള്‍

GET /v1/models/

ലഭ്യമായ എല്ലാ മോഡലുകള്‍ക്കും അവയുടെ കഴിവുകള്‍ നല്‍കുന്നു.

മറുപടി

ജോസണ്‍ മറുപടി
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

ലിസ്റ്റിന്‍റെ ശബ്ദങ്ങള്‍

GET /v1/voices/

ലഭ്യമായ എല്ലാ ശബ്ദങ്ങളുടെയും പട്ടിക വീണ്ടും കൊണ്ടുവരുന്നു, സാമ്പിള്‍ അല്ലെങ്കില്‍ ഭാഷയനുസരിച്ചു് ഫില്‍റ്റര്‍ ചെയ്തിരിയ്ക്കുന്നു.

ചോദ്യമിശ്രണോപാധികള്‍

പരാമീറ്റര്‍തരംവിവരണം
model string മാതൃകയുടെ ഐഡി അനുസരിച്ച് ഫില്‍‌റ്റര്‍ (ഉദാ, കോഡ്‌കോറോ )
language string ഭാഷാ കോഡ് ഫില്‍‌റ്റര്‍ (ഉദാ., )
gender string ലിംഗത്താല്‍ ഫില്‍‌റ്റര്‍: , , ,

മറുപടി

ജോസണ്‍ മറുപടി
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

കോഡ് ഉദാഹരണങ്ങള്‍

സംസാരത്തിനുള്ള വാചകം

Python - requests
import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

പദാവലിയുമായുള്ള സംസാരം

Python - requests
# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

ശബ്ദ ക്ളൈനിങ്ങ്

Python - requests
# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

സംസാരത്തിനുള്ള വാചകം

JavaScript - fetch
const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

പദാവലിയുമായുള്ള സംസാരം

JavaScript - fetch
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

സംസാരത്തിനുള്ള വാചകം

cURL
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

പദാവലിയുമായുള്ള സംസാരം

cURL
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

ശബ്ദ ക്ളൈനിങ്ങ്

cURL
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്‍Name

cURL
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

പിശകിന്റെ കോഡ്

എല്ലാ പിശകുകളും ഒരു ജോണ്‍ മറുപടിയായി നല്‍കുന്നു error ഫീൽഡ്.

പിശകിന്റെ മറുപടിയുടെ ഫോര്‍മാറ്റ്
{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough characters for this request.",
    "characters_required": 4000,
    "characters_available": 2000
  }
}
എച്ച്ടിടിപി സ്ഥിതിപിഴവ് കോഡ്വിവരണം
400 bad_request അസാധുവായ ആവശ്യം പരാമീറ്ററുകള്‍. വിവരങ്ങള്‍ക്കായി പിശകിന്റെ സന്ദേശം പരിശോധിക്കുക.
401 unauthorized API കീ ലഭ്യമല്ല അല്ലെങ്കില്‍ അസാധുവാണ്.
402 insufficient_credits മതിയായ അക്ഷരങ്ങള്‍ ലഭ്യമല്ല. / pricting/ ല്‍ കൂടുതല്‍ വിലയ്ക്ക് വാങ്ങുക.
403 forbidden നിങ്ങളുടെ പദ്ധതിയില്‍ API പ്രവേശനം ലഭ്യമല്ല.
404 not_found സാമ്പിളോ ശബ്ദമോ കണ്ടില്ല.
413 file_too_large അപ്ലോഡ് ചെയ്ത ഫയല്‍ വ്യാപ്തിയേക്കാള്‍ കൂടുതലാണു്.
429 rate_limited വളരെയധികം ആവശ്യങ്ങള്‍. നിരക്കിന്റെ പരിധി തലക്കെട്ടുകള്‍ പരിശോധിയ്ക്കുക.
500 internal_error സര്‍വര്‍ പിശക്. പിന്നീട് വീണ്ടും ശ്രമിക്കുക.
503 model_loading മോഡല്‍ ലഭ്യമാക്കുന്നു, കുറച്ച് സെക്കന്റിനുള്ളില്‍ വീണ്ടും ശ്രമിക്കുക.

വെബിലെ ഹൂക്കുകള്‍Name

ദീര്‍ഘകാല ജോലികള്‍ക്കു് (stem, TTS വേര്‍പെടുത്തല്‍), നിങ്ങള്‍ക്കു് web_url/type> പരാമീറ്റര്‍ നല്‍കുവാന്‍ കഴിയും. ജോലി പൂര്‍ത്തിയായാല്‍ നിങ്ങളുടെ യുആര്‍എല്‍ -നിലുള്ള ഫലം വീണ്ടും പോസ്റ്റ് ചെയ്യും.

വെബ് ഹൂക്ക് പേയ്‌ന്‍ഡൌണ്‍Name
{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}
24 മണിക്കൂര്‍ കഴിഞ്ഞ് വെബില്‍ ഫലങ്ങള്‍ ലഭ്യമാണ്. അവ ഉടന്‍ തന്നെ ഡൌണ്‍ലോഡ് ചെയ്യണമെന്ന് ഉറപ്പുവരുത്തുക.

നിര്‍മ്മിക്കാൻ തയ്യാറാണോ?

നിങ്ങളുടെ API കീ എടുത്തിട്ട് നിങ്ങളുടെ പ്രവര്‍ത്തികളില്‍ TTS.ai രൂപ തുടങ്ങുക.