എനിക്കെങ്ങനെ API താക്കോൽ കിട്ടും?

ഒരു സ്വതന്ത്ര TTS.ai അക്കൗണ്ടിനു് ഒപ്പ് നല്കുക, എന്നിട്ട് ഡാഷ്ബോര്ഡ് പാസ് ചെയ്യുക, "API കീ" ക്ലിക്ക് ചെയ്യുക. നിങ്ങളുടെ താക്കോല് സ്ക്-ts-ts-നു് മുന്ഗണന നല്കും. ഉടനടി ഉപയോഗിക്കാം. സ്വതന്ത്ര അക്കൌണ്ടുകള്ക്ക് 15,000 അക്ഷരങ്ങള് ലഭിക്കുന്നു.

OpenAI യുടെ ഫോര്മാറ്റുമായി ബന്ധപ്പെട്ടതാണോ API?

അതെ, ഞങ്ങളുടെ API ഓപ്പണ് AI-ഉപയോഗിയ്ക്കാനുള്ള അപേക്ഷയും മറുപടിയും പിന്വലിക്കും. ഓപ്പണ് AII യുടെ TTS API ഉപയോഗിക്കുന്ന കോഡ് നിങ്ങളുടെ കയ്യിലുണ്ടെങ്കില്, നിങ്ങള്ക്ക് TTS.ai-ആം പേരിലേക്ക് മാറാം അടിസ്ഥാന യുആര്എല് കീയും കുറഞ്ഞ കോഡ് മാറ്റുന്നു.

ഏതു ഭാഷകളാണ് പ്രോഗ്രാമിങ് ഭാഷകളെ പിന്തുണയ്ക്കുന്നത്?

RSTAPI ഏതു ഭാഷയാലും എച്ച്ടിപി ആവശ്യങ്ങള് ഉണ്ടാക്കുന്നു. ഞങ്ങള് പൈഥണ്, ജാവാസ്ക്രിപ്റ്റ് (നോഡ്ജസ്, ബ്രൌസര്), സി. എം. എം.ടി.സി ക്ലയന്റ് ലൈബ്രറി (പോ, റൂബി, ജാവ (CO, CPO, CPH) എന്നിവയില് ഉദാഹരണങ്ങള് നല്കുന്നു.

എന്താണ് API നിരക്ക്?

ഫ്രീ അക്കൗണ്ടുകള്ക്ക് മണിക്കൂറില് 3 വരെയുള്ള ആവശ്യങ്ങള് ഉണ്ട്. നിങ്ങളുടെ വരികള്ക്കനുസരിച്ചു് പാഡ് പദ്ധതികള്ക്ക് കൂടുതല് പരിധികളുണ്ട്: സ്റ്റൈല്റ്റര് (60/ മണിക്കൂര്), പ്രൊഫഷണല് (300/ മണിക്കൂര്), ഇന്റര്നാഷണല്. റേറ്റ് തലക്കെട്ടുകള് ഓരോ API മറുപടിയിലും ചേര്ത്തിരിക്കുന്നു.

എപിഐന്റെ പ്രവര്ത്തനം എങ്ങനെയുള്ളതാണ്?

API ഉപയോഗം മാതൃകാ സ്ലേറ്റര്, പദാവലി നീളം എന്നിവയെ അടിസ്ഥാനമാക്കിയുള്ള അക്ഷരങ്ങളെയാണു് ഉപയോഗപ്പെടുത്തുന്നത്. ഫ്രീ മോഡല് 0 അക്ഷരങ്ങള്, സാധാരണ മോഡല് ഉപയോഗിക്കുന്നത് 2x അക്ഷരങ്ങള്, മോഡിഫയര് 4x ചിഹ്നങ്ങള് ഉപയോഗിക്കുന്നു. എല്ലാ തരത്തിലുമുള്ള അക്ഷരങ്ങള് ഉള്പ്പെടുത്തിയിരിക്കുന്നു, കൂടാതെ അക്ഷരങ്ങള് തമ്മില് കൂട്ടുന്നു.

എന്താണ് അവ്യക്തം?

The API provides endpoints for text-to-speech (POST /v1/tts/), speech-to-text (POST /v1/transcribe/), voice cloning (POST /v1/voice-clone/), voice conversion (POST /v1/voice-convert/), speech translation (POST /v1/speech-translate/), audio enhancement (POST /v1/audio-enhance/), vocal removal, stem splitting, key and BPM analysis, and more.

API ഏതു് ഓഡിയോ ഫോര്മാറ്റുകള് തിരികെ തരുന്നു?

API ഓഡിയോ ശൈലിയില് സ്വതവേ നല്കുന്നു. നിങ്ങള്ക്കു് ഔട്ട്പുട്ട് ഫോര്മാറ്റ് (MP3, wav, og, ഫ്ളോക്ക്) പ്രതിരൂപം ഉപയോഗിച്ച് വ്യക്തമാക്കാം. MP3 കൂടുതല് ഓഡിയോ പ്രയോഗങ്ങള്ക്കു് ശുപാര്ശ ചെയ്യുന്നു, WAV.

യഥാര്ത്ഥ കാല TTS-കള്ക്ക് വേണ്ടി ഒരു API ഒഴുക്കിവിടാന് വല്ല ഇടവുമുണ്ടോ?

അതെ, ഞങ്ങളുടെ യു. എം.പി ഒരു ജോലി തിരിച്ചുതരുന്നു നിങ്ങള്ക്ക് ഫലങ്ങള്ക്കായി ഫോര്വേഡ് ചെയ്യുവാന് സാധിക്കുന്നു. കോക്കോറോ, ഓഡിയോ- സമയം പ്രയോഗങ്ങള്ക്ക് പിന്തുണയുള്ള മോഡ്യൂളുകള്ക്കു് വളരെ വേഗത്തിലാണു്. പ്രവര്ത്തന സജ്ജീകരിക്കുമ്പോള് ഓഡിയോ പോയിന്റിങ്ങ് യുആര്എല് തിരികെ നല്കുന്നു.

എപിഐയിലെ തെറ്റുകള് ഞാന് എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു?

API സ്റ്റാന്ഡേര്ഡ് സ്റ്റാന്ഡേര്ഡ് അവസ്ഥ കോഡുകള് നല്കുന്നു (തെറ്റായ ആവശ്യങ്ങള്ക്കായി 2400 തിരികെ നല്കുന്നു, ആപ്റ്റ് പിശകുകള്ക്കായി 401, നിരക്കുളള 429, സര്വര് പിശകുകള്ക്കായി 500.) ജോസണ് പിശകുകള്ക്കു്് നല്കേണ്ടതു്. ശരിയായി കൈകാര്യം ചെയ്യുമ്പോള് എപ്പോഴും അവസ്ഥയുടെ കോഡ് കോഡും പിശകിന്റെ ഫീള്ഡും പരിശോധിയും പരിശോധിയ്ക്കുക.

വാണിജ്യ പ്രയോഗങ്ങള്ക്കായി ഞാന് API ഉപയോഗിക്കട്ടെ?

അതെ, API വാണിജ്യ ഉപയോഗത്തിനായി തയ്യാറാക്കിയിരിയ്ക്കുന്നു. API ഉപയോഗിച്ചു് നിര്മ്മിച്ച ശബ്ദക്രമം നിങ്ങളുടെ ഉത്പന്നങ്ങള്, പ്രയോഗങ്ങള്, സേവനങ്ങള് എന്നിവയില് ഉപയോഗിക്കാം. എല്ലാ മോഡ്യൂളുകളും ഓഡിയോയില് കൂടുതല് രാജകീയങ്ങള് ലഭ്യമല്ല.

ഒരു മണല്ബോക്സ് അല്ലെങ്കില് ടെസ്റ്റ്മെന്റ് ഉണ്ടോ?

സ്വതന്ത്രമായ മോഡലുകള് (കെകോക്കോരോ, പിപ്പര്, വിഡ്ടിഎസ്, മെലോടിസ്) ഒരു മികച്ച മണല്ബോക്സ് ആയി സേവിക്കുന്നു. അവ പൂജ്യം ഉപയോഗിച്ചു് എല്ലാ അക്കൗണ്ടുകള്ക്കും ലഭ്യമാണു്. ഉല്പാദനത്തിനായി മോഡലുകള് പുനര്നിര്മ്മിക്കുന്നതിനു് മുമ്പ് നിങ്ങളുടെ ഏകീകൃത മാതൃകകള് പരിശോധിക്കുക.

API വഴി ലഭ്യമായ ശബ്ദങ്ങളും മോഡലുകളും ഞാന് എങ്ങനെ പട്ടികപ്പെടുത്തും?

ലഭ്യമായ എല്ലാ ശബ്ദങ്ങളും ഫില്റ്റര് ഐച്ഛികങ്ങള് (മോഡല്, ഭാഷ, ലിംഗം) ഉപയോഗിച്ചു് പട്ടികപ്പെടുത്താന് സിന്/v1/ modles ഉപയോഗിക്കുക. ലഭ്യമായ എല്ലാ TTS മോഡലുകള്ക്കും അവയുടെ കഴിവുകളും സ്ലേറ്റര് വിവരങ്ങളുമായി പട്ടികപ്പെടുത്താന് ഉപയോഗിക്കുക. രണ്ടു പോയിന്റുകള്ക്കും JOSONs മറുപടി നല്കുന്നു.

TTS.ai API സഹായക്കുറിപ്പുകള്‍ - സംസാരത്തിലേക്കുള്ള പദാവലി

പരിശോധിയ്ക്കുക

TTS.ai API പ്രോഗ്രാം എല്ലാ പ്ലാറ്റ്ഫോമിലുള്ള മണ്ഡലങ്ങളിലും സാങ്കേതികമായ പ്രവേശനം ലഭ്യമാക്കുന്നു: ലേഖന- വായനാ- വായനാ- ശബ്ദ- വാക്യം, ശബ്ദസംഭരണി, ശബ്ദത്തിന്റെ വര്‍ദ്ധന, ശബ്ദത്തിന്റെ കൂടുതല്‍ വര്‍ദ്ധനവ്, കൂടുതല്‍. API ജോസണ്‍/ response commanages- ല്‍ regrap settings.

API കീ

നിങ്ങളുടെ API കീ ഇവിടെ നിന്നും എടുക്കുക അക്കൌണ്ടിന്റെ സജ്ജീകരണങ്ങള്‍. പ്രൊ ആൻഡ്‌ എൻസൈക്ലോപീഡിയ പദ്ധതികളിൽ ലഭ്യമാണ്.

അടിസ്ഥാന യുആര്‍എല്‍

https://api.tts.ai/v1/

അഥ്

ബീറ്റര്‍ അടയാളം വഴി Authorization ഹെഡ്ഡര്‍

ആധികാരകത ഉറപ്പുവരുത്തല്‍

ഫ്രീ ടൈപ്പർ — താക്കോൽ ആവശ്യമില്ല. അപരിമേയൻ സ്‌പോർട്‌സ്‌ /v1/tts/ ഒരു ഔട്ട് ഇല്ലാതെ ജോലി ചെയ്യുക, ഒരു ഐപി/ഡേ വരെ 5,000 അക്ഷരങ്ങള്‍, നമ്മുടെ സ്വമേധയാ മോഡലുകള്‍, (piper, vits, melotts, kokoro). 15,000 ബോണസ്‌ ക്യാരക്ടറുകളും മോണിറ്ററുകളും ലഭ്യമാകുന്നതിന്‌ ഒരു സ്വതന്ത്ര അക്കൗണ്ട് അക്കൗണ്ട് എടുക്കുക.

മുന്‍കരുതല്‍ മോഡ്യൂളുകള്‍ക്കും ഉയര്‍ന്ന നിരക്കുകള്‍ക്കും, ഒരു കരടിന്‍ സൂചകം നല്‍കുന്ന സൂചകത്തില്‍ ആധികാരികത ഉറപ്പാക്കുക Authorization ഹെഡ്ഡര്‍.

എച്ച്ടിടിപി തലക്കെട്ട്

Authorization: Bearer sk-tts-your-api-key-here

നിങ്ങളുടെ എപിഐ കീ രഹസ്യം സൂക്ഷിക്കണം. ക്ലയന്റ്- പാര്‍ട്ടി കോഡ്, പൊതു ശേഖരം, അല്ലെങ്കില്‍ ലോഗുകള്‍ എന്നിവയില്‍ ഇത് പങ്കു വെക്കരുത്. നിങ്ങളുടെ അക്കൌണ്ടിന്റെ ക്രമീകരണങ്ങളില്‍ നിന്നും കീകള്‍ ക്രമമായി കറക്കുക.

എസ്ഡികെസ്Comment

ഔദ്യോഗിക SDKs നിങ്ങളുടെ പ്രയോഗത്തില്‍ TTS.ai ലഭ്യമാക്കാന്‍ എളുപ്പമാക്കുന്നു. രണ്ടും തുറന്ന ഉറവിടങ്ങളാണ്, ഗിറ്റ്ഹബ്-ല്‍ ലഭ്യമാണ്.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

അടിസ്ഥാന യുആര്‍എല്‍

അടിസ്ഥാന യുആര്‍എല്‍: https://api.tts.ai/v1/

ഈ അടിസ്ഥാന യുആര്‍എല്ലിനോടുള്ള ബന്ധമാണു് എല്ലാ അവസാന പോയിന്റ്കളും. ഉദാഹരണമായി TTS അവസാനബിന്ദു:

POST https://api.tts.ai/v1/tts/

പരിധികള്‍

പദ്ധതിയില്‍ API നിരക്കില്‍ വ്യത്യാസം ഉണ്ട്:

പദ്ധതി	ആവശ്യങ്ങള്‍/നിവര്‍ത്തി	കോണ്‍സ്റ്റന്റ്	ഏറ്റവും കൂടിയ ടെക്സ്റ്റ് ദൈര്‍ഘ്യം
ഫ്രീ	10	2	500 അക്ഷരങ്ങള്‍
ആരംഭകന്‍	30	3	10 ലക്ഷം കിലോഗ്രാം
പ്രൊഫൈല്‍	60	5	10 ലക്ഷം കിലോഗ്രാം
ഇന്‍റര്‍നാഷണല്‍	300	20	50,000 അക്ഷരങ്ങള്‍

എല്ലാ മറുപടിയിലും റേറ്റ് തലക്കെട്ടുകള്‍ ഉള്‍‌ക്കൊള്ളുന്നു: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

കടങ്ങൾ

സേവനം	വില	യൂണിറ്റ്
ടിടിഎസ് (ഫ്രീ മോഡല്‍: Pyper, VITS, മെലോട്ടിക്സ്)	1,000 അക്ഷരങ്ങള്‍	1,000 അക്ഷരങ്ങള്‍ക്കു്
ടിടിഎസ് (സാര്‍ഡ് മോഡല്‍: കോക്കോറോ, കൊസിവ്യൂസ് 2 [.])	2,000 അക്ഷരങ്ങള്‍	1,000 അക്ഷരങ്ങള്‍ക്കു്
TTS (പെരിമിയം മോഡല്‍: ടോര്‍ട്ടോയിസ്, ചാറ്റര്‍ബോക്സ്, എന്നിവ.)	4,000 അക്ഷരങ്ങള്‍	1,000 അക്ഷരങ്ങള്‍ക്കു്
പദാവലിയുമായുള്ള സംസാരം	2,000 അക്ഷരങ്ങള്‍	ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദ ക്ളൈനിങ്ങ്	4,000 അക്ഷരങ്ങള്‍	1,000 അക്ഷരങ്ങള്‍ക്കു്
ശബ്ദം മാറ്റുന്നയാള്‍	3,000 അക്ഷരങ്ങള്‍	ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്‍Name	2,000 അക്ഷരങ്ങള്‍	ഒരു മിനിറ്റ് ഓഡിയോയില്‍
വോള്‍ഡ്ലോഡ് / സ്റ്റാം വിരിയല്‍	3,000- 3,000 അക്ഷരങ്ങള്‍	ഒരു മിനിറ്റ് ഓഡിയോയില്‍
സംസാരപരിഭാഷName	5,000 അക്ഷരങ്ങള്‍	ഒരു മിനിറ്റ് ഓഡിയോയില്‍
ശബ്ദം സല്ലാപം	3,000 അക്ഷരങ്ങള്‍	ഒരു ഊഴത്തില്‍
കീ & BPM തിരയല്‍	ഫ്രീ	--
ശബ്ദമാറ്റംName	ഫ്രീ	--

സംസാരത്തിനുള്ള വാചകം

POST /v1/tts/

വാചകം സംസാരസഞ്ചയത്തിലേക്കു് മാറ്റുക. ആവശ്യപ്പെട്ട ഫയലില്‍ ഓഡിയോ ഫയല്‍ തിരിച്ചുവിടുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
model	string	ഇല്ല	മോഡല്‍ ID (e.e., >, Please>, `>-ന് പിന്തുണക്കുന്ന ഒരു മോഡ് നിര്‍മ്മിക്കുകയാണ്. -ന് സിന്‍കോഡ് /jode/java/deve=/je===', മറ്റു ഭാഷകള്‍ക്ക്`
text	string	അതെ	സംസാരത്തിലേക്കു് മാറ്റേണ്ട പദാവലി. പ്രൊ- റൈറ്റ് അപ്പ്: 500 അക്ഷരങ്ങള്‍ (നമ്മള്‍), 5,000 അക്ഷരങ്ങള്‍ (സ്വയമായ അക്കങ്ങള്‍), 10 ലക്ഷം (പൈഡ് പദ്ധതി). നീണ്ട ഇന്‍പുട്ടുകള്‍ യാന്ത്രിക സര്‍വറിന്‍റെ ഭാഗമാണ്.
voice	string	അതെ	ശബ്ദത്തിന്റെ ഐഡി ( /v1/sumber/ ലഭ്യമാകുന്ന ശബ്ദങ്ങള്‍ ലിസ്റ്റില്‍ ഉപയോഗിക്കുക)
format	string	ഇല്ല	ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: (default), , ,
speed	float	ഇല്ല	വേഗത വര്‍ദ്ധിപ്പിക്കുന്നു. സ്വതവേയുള്ള: .0 > <`>> <`
language	string	ഇല്ല	ഭാഷാ കോഡ് (e.g., ), , . ഉപേക്ഷിച്ചാല്‍ ഓട്ടോ-തെരഞ്ഞെടുക്കുന്നു.
instructions	string	ഇല്ല	പ്രവര്‍ത്തിപ്പിക്കുന്ന/ റിലേഡ് ചെയ്യുന്ന ക്യുകള്‍ (ടിആര്‍എല്‍ അക്ഷരങ്ങള്‍). ഉദാ. \
pronunciations	object \| array	ഇല്ല	പ്രൊ- റിഗ്രഷന്‍ ഉച്ചാരണം മുന്‍ഗണനകള്‍. അല്ലെങ്കില്‍ [\]
stream	boolean	ഇല്ല	സ്റ്റ്രീമിലെ മറുപടി പ്രവര്‍ത്തന സജ്ജമാക്കുക. സഹജമായി:

ഉദാഹരണ അപേക്ഷ

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

എസ്എസ്എംഎല്‍ തൊങ്ങലുകള്‍

പൊതിക്കെട്ട് നമ്പര്‍, തീയതികള്‍, നാണയം, ഫോണ്‍ നമ്പര്‍, അക്രോണിംകള്‍ എന്നിവ -say-as this=\-ന്‍റെ കോഡിങ് നമ്പര്‍, നമ്പര്‍, ഫോണ്‍ നംബര്‍, അക്രോണിമുകള്‍ എന്നിവയില്‍

അര്‍ത്ഥങ്ങള്‍	ഇന്‍പുട്ട്	എക്സിക്യൂട്ടിവ് പോലെ
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ഡിസംബറിൽ മുപ്പത്തൊമ്പത്‌, തൊണ്ണൂറ്റൊമ്പത്‌
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A

തീയതി ഫോര്‍മാറ്റ് _Comde>, ഇംഗ്ലീഷ് ಗಾಗಿ >, മറ്റൊരിടത്തേക്ക് ഡീഫോള്‍ട്ട് ചെയ്യുക; =\

ഉദാഹരണം

{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

മറുപടി

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)

{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)

{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}

Polling response (still processing)

{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

പൂര്‍ണ്ണമായ ഉദാഹരണം

Python

import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

പദാവലിയുമായുള്ള സംസാരം

POST /v1/stt/

ഓഡിയോ ടെക്സ്റ്റിലേക്ക് പകര്‍ത്തുക. തനിയെയുള്ള 99 ഭാഷകള്‍ പിന്തുണയ്ക്കുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
file	file	അതെ	ഓഡിയോ ഫയല്‍ (എംപി3, WAV, OGG, MGA, MP4, വെബ്M. Max 100MB)
model	string	ഇല്ല	STD മോഡ്: (default), ,
language	string	ഇല്ല	ഭാഷാ കോഡ്. യാന്ത്രികമായ/കോഡ് ചെയ്യാന്‍ '%s'. default-default (default)
timestamps	boolean	ഇല്ല	വാക്കുകളുടെ തലകെട്ടുകള്‍ ഉള്‍പ്പെടുത്തുക. സ്വതവേയുള്ള: folder>
diarize	boolean	ഇല്ല	സ്പര്‍ട്ടര്‍ ഡയറേഷന്‍ പ്രാവര്‍ത്തികമാക്കുക. സ്വതവേയുള്ള: false/കോഡ് ചെയ്യുക>

മറുപടി

ജോസണ്‍ മറുപടി

{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

ശബ്ദ ക്ളൈനിങ്ങ്

POST /v1/tts/clone/

വിപരീത ശബ്ദത്തില്‍ സംസാരം ഉണ്ടാക്കുക. ഒരു റിഫേഴ്സ് ഓഡിയോയും പദാവലിയും അപ്‌ലോഡ് ചെയ്യുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
reference_audio	file	അതെ	റഫറന്‍സ് ഓഡിയോ (10-30 സെക്കന്‍ഡുകള്‍) ശുപാര്‍ശ ചെയ്തു. മാക്സ് 20MB.
text	string	അതെ	ക്ലോണ്‍ഡ് ശബ്ദത്തില്‍ സംസാരിക്കാന്‍ ടെക്സ്റ്റ്.
model	string	ഇല്ല	ക്ലോണ്‍ മോഡ്: chatlebox (default), ,
format	string	ഇല്ല	ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: /കോഡ്> (default), , /കോഡ് ചെയ്യുക
language	string	ഇല്ല	ലക്ഷ്യ‌‌ഭാഷാ കോഡ്. തെരഞ്ഞെടുത്ത മോഡ് പിന്തുണയ്ക്കണം.

മറുപടി

ശബ്ദ ഫയല്‍ TTS അവസാന പോയിന്റ് പോലെ ബൈനറി ഡാറ്റയായി തിരിച്ചുവിടുന്നു.

ശബ്ദം മാറ്റുന്നയാള്‍

POST /v1/voice-convert/

മറ്റൊരു ശബ്ദം പോലെ ഓഡിയോ ശബ്ദത്തിലേക്കു് ശബ്ദമുണ്ടാക്കുക. ശ്രോതസ്സ് ഓഡിയോ അപ്ഗ്രേഡ് ചെയ്തു് ലക്ഷ്യ‌‌ശബ്ദം തെരഞ്ഞെടുക്കുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
file	file	അതെ	സോഴ്സ് ഓഡിയോ ഫയല്‍ (MP3, WAV, FLAC). മാക്സ് 50MB.
target_voice	string	അതെ	മാറ്റേണ്ട ലക്ഷ്യ‌ത്തിന്റെ ID ( /v1/rues/ ലഭ്യമാകുന്ന ശബ്ദങ്ങളുടെ പട്ടികയില്‍ സിന്‍ക് ചെയ്യുക)
model	string	ഇല്ല	ശബ്ദം മാറ്റം വരുത്തല്‍ മാതൃക: OpenPGen (default),
format	string	ഇല്ല	ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: (default), , `/കോഡ് ചെയ്യുക`

ഉദാഹരണ അപേക്ഷ

cURL

curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

മറുപടി

മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല്‍ ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.

സംസാരപരിഭാഷName

POST /v1/speech-translate/

ഒരു ഭാഷയില്‍ നിന്നും മറ്റൊരു ഭാഷയിലേക്കു് ശബ്ദമിശ്രണോപാധികള്‍ പരിഭാഷപ്പെടുത്തുക. സംസാരം, പരിഭാഷ, പദാവലി എന്നിവ ഒരേ കോളില്‍ ചേര്‍ക്കുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
file	file	അതെ	യഥാര്‍ത്ഥ ഭാഷയില്‍ ഓഡിയോ ഫയല്‍. മാക്സ് 100എം.
target_language	string	അതെ	ലക്ഷ്യ ഭാഷാ കോഡ് (e.g., , , , ,
voice	string	ഇല്ല	പരിഭാഷപ്പെടുത്തിയിരിക്കുന്ന ഔട്ട്പുട്ടിനുള്ള ശബ്ദം. വേണ്ടെങ്കില്‍ സ്വയം തെരഞ്ഞെടുത്തതാണു്.
preserve_voice	boolean	ഇല്ല	യഥാര്‍ത്ഥ സ്പീക്കറിന്‍റെ ശബ്ദ വിശേഷതകള്‍ സംരക്ഷിക്കുവാന്‍ ശ്രമിക്കുന്നു. സ്വതവേയുള്ള: confault/code>

മറുപടി

ജോസണ്‍ മറുപടി

{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

സംസാരം

POST /v1/speech-to-speech/

വസ്‌തുവകകൾ സൂക്ഷിക്കുമ്പോൾ സംസാരരീതി, വികാരങ്ങൾ, പ്രസവപ്പെടുത്തൽ എന്നിവ രൂപാന്തരപ്പെടുത്തുക.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
file	file	അതെ	സോഴ്സ് ഓഡിയോ ഫയല്‍. മാക്സ് 50MB
voice	string	അതെ	ഔട്ട്പുട്ട് സംസാരത്തിനുള്ള ലക്ഷ്യമായ ശബ്ദ ഐഡി
model	string	ഇല്ല	മോഡല്‍: OpenPread (default), >
emotion	string	ഇല്ല	ലക്ഷ്യ‌‌: ,
speed	float	ഇല്ല	വേഗതയില്‍ പൊരുത്തപ്പെടുത്തല്‍. സ്വതവേയുള്ള: 1.0 <. പരിധി: >> <`> <>>`

മറുപടി

മാറ്റം വരുത്തിയ ഓഡിയോ ഫയല്‍ ബൈനറി ഡേറ്റായായി തിരിച്ചുവിടുന്നു.

ഓഡിയോ ഉപകരണങ്ങള്‍

ശബ്ദത്തിന്‍റെ ഗുണമേന്മയ്‌ക്കു വേണ്ടിയുള്ള ഓഡിയോ അറ്റകുറ്റപ്പണികൾ, ശബ്ദനഷ്ടം, ബ്രിഡ്‌ജ്‌, ബ്രിഡ്‌ജ്‌ വിച്ഛേദം എന്നിവയ്‌ക്കു വേണ്ടിയുള്ളവയാണ്‌.

POST /v1/audio/enhance/

ഓഡിയോ ഗുണമേന്മ മെച്ചപ്പെടുത്തുക: ഡീനോയിസ്, വ്യക്തമാക്കുക, സൂപ്പര്‍ റെഡിഫ്യൂഷന്‍ മെച്ചപ്പെടുത്തുക.

file file	വര്‍ദ്ധിപ്പിക്കുന്നതിനായി ഓഡിയോ ഫയല്‍
denoise boolean	മറോയിസിങ്ങ് പ്രാവര്‍ത്തികമാക്കുക (സഹജമായി: ശരി)
enhance_clarity boolean	ലളിതമായ സംസാരം (സഹജം: ശരി) Name
super_resolution boolean	മുകളിലേക്ക് ഓഡിയോ ഗുണമേന്മ (സഹജം: തെറ്റ്)
strength integer	1- 3 (വെളിച്ച, മാധ്യമത്തില്‍, ശക്തം). സഹജമായ: 2

POST /v1/audio/separate/

എഞ്ചിനീയറുകളില്‍ നിന്ന് (വലിയ നീക്കം) അല്ലെങ്കില്‍ ഞെട്ടലായി പിളരുക.

file file	വേര്‍പെടുത്തുന്നതിനായി ഓഡിയോ ഫയല്‍
model string	`demucs` (സഹജമായ) അല്ലെങ്കില്‍ `spleeter`
stems integer	മൂലകങ്ങളുടെ എണ്ണം: 2, 4, 5, 6 (default: 2)
format string	ഔട്ട്പുട്ട് ഫോര്‍മാറ്റ്: , >> > >>, >

POST /v1/audio/dereverb/

ഓഡിയോ റെക്കോര്‍ഡുകളില്‍ നിന്നും ആവര്‍ത്തിക്കുക.

file file	പാകപ്പെടുത്താനുള്ള ഓഡിയോ ഫയല്‍
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

POST /v1/audio/analyze/ ഫ്രീ

കീ, BPM, ടൈം ഒപ്പു് എന്നിവ കണ്ടുപിടിക്കുന്നതിനായി ഓഡിയോ വിവരങ്ങള്‍ പരിശോധിയ്ക്കുക.

file file

വിശകലനം ചെയ്യാനുള്ള ഓഡിയോ ഫയല്‍

മറുപടി

{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}

POST /v1/audio/convert/ ഫ്രീ

ഓഡിയോ ഫോര്‍മാറ്റുകള്‍ തമ്മില്‍ മാറ്റുക.

file file	മാറ്റേണ്ട ശബ്ദ ഫയല്‍
format string	ലക്ഷ്യ‌‌‌ക്രമം: /കോഡ് , > >, , `,`
bitrate integer	ഔട്ട്പുട്ട് ബിറ്റ്‌വെയര്‍ kbsp: 64, 128, 192, 256, 320
sample_rate integer	സാമ്പിളിന്റെ നിരക്ക്: 22050, 44100, 48000
channels string	`mono` അല്ലെങ്കില്‍ `stereo`

ശബ്ദം സല്ലാപം

POST /v1/voice-chat/

ഓഡിയോ അല്ലെങ്കില്‍ പാഠങ്ങള്‍ അയക്കുക. ശബ്ദസങ്കലമായ സംസാരത്താല്‍ AI മറുപടി ലഭിക്കുന്നു.

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data അല്ലെങ്കില്‍ JSON)

ആവശ്യമുണ്ട്)
പരാമീറ്റര്‍	തരം	ആവശ്യമുണ്ട്	വിവരണം
audio	file	ഇല്ല*	ഓഡിയോ ഇന്‍പുട്ട് (ഐച്ഛികമായി സിന്‍ക് അല്ലെങ്കില്‍ അല്ലെങ്കില്‍ `ആവശ്യമുണ്ട്)`
text	string	ഇല്ല*	വാചകത്തിനുള്ള ഇന്‍പുട്ട് (തെറ്റായത് അല്ലെങ്കില്‍ അല്ലെങ്കില്‍
voice	string	ഇല്ല	AI മറുപടിയുടെ ശബ്ദം. സ്വതവേയുള്ള:
tts_model	string	ഇല്ല	മറുപടിയുടെ TTS മാതൃക. സ്വതവേയുള്ള:
system_prompt	string	ഇല്ല	ആവശ്യമുളള സിസ്റ്റം AI- നായി ആസൂത്രണം ചെയ്യുക
conversation_id	string	ഇല്ല	നിലവിലുള്ള ഒരു വര്‍ത്തമാനം തുടരുക

മറുപടി

ജോസണ്‍ മറുപടി

{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

ട്രെഡിസ്‌

POST /v1/tts/batch/

TTS തനത് തലമുറയ്ക്കായി അനവധി പാഠങ്ങള്‍ സമര്‍പ്പിക്കുക. എല്ലാ ജോലികളും പൂര്‍ത്തിയാകുമ്പോള്‍ ഒരു വെബ് കൊളുത്ത് ബാക്ക് സ്വീകരിക്കുക.

പരാമീറ്ററുകള്‍

പരാമീറ്റര്‍	തരം	വിവരണം
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	ബാക്കപ്പ് പൂര്‍ത്തിയാക്കിയാല്‍ പോസ്റ്റ് യുആര്‍എല്‍ ഫലം തെരഞ്ഞെടുക്കാം.

മറുപടി

ജോസണ്‍ മറുപടി

{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

Poll progress with GET /v1/tts/batch/result/?batch_id=abc123

എംബഡ്ഡിംഗ് ശബ്ദം

POST /v1/voice-embed/

ഒരു ശബ്ദത്തിന്റെ മുന്‍‌കൂര്‍ ഓഡിയോയില്‍ നിന്നും നീക്കം ചെയ്യുക. പിന്നീടു് കണ്‍സോളിന്‍റെ അപേക്ഷകള്‍ അടുത്തുള്ള അഭ്യര്‍ത്ഥനകളില്‍ തിരികെ നല്‍കിയ അഡ്മിനിസ്ട്രേറ്റ് _ഐഡി ഉപയോഗിക്കുക.

പരാമീറ്ററുകള്‍

പരാമീറ്റര്‍	തരം	വിവരണം
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

മറുപടി

ജോസണ്‍ മറുപടി

{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

ആരോഗ്യപരിപാടി

GET /v1/health/

GPU സര്‍വര്‍ അവസ്ഥ പരിശോധിക്കുക, മോഡിഫയര്‍, വരിയുടെ വലിപ്പം എന്നിവ ലോഡ് ചെയ്യുക. ഒരു ആധികാരികതയും ഇല്ല. കാഷ് 30 സെക്കന്‍ഡുകള്‍ക്കുള്ളവ.

മറുപടി

ജോസണ്‍ മറുപടി

{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

പട്ടിക മോഡലുകള്‍

GET /v1/models/

ലഭ്യമായ എല്ലാ മോഡലുകള്‍ക്കും അവയുടെ കഴിവുകള്‍ നല്‍കുന്നു.

മറുപടി

ജോസണ്‍ മറുപടി

{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

ലിസ്റ്റിന്‍റെ ശബ്ദങ്ങള്‍

GET /v1/voices/

ലഭ്യമായ എല്ലാ ശബ്ദങ്ങളുടെയും പട്ടിക വീണ്ടും കൊണ്ടുവരുന്നു, സാമ്പിള്‍ അല്ലെങ്കില്‍ ഭാഷയനുസരിച്ചു് ഫില്‍റ്റര്‍ ചെയ്തിരിയ്ക്കുന്നു.

ചോദ്യമിശ്രണോപാധികള്‍

പരാമീറ്റര്‍	തരം	വിവരണം
model	string	മാതൃകയുടെ ഐഡി അനുസരിച്ച് ഫില്‍‌റ്റര്‍ (ഉദാ, കോഡ്‌കോറോ )
language	string	ഭാഷാ കോഡ് ഫില്‍‌റ്റര്‍ (ഉദാ., )
gender	string	ലിംഗത്താല്‍ ഫില്‍‌റ്റര്‍: , , ,

മറുപടി

ജോസണ്‍ മറുപടി

{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

സബ്ടൈറ്റുകള്‍ (എസ്ആര്‍ടി / വിടിടി) പുതിയ

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

പൂര്‍ത്തിയാക്കിയ ടിടിഎസ് ജോലിക്ക് സമീകരിക്കപ്പെട്ട സബ്ടൈറ്റുകള്‍ നിര്‍മ്മിക്കുക. ശബ്ദക്രമത്തില്‍ Whisper ഓഡിയോ അല്ലെങ്കില്‍ WRTT അല്ലെങ്കില്‍ WevTT നല്‍കുന്നു. ഫലം ഡിസ്കില്‍ കാഷിങ് നല്‍കുന്നു അതുകൊണ്ട് അതേ യൂഐഡിനായുള്ള രണ്ടാമത്തെ കോള്‍ ഡിസ്കില്‍ ലഭ്യമാകുന്നു.

ചോദ്യമിശ്രണോപാധികള്‍

പരാമീറ്റര്‍	ആവശ്യമുണ്ട്	വിവരണം
uuid	അതെ	JOBUPUNI /v1/tts/അല്ലെങ്കില്‍ /v1/sublicon/icons.
format	ഇല്ല	(default) അല്ലെങ്കില്‍ >.
download	ഇല്ല	>>Content-Discment> അയയ്ക്കുന്നതിനായി : അറ്റാച്മെന്‍റ് അങ്ങനെ ബ്രൌസര്‍ ദൃശ്യങ്ങള്‍ക്കു് പകരം സൂക്ഷിക്കുന്നു.
language	ഇല്ല	ക്രമീകരിക്കല്‍ മോഡലിനു് സൂചന. (സ്വയം-നോക്കിക്കൊടുത്താല്‍ മതി).

cURL

curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

ഉച്ചാരണം നിഘണ്ടുQuery പുതിയ

GET POST DELETE /api/v1/pronunciations/

TTS എഞ്ചിന്‍ പറയൂ. ഓരോ TTS-നും നിങ്ങള്‍ ആവശ്യമുളള രീതിയില്‍ സ്വയം സൂക്ഷിക്കപ്പെട്ട എന്‍ട്രികള്‍. ഒരു കോംകൌണ്ട് പരിധിയില്‍.

അഭ്യര്‍ത്ഥനാ ശരീരം (POST)

translate> -ന്‍റെ കാര്യത്തില്‍ പൊരുത്തമുണ്ടു്.
പരാമീറ്റര്‍	തരം	വിവരണം
word	string	മറിച്ചുകളയാനുള്ള വാക്ക് (e.g: GIF , . വാക്ക്-ന് അനുബന്ധിച്ചിട്ടുണ്ട്.
replacement	string	മാതൃകയ്ക്കായി അതെങ്ങനെ രഹസ്യഭാഷയിലാക്കണമെന്ന് (ഉദാ., , ).
language	string	ഐഎസ്ഒ കോഡ്. ശൂന്യം = എല്ലാ ഭാഷകള്‍ക്കും ബാധകമാണ്.
case_sensitive	boolean	ഡീഫോള്‍ട്ട് .

cURL

# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

സംരക്ഷിക്കാതെ നിങ്ങള്‍ക്ക് ഓരോ റിക്കോര്‍ഡ് റാന്‍ഡര്‍കളും പാസ് ചെയ്യുവാന്‍ സാധിക്കുന്നു — ഏതെങ്കിലും /v1/tts/tits ല്‍ നിന്നും ഒരു വസ്തു അല്ലെങ്കില്‍ ഒരു അഗ്രകോടിയായി വിളിയ്ക്കുന്നു. (ടിഎസ് ഫോര്‍മെന്റ് പാരസുകള്‍ കാണുക)

ലേഖനം നിരീക്ഷകന്‍ പുതിയ

ഒരു എല്ലാ ലേഖനത്തിലുമുള്ള കോഡിങ്ങ് ടാഗില്‍ ഞൊട്ടുമ്പോള്‍ ഞൊട്ടുന്ന ഒരു സ്ഥിരമായ റീഡര്‍ ബാര്‍ ലഭ്യമാകുന്നു. ഈ ലേഖന ശരീരത്തെ സ്വയം നീക്കം ചെയ്യുന്നു, യാന്ത്രികമായ ശബ്ദം / മാതൃക / ഇന്‍ഫ്യൂട്ട് നിറം പിന്തുണയ്ക്കുന്നു.

HTML

<script src="https://tts.ai/narrator.js"
    data-pk="pk-tts-your-publishable-key"
    data-voice="af_bella"
    data-model="kokoro"
    data-extract="auto"
    data-position="bottom"
    data-color="#e60000"
    data-locale="en"></script>

ഐച്ഛികങ്ങള്‍

-ന്‍റെ കോഡിങ് .
പരാമീറ്റര്‍	വിവരണം
`data-pk`	പ്രസദ്ധീകരിക്കാവുന്ന കീ (pk-ts-...). മണ്ഡലത്തിന്‍റെ മണ്ഡലം പാസ്‍വേര്‍ഡ്_doemains ഫീള്‍ഡ് വഴി ലഭ്യമാക്കുന്നു.
`data-voice`	നെറ്റ്‌വര്‍ക്ക് ID. സ്വതവേയുള്ള .
`data-model`	TTS മാതൃകാ ഐഡി. സ്വതവേയുള്ള .
`data-extract`	അല്ലെങ്കില്‍ ഒരു പ്രത്യേക എലമെന്‍റ് ലക്ഷ്യ‌ത്തിലേക്ക് CSS തെരഞ്ഞെടുപ്പ് നടത്താന്‍ ഏതെങ്കിലും CSS തെരഞ്ഞെടുപ്പ് നടത്തുക.
`data-position`	> (default) അല്ലെങ്കില്‍
`data-color`	കണ്‍സ്ട്രക്ടര്‍ നിറം (ഏതു CSS നിറം). സ്വതവേയുള്ള
`data-min-chars` / `data-max-chars`	ലേഖനം min- പാര്‍ഡുകളില്‍ കുറവാണെങ്കില്‍ ബാര്‍ ഉപേക്ഷിക്കുക (സ്വന്തം 200). മാക്സ്-പാര്‍ഡുകളില്‍ ക്യാപ് അപ്പ് (ഡീഫോള്‍ട്ട് 50,000).

ഗിറ്റ് ഹബ്-ല്‍ ഉറവിടം: < ahref=\

ബട്ടണിന്റെ വിഡ്ജറ്റ് കേള്‍ക്കുക

> എന്നതില്‍ നിന്നും ക്ളൈന്‍റ് ചെയ്തു് ഒരു ചെറിയ ചെറിയ സ്നിപ്പെറ്റ് പ്രവര്‍ത്തിപ്പിയ്ക്കുന്നു. മേല്‍ വിലാസപത്രത്തില്‍ നിന്നും (ഇതില്‍ ഒരു താള്‍ പാസ്പോര്‍ട്ട് ബാര്‍ ലഭ്യമാക്കുന്ന-ഉപയോഗിയും വിവരണങ്ങള്‍ നിര്‍മ്മിക്കുന്നു).

HTML

<script src="https://tts.ai/widget.js"
    data-voice="af_bella"
    data-model="kokoro"
    data-style="full"
    data-theme="light"></script>

സൂക്ഷിച്ച ശബ്ദങ്ങള്‍ (പെസ്റ്റന്റ് ക്ലോണ്‍സ്)

ഒരിക്കല്‍ ഒരു റിക്കോര്‍ഡ് ഓഡിയോ അപ്‌ലോഡ് ചെയ്യുക, ഒരു സ്ഥിരമായ ശബ്ദ_ ID തിരിച്ചു് വീണ്ടും ചേര്‍ക്കുക, ഓരോ വിളിയും വീണ്ടും ലഭ്യമാക്കുന്നതിനു പകരം TTS ക്യാരക്റ്റില്‍ ഐഡിയുടെ ഐഡി സൂചിപ്പിക്കുക. ഉയര്‍ന്നുവരുന്ന നിരീക്ഷകതകള്‍ക്കു് അനുയോജ്യമായിരിക്കുന്നു.

പ്രൊഫൈല്‍: ശേഖരം സ്വതന്ത്രമാണ് (ഓരോ ദിവസവും വാടകയ്ക്കുന്നില്ലെങ്കില്‍). ഒരു ശബ്ദത്തില്‍ 500 അക്ഷരങ്ങള്‍ കൂടി ചേര്‍ക്കുക: ഒരു ശബ്ദത്തില്‍ 500 അക്ഷരങ്ങള്‍ ചേര്‍ത്ത് ചേര്‍ക്കുക. ഓരോ TTS അക്ഷരത്തിനും + 50 അക്ഷരങ്ങള്‍ ചേര്‍ത്തിരിക്കുന്നു. അവ രക്ഷപെട്ട തലമുറയുടെ വിലയില്‍ കൂടുതല്‍ ഉള്‍പ്പെട്ടിരിക്കുന്നു. ആര്‍ക്കോണ്‍ ശബ്ദത്തിന്റെ ശബ്ദങ്ങള്‍ ഇപ്പോള്‍ ശാന്തമായി സൂക്ഷിക്കേണ്ട ആവശ്യമില്ല. ഏതു സമയത്തും ഒരു സ്വതന്ത്രമായ വിളിയും നടത്തുക.

ശബ്ദം അപ്ലോഡ് ചെയ്യുക

POST https://tts.ai/api/v1/user-voices/ Auth ആവശ്യമുണ്ട്

മള്‍ട്ടിപാര്‍ട്ട് ഫോള്‍ഡറുകള്‍. ഫീള്‍ഡുകള്‍: ഫയല്‍ (തെറ്റായതു്, 5- 30 ഓഡിയോ), ഭാഷ (വേര്‍ഡ്), മാതൃക, മോഡല്‍ (ഐച്ഛികം), zH/J/കോ ഓപ്പണ്‍-ഓപ്പണ്‍ (സാധാരണ), സമ്മതിയ്ക്കുക (ഏതെങ്കിലും സത്യമൂല്യം).

curl -X POST https://tts.ai/api/v1/user-voices/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@reference.wav" \
  -F "name=My Narrator" \
  -F "language=en" \
  -F "consent_confirmed=true"

# Response:
{
  "public_id": "uv_a1b2c3d4e5f6",
  "id": 42,
  "name": "My Narrator",
  "model_name": "openvoice",
  "language": "en",
  "reference_audio_url": "https://tts.ai/media/user-voices/....wav",
  "storage_status": "active",
  "created_at": "2026-04-17T03:45:00+00:00"
}

ടിടിഎസ്- യില്‍ സൂക്ഷിച്ചിരിക്കുന്ന ശബ്ദം ഉപയോഗിക്കുക

/api/v1/tts/ (NOTY: വെബ്‌പിസ് ഹോസ്റ്റും, ഉപയോക്താവിന്റെ_ pass. txts. id അല്ല. ഞങ്ങള്‍ നിങ്ങള്‍ സൂക്ഷിച്ചിരിക്കുന്ന ഓഡിയോയും വഴിയും ടോഗിള്‍ പൈപ്പറ്റിലേക്ക് ചേര്‍ക്കുന്നു.

curl -X POST https://tts.ai/api/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'

# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.

പട്ടിക / നീക്കം ചെയ്യുക

GET    https://tts.ai/api/v1/user-voices/           # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6

ശേഖരം / വീണ്ടും പ്രവര്‍ത്തന സജ്ജമാക്കുക (ഫ്ളാഷ്)

ആര്‍ക്കൈവ് ചെയ്ത ശബ്ദം നിങ്ങളുടെ അക്കൌണ്ടില്‍ തന്നെയുണ്ട്, പക്ഷേ ടിടിഎസ്-യില്‍ ഉപയോഗിക്കാന്‍ കഴിയില്ല. നിര്‍ജ്ജീവമായ ഉപയോക്താക്കള്‍ക്ക് ഉപയോഗപ്രദമാണ്. അതുകൊണ്ട് നിങ്ങളുടെ പട്ടിക വൃത്തിയായി തുടരുന്നു.

POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/

കോഡ് ഉദാഹരണങ്ങള്‍

സംസാരത്തിനുള്ള വാചകം

പൈത്തണ്‍ - അപേക്ഷകള്‍

import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

പദാവലിയുമായുള്ള സംസാരം

പൈത്തണ്‍ - അപേക്ഷകള്‍

# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

ശബ്ദ ക്ളൈനിങ്ങ്

പൈത്തണ്‍ - അപേക്ഷകള്‍

# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

സംസാരത്തിനുള്ള വാചകം

ജാവാസ്ക്രിപ്റ്റ് - എടുക്കുക

const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

പദാവലിയുമായുള്ള സംസാരം

ജാവാസ്ക്രിപ്റ്റ് - എടുക്കുക

// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

സംസാരത്തിനുള്ള വാചകം

cURL

# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

പദാവലിയുമായുള്ള സംസാരം

cURL

# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

ശബ്ദ ക്ളൈനിങ്ങ്

cURL

# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്‍Name

cURL

# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

പിശകിന്റെ കോഡ്

എല്ലാ പിശകുകളും ഒരു ജോണ്‍ മറുപടിയായി നല്‍കുന്നു error ഫീൽഡ്.

പിശകിന്റെ മറുപടിയുടെ ഫോര്‍മാറ്റ്

{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough characters for this request.",
    "characters_required": 4000,
    "characters_available": 2000
  }
}

എച്ച്ടിടിപി സ്ഥിതി	പിഴവ് കോഡ്	വിവരണം
400	`bad_request`	അസാധുവായ ആവശ്യം പരാമീറ്ററുകള്‍. വിവരങ്ങള്‍ക്കായി പിശകിന്റെ സന്ദേശം പരിശോധിക്കുക.
401	`unauthorized`	API കീ ലഭ്യമല്ല അല്ലെങ്കില്‍ അസാധുവാണ്.
402	`insufficient_credits`	മതിയായ അക്ഷരങ്ങള്‍ ലഭ്യമല്ല. / pricting/ ല്‍ കൂടുതല്‍ വിലയ്ക്ക് വാങ്ങുക.
403	`forbidden`	നിങ്ങള്‍ക്കു് ഈ വിഭവം ഉപയോഗിക്കാനുള്ള അനുവാദമില്ല (ഉദാ. മറ്റൊരു ഉപയോക്താവിന്റെ ജോലി പരിശോധിക്കുന്നു). API സമീപനത്തിനു് എല്ലാ പദ്ധതിയിലും അനുബന്ധമുണ്ട്.
404	`not_found`	സാമ്പിളോ ശബ്ദമോ കണ്ടില്ല.
413	`file_too_large`	അപ്ലോഡ് ചെയ്ത ഫയല്‍ വ്യാപ്തിയേക്കാള്‍ കൂടുതലാണു്.
429	`rate_limited`	വളരെയധികം ആവശ്യങ്ങള്‍. നിരക്കിന്റെ പരിധി തലക്കെട്ടുകള്‍ പരിശോധിയ്ക്കുക.
500	`internal_error`	സര്‍വര്‍ പിശക്. പിന്നീട് വീണ്ടും ശ്രമിക്കുക.
503	`model_loading`	മോഡല്‍ ലഭ്യമാക്കുന്നു, കുറച്ച് സെക്കന്റിനുള്ളില്‍ വീണ്ടും ശ്രമിക്കുക.

വെബിലെ ഹൂക്കുകള്‍Name

ദീര്‍ഘകാല ജോലികള്‍ക്കു് (stem, TTS വേര്‍പെടുത്തല്‍), നിങ്ങള്‍ക്കു് web_url/type> പരാമീറ്റര്‍ നല്‍കുവാന്‍ കഴിയും. ജോലി പൂര്‍ത്തിയായാല്‍ നിങ്ങളുടെ യുആര്‍എല്‍ -നിലുള്ള ഫലം വീണ്ടും പോസ്റ്റ് ചെയ്യും.

വെബ് ഹൂക്ക് പേയ്‌ന്‍ഡൌണ്‍Name

{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}

24 മണിക്കൂര്‍ കഴിഞ്ഞ് വെബില്‍ ഫലങ്ങള്‍ ലഭ്യമാണ്. അവ ഉടന്‍ തന്നെ ഡൌണ്‍ലോഡ് ചെയ്യണമെന്ന് ഉറപ്പുവരുത്തുക.

നിര്‍മ്മിക്കാൻ തയ്യാറാണോ?

നിങ്ങളുടെ API കീ എടുത്തിട്ട് നിങ്ങളുടെ പ്രവര്‍ത്തികളില്‍ TTS.ai രൂപ തുടങ്ങുക.

ഫ്രീ ആയി ഒപ്പ് വയ്ക്കുക പദ്ധതികള്‍ കാണുക

എപിഐ സഹായക്കുറിപ്പുകള്‍

പരിശോധിയ്ക്കുക

API കീ

അടിസ്ഥാന യുആര്‍എല്‍

അഥ്

ആധികാരകത ഉറപ്പുവരുത്തല്‍

എസ്ഡികെസ്Comment

Python

JavaScript / Node.js

അടിസ്ഥാന യുആര്‍എല്‍

പരിധികള്‍

കടങ്ങൾ

സംസാരത്തിനുള്ള വാചകം

അഭ്യര്‍ത്ഥനാ ശരീരം

ഉദാഹരണ അപേക്ഷ

എസ്എസ്എംഎല്‍ തൊങ്ങലുകള്‍

മറുപടി

Step 1: Submit request

Step 2: Poll for result

Step 3: Download audio

പൂര്‍ണ്ണമായ ഉദാഹരണം

പദാവലിയുമായുള്ള സംസാരം

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

മറുപടി

ശബ്ദ ക്ളൈനിങ്ങ്

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

മറുപടി

ശബ്ദം മാറ്റുന്നയാള്‍

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

ഉദാഹരണ അപേക്ഷ

മറുപടി

സംസാരപരിഭാഷName

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

മറുപടി

സംസാരം

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data)

മറുപടി

ഓഡിയോ ഉപകരണങ്ങള്‍

ശബ്ദം സല്ലാപം

അഭ്യര്‍ത്ഥനാ ശരീരം (multipart/form-data അല്ലെങ്കില്‍ JSON)

മറുപടി

ട്രെഡിസ്‌

പരാമീറ്ററുകള്‍

മറുപടി

എംബഡ്ഡിംഗ് ശബ്ദം

പരാമീറ്ററുകള്‍

മറുപടി

ആരോഗ്യപരിപാടി

മറുപടി

പട്ടിക മോഡലുകള്‍

മറുപടി

ലിസ്റ്റിന്‍റെ ശബ്ദങ്ങള്‍

ചോദ്യമിശ്രണോപാധികള്‍

മറുപടി

സബ്ടൈറ്റുകള്‍ (എസ്ആര്‍ടി / വിടിടി) പുതിയ

ചോദ്യമിശ്രണോപാധികള്‍

ഉച്ചാരണം നിഘണ്ടുQuery പുതിയ

അഭ്യര്‍ത്ഥനാ ശരീരം (POST)

ലേഖനം നിരീക്ഷകന്‍ പുതിയ

ഐച്ഛികങ്ങള്‍

ബട്ടണിന്റെ വിഡ്ജറ്റ് കേള്‍ക്കുക

സൂക്ഷിച്ച ശബ്ദങ്ങള്‍ (പെസ്റ്റന്റ് ക്ലോണ്‍സ്)

ശബ്ദം അപ്ലോഡ് ചെയ്യുക

ടിടിഎസ്- യില്‍ സൂക്ഷിച്ചിരിക്കുന്ന ശബ്ദം ഉപയോഗിക്കുക

പട്ടിക / നീക്കം ചെയ്യുക

ശേഖരം / വീണ്ടും പ്രവര്‍ത്തന സജ്ജമാക്കുക (ഫ്ളാഷ്)

കോഡ് ഉദാഹരണങ്ങള്‍

സംസാരത്തിനുള്ള വാചകം

പദാവലിയുമായുള്ള സംസാരം

ശബ്ദ ക്ളൈനിങ്ങ്

സംസാരത്തിനുള്ള വാചകം

പദാവലിയുമായുള്ള സംസാരം

സംസാരത്തിനുള്ള വാചകം

പദാവലിയുമായുള്ള സംസാരം

ശബ്ദ ക്ളൈനിങ്ങ്

ശബ്ദത്തിന്റെ മെച്ചപ്പെടുത്തല്‍Name

പിശകിന്റെ കോഡ്

വെബിലെ ഹൂക്കുകള്‍Name

നിര്‍മ്മിക്കാൻ തയ്യാറാണോ?