Ինչպե՞ս ստանալ API կոդը։

Գրանցվեք անվճար TTS.ai հաշվի համար, ապա մուտք գործեք ձեր հաշվի կառավարման վահանակ և սեղմեք «Ստեղծել API կոդը»։ Ձեր կոդը կներկայացվի sk-tts- նախադասությամբ և կարող է օգտագործվել անմիջապես։ Ազատ հաշիվները սկսելու համար ունեն 15,000 կերպար։

Արդյո՞ք API-ն համընկնում է OpenAI-ի ձևաչափի հետ։

Այո, մեր API-ն հետևում է OpenAI-ի հետ համընկնող խնդրանքի և պատասխանի ձևաչափերին։ Եթե դուք ունեք գոյություն ունեցող կոդ, որը օգտագործում է OpenAI-ի TTS API-ն, կարող եք անցնել TTS.ai-ին՝ փոխելով հիմնական URL-ը և API-ի կոդը` կոդը մի փոքր փոփոխելով։

Ո՞ր ծրագրավորման լեզվերը աջակցվում են։

REST API- ն աշխատում է ցանկացած լեզվով, որը կարող է HTTP խնդրանքներ կատարել։ Մենք առաջարկում ենք կոդի օրինակներ Python, JavaScript (Node.js և վեբ զննարկիչ), cURL և այլն։ Բոլոր լեզվերը, որոնք ունեն HTTP հաճախորդի գրադարան (Go, Ruby, Java, C#, PHP և այլն) կարող են օգտագործել API- ն։

Որո՞նք են API-ի արագության սահմանափակումները։

Ազատ հաշիվները սահմանափակված են 3 խնդրանքով յուրաքանչյուր ժամում։ Փոխհատուցվող պլանները ունեն ավելի բարձր սահմանափակումներ՝ հիմնված ձեր բաժանորդագրության մակարդակի վրա։ Starter (60/ժամ), Professional (300/ժամ), Enterprise (անսահմանափակ)։ Հաճախականության սահմանափակման գլխամասերը ներառված են յուրաքանչյուր API պատասխանում։

Ինչպե՞ս է աշխատում API-ի գների սահմանումը։

API-ի օգտագործումը յուրաքանչյուր մոդելի և տեքստի երկարության համար օգտագործում է որոշակի քանակությամբ հերոսներ։ Ազատ մոդելները օգտագործում են 0 հերոս, ստանդարտ մոդելները օգտագործում են 2x հերոսներ, իսկ բարձրակարգ մոդելները օգտագործում են 4x հերոսներ։ հերոսները ներառված են բոլոր վճարովի պլաններում և կարող են առանձին գնվել որպես հերոսների փաթեթներ։

Ո՞ր վերջնական կետերն են հասանելի։

API-ն ապահովում է text-to-speech (POST /v1/tts/), speech-to-text (POST /v1/transcribe/), voice cloning (POST /v1/voice-clone/), voice conversion (POST /v1/voice-convert/), speech translation (POST /v1/speech-translate/), audio enhancement (POST /v1/audio-enhance/), vocal removal, stem splitting, key and BPM analysis, և այլն.

Ո՞ր ձայնային ձևաչափերն է API-ն վերադարձնում

Լռելյայն, API- ն ձայնը վերադարձնում է WAV ձևաչափով։ Դուք կարող եք նշել ելքի ձևաչափը (mp3, wav, ogg, flac) response_ format պարամետրի միջոցով։ MP3- ն առաջարկվում է վեբ ծրագրերի համար, իսկ WAV- ն՝ ձայնի հետագա մշակման համար։

Գոյություն ունի՞ իրական ժամանակի TTS-ի համար ալիքային API

Այո, մեր async API- ն վերադարձնում է աշխատանքի UUID- ը, որը դուք կարող եք հարցնել արդյունքների համար։ Kokoro- ի նման աջակցվող մոդելների համար ձայնի ստեղծումը բավականին արագ է մոտավորապես իրական ժամանակի ծրագրերի համար։ Հարցման վերջնական կետերը վերադարձնում են ձայնի URL- ը, երբ աշխատանքը ավարտվել է։

Ինչպե՞ս պետք է վարվեմ API-ի սխալների հետ։

API- ն ետ է տալիս ստանդարտ HTTP վիճակի կոդերը (400` վատ խնդրանքների համար, 401` ավտատորի սխալների համար, 429` արագության սահմանափակումների համար, 500` սերվերի սխալների համար) JSON սխալների հաղորդագրություններով։ Միշտ ստուգեք վիճակի կոդը և սխալների դաշտը պատասխաններում սխալների ճիշտ կառավարման համար։

Կարո՞ղ եմ օգտագործել API-ն առևտրային ծրագրերի համար։

Այո, API-ն նախագծված է առևտրային նպատակներով օգտագործելու համար։ API-ի միջոցով գեներացված ձայնը կարող է օգտագործվել ձեր արտադրանքում, ծրագրերում և ծառայություններում։ Բոլոր մոդելները օգտագործում են բաց կոդով լիցենզիաներ, և գեներացված ձայնի համար չկան հավելյալ վճարներ։

Կա՞ն արդյոք սարքի կամ փորձարկման միջավայրեր։

Ազատ մակարդակով մոդելները (Kokoro, Piper, VITS, MeloTTS) ծառայում են որպես հիանալի ջրային արկղեր, դրանք օգտագործում են զրո կերպարներ և հասանելի են բոլոր հաշիվներին։ Պետք է փորձեք ձեր միացումը ազատ մոդելներին, մինչև անցնել բարձր մակարդակով մոդելներին արտադրական օգտագործման համար։

Ինչպե՞ս կարող եմ ցուցակագրել հասանելի ձայները և մոդելները API-ի միջոցով։

GET /v1/voices հրամանը օգտագործեք բոլոր հասանելի ձայների ցանկը կազմելու համար ֆիլտրման տարբերակների (մոդել, լեզու, սեռ) հետ։ GET /v1/models հրամանը օգտագործեք բոլոր հասանելի TTS մոդելների ցանկը կազմելու համար՝ նրանց հնարավորությունների և մակարդակների մասին տեղեկատվության հետ։ Կողմերը ետ են տալիս JSON պատասխաններ։

Տեղեկացնել սխալի / հատկության մասին

API փաստաթղթեր

TTS.ai-ը ներառեք ձեր ծրագրերում մեր REST API-ի միջոցով։ OpenAI-ի հետ համընկնող ձևաչափ՝ հեշտ տեղափոխման համար։

REST API OpenAI համընկնող JSON պատասխաններ Ցանցային աջակցություն

Համապարփակ

TTS.ai API-ն ապահովում է ծրագրային մուտք դեպի պլատֆորմի բոլոր առանձնահատկությունները՝ տեքստից խոսքի սինթեզի, խոսքից տեքստի թարգմանության, ձայնի կլոնավորման, ձայնային բարելավման և այլն։ API-ն օգտագործում է ստանդարտ REST կոնվենցիաներ JSON խնդրանք/պատասխան մարմինների հետ։

API կոդ

Ձեր API կոդը ստանալ Հաշվի պարամետրեր. Ընկերության կառուցվածքը և գործունեությունը.

Հիմնական URL

https://api.tts.ai/v1/

Գործողություն

Օգտագործողի տեքստ Authorization գլխամաս

Ավտոմատացում

Առանց ռեժիմի - ոչ մի կոդ չի պահանջվում. Անանուն POST- ը /v1/tts/ աշխատել առանց որևէ վկայագրման, մինչև 5000 կերպար/օր մեկ IP հասցեի համար, օգտագործելով մեր ցանկացած անվճար մոդել (piper, vits, melotts, kokoro). Գրանցվեք անվճար հաշիվ, որպեսզի ստանա 15,000 բոնուսային հերոսներ և հասանելիություն premium մոդելներին։

Premium մոդելների և ավելի բարձր տոկոսադրույքի սահմանների համար, ստուգեք հավաստիությունը Bearer token-ով Authorization գլխամաս.

HTTP գլխամաս

Authorization: Bearer sk-tts-your-api-key-here

Ձեր API կոդը գաղտնի պահեք։ Չբաժանել այն հաճախորդի կողմի կոդի, հանրային ռեպորտաժների կամ գրանցումների մեջ։ Կրկնեք կոճակները ձեր հաշվի պարամետրերում։

SDK- ներ

Առաջարկվող պաշտոնական SDK-ները հեշտացնում են TTS.ai-ը ձեր ծրագրի մեջ ներառելը։ Դրանք բաց կոդով են և հասանելի են GitHub-ում։

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

Հիմնական URL

Հիմնական URL: https://api.tts.ai/v1/

Բոլոր վերջնական կետերը հարաբերական են այս հիմնային URL- ին։ Օրինակ, TTS վերջնական կետ է՝

POST https://api.tts.ai/v1/tts/

Չափի սահմանափակումներ

API արագության սահմանափակումները տարբերվում են պլանի համաձայն.

Գործողություն	Պահանջներ/րոպե	Միաժամանակյա	Տեքստի առավելագույն երկարությունը
Ազատ	10	2	500 սիմվոլ
Ընդունել	30	3	1,000,000 քարտեր
Օգտագործող	60	5	1,000,000 քարտեր
Ընկերություն	300	20	50,000 սիմվոլներ

Հաճախականության սահմանափակումը ներառված է յուրաքանչյուր պատասխանում: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Ընդհանուր

Ծառայություն	Գին	Յունուար
TTS (Ազատ մոդելներ՝ Piper, VITS, MeloTTS)	1000 քարտեր	1000 հիերոգլիֆ
TTS (Ստանդարտ մոդելներ: Kokoro, CosyVoice 2, և այլն)	2,000 քարտեր	1000 հիերոգլիֆ
TTS (Premium մոդելներ՝ Tortoise, Chatterbox և այլն)	4,000 քարտեր	1000 հիերոգլիֆ
Խոսքից տեքստName	2,000 քարտեր	ձայնային րոպեական
Ձայնի կլոնավորում	4,000 քարտեր	1000 հիերոգլիֆ
Խոսքի փոխակերպիչ	3,000 քարտեր	ձայնային րոպեական
Ձայնի բարելավում	2,000 քարտեր	ձայնային րոպեական
Ձայնի հեռացում / ձայնի բաժանում	3,000-4,000 այբուբեն	ձայնային րոպեական
Խոսքի թարգմանություն	5,000 քարտեր	ձայնային րոպեական
Ձայնային զրույց	3,000 քարտեր	յուրաքանչյուր հերթափոխի համար
Գործողություն	Ազատ	--
Աուդիո փոխակերպիչ	Ազատ	--

Տեքստից խոսքName

POST /v1/tts/

Անվանել տեքստը ձայնային ձայնագրության։ Վերադարձնում է ձայնային ֆայլը պահանջված ձևաչափով։

Պահանջի մարմին

Պարամետրեր	Տիպ	Պահանջվում է	Ապրանքանիշ
model	string	Ոչ	մոդելի ID-ն (օրինակ, `kokoro`, `chatterbox`, `piper`)։ Եթե բաց թողնվի, ապա մենք ինքնաբերաբար կառաջարկենք մոդել, որը աջակցում է խնդրվող `լեզու`-ին՝ `kokoro` en/ja/zh/ko/fr/de/it/pt/es/hi/ru, `piper` այլ աջակցվող լեզուների համար (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.)։
text	string	Այո	Տեքստ, որը պետք է փոխակերպել խոսակցության։ Մեկ խնդրանքի համար սահմանված է 500 նշան (անանուն), 5000 (անվճար հաշիվ), 1,000,000 (վճարովի պլան)։ Ծանր մուտքագրումները սերվերի կողմից ինքնաբերաբար կբաժանվեն հատվածների։
voice	string	Այո	Ձայնի ID (օգտագործեք `/v1/voices/` հասանելի ձայների ցանկ կազմելու համար)
format	string	Ոչ	Էքսպորտային ձևաչափը` `mp3` (լռելյայն), `wav`, `flac`, `ogg`
speed	float	Ոչ	Խոսելու արագության բազմապատկիչը։ Լռելյայն՝ `1.0`։ Տարբերակ՝ `0.5`-ից `2.0`
language	string	Ոչ	Լեզվի կոդը (օրինակ, `hy`, `hy`)։ Ավտոմատորեն հայտնաբերվում է, եթե բացակայում է։
instructions	string	Ոչ	Աշխատող / մատուցման նշաններ (≤500 սիմվոլներ) օրինակ `\`
pronunciations	object \| array	Ոչ	Ըստ խնդրանքի արտասանությունը փոխարինում է. Կամ `{\`
stream	boolean	Ոչ	Ընդունել հոսքի պատասխանը։ Լռելյայն՝ `false`

Օրինակ

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML պիտակներ

Ցուցադրել թվերը, օրերը, արժույթը, հեռախոսահամարները և ակրոնիմները


                    
                        
                            թարգմանել Ձևակերպում Խոսել որպես
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 December thirty-first, nineteen ninety-nine
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

թարգմանել	Ձևակերպում	Խոսել որպես
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	December thirty-first, nineteen ninety-nine
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                Լռելյայն օրվա ձևաչափը mdy է անգլերենի համար և dmy այլ վայրերում; փոխարինել format=\

                
                    
                        Օրինակ
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                Պատասխան
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                Full example
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                Խոսքից տեքստName
                
                    POST /v1/stt/
                
                Արտասանել ձայնային տվյալները տեքստային ձևով։ Պահպանում է 99 լեզու` ավտոմատ հայտնաբերման միջոցով։

                Պահանջի մարմին (multipart/form-data)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                file
                                file
                                Այո
                                Աուդիո ֆայլ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Ավելին քան 100 Մբ
                            
                            
                                model
                                string
                                Ոչ
                                STT մոդել: whisper (լռելյայն), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                Ոչ
                                Լեզվի կոդ. auto ավտոմատ հայտնաբերման համար (առաջադրված).
                            
                            
                                timestamps
                                boolean
                                Ոչ
                                Լռելյայն՝ false
                            
                            
                                diarize
                                boolean
                                Ոչ
                                Օգտագործել ձայնագրիչի օրացույցը։ Լռելյայն՝ false
                            
                        
                    
                

                Պատասխան
                
                    
                        JSON պատասխան
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                Ձայնի կլոնավորում
                
                    POST /v1/tts/clone/
                
                Ծննդաբերել խոսակցությունը կլոնավորված ձայնով։ Տեղադրել հղման ձայն և տեքստը։

                Պահանջի մարմին (multipart/form-data)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                reference_audio
                                file
                                Այո
                                Հղումային ձայնային ձայնագրություն (10-30 վայրկյան խորհուրդ է տրվում). Ավելի շատ 20 Մբ
                            
                            
                                text
                                string
                                Այո
                                Տեքստ, որը կլոնավորված ձայնով կխոսվի։
                            
                            
                                model
                                string
                                Ոչ
                                Կլոնի մոդել՝ chatterbox (լռելյայն), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                Ոչ
                                Էքսպորտային ձևաչափը. mp3 (լավագույնը), wav, flac
                            
                            
                                language
                                string
                                Ոչ
                                Ցանկացած լեզվի կոդը: Պետք է աջակցվի ընտրված մոդելի կողմից:
                            
                        
                    
                

                Պատասխան
                Վերադարձնում է ձայնային ֆայլը որպես եռակի տվյալներ, նույնը, ինչ TTS վերջնական կետ
            

            
            
                Խոսքի փոխակերպիչ
                
                    POST /v1/voice-convert/
                
                Ավտոմատ կերպով փոխակերպել ձայնային տվյալները այլ ձայնի պես հնչելու համար։ Տեղադրել սկզբնական ձայնային տվյալները և ընտրել նպատակային ձայնը։

                Պահանջի մարմին (multipart/form-data)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                file
                                file
                                Այո
                                Օդիո սկզբնական ֆայլը (MP3, WAV, FLAC). Ավելին քան 50 Մբ
                            
                            
                                target_voice
                                string
                                Այո
                                Փոխանակելու նպատակային ձայնային ID-ն (օգտագործեք /v1/voices/ հասանելի ձայների ցանկ կազմելու համար)
                            
                            
                                model
                                string
                                Ոչ
                                Ձայնի փոխակերպման մոդել՝ openvoice (լռելյայն), knn-vc
                            
                            
                                format
                                string
                                Ոչ
                                Էքսպորտային ձևաչափ՝ wav (լռելյայն), mp3, flac
                            
                        
                    
                

                Օրինակ
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                Պատասխան
                Վերադարձնում է փոխակերպված ձայնային ֆայլը որպես եռակի տվյալներ
            

            
            
                Խոսքի թարգմանություն
                
                    POST /v1/speech-translate/
                
                Թարգմանել խոսված ձայնը մեկ լեզվից մյուսը։ Միավորում է խոսել-տեքստը, թարգմանել-տեքստը և տեքստը-խոսելը մեկ զանգի ընթացքում։

                Պահանջի մարմին (multipart/form-data)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                file
                                file
                                Այո
                                Օգտագործել սկզբնական լեզվով ձայնային ֆայլը։ Ավելի շատ 100 Մբ։
                            
                            
                                target_language
                                string
                                Այո
                                Օգտագործվող լեզվի կոդը (օրինակ, hy, hy, hy, hy)
                            
                            
                                voice
                                string
                                Ոչ
                                Թարգմանության ելքի ձայնը։ Ավտոմատ ընտրվում է, եթե բացակայում է։
                            
                            
                                preserve_voice
                                boolean
                                Ոչ
                                Փորձել պահպանել ձայնագրողի սկզբնական ձայնային հատկությունները։ Լռելյայն՝ false
                            
                        
                    
                

                Պատասխան
                
                    JSON պատասխան
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                Խոսքից խոսք
                
                    POST /v1/speech-to-speech/
                
                Տեղաշարժել խոսքի ոճը, զգացմունքները կամ ներկայացումը՝ պահպանելով բովանդակությունը։ Հնարավոր է օգտագործել տոն, արագություն և արտահայտչականություն կարգավորելու համար։

                Պահանջի մարմին (multipart/form-data)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                file
                                file
                                Այո
                                Ծագման ձայնային ֆայլ. 50 Մբ առավելագույն.
                            
                            
                                voice
                                string
                                Այո
                                Ձայնի ելքի նպատակային ID- ը
                            
                            
                                model
                                string
                                Ոչ
                                Օրինակ՝ openvoice (լռելյայն), chatterbox
                            
                            
                                emotion
                                string
                                Ոչ
                                Նպատակային էմոցիա: neutral, happy, sad, angry, excited
                            
                            
                                speed
                                float
                                Ոչ
                                արագության կարգավորում. Լռելյայն՝ 1.0։ Տարբերակ՝ 0.5-ից 2.0
                            
                        
                    
                

                Պատասխան
                Վերադարձնում է փոխակերպված ձայնային ֆայլը որպես եռակի տվյալներ
            

            
            
                Աուդիո գործիքներ
                Աուդիո վերամշակման վերջնական կետերը բարելավման, ձայնի հեռացման, սկավառակի բաժանման և այլն համար։

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        Բարձրացնել ձայնի որակը՝ նվազեցնելով աղմուկը, բարելավելով ճշգրտությունը, ավելացնելով լուսավորությունը։
                        
                            
                                
                                    file file Աուդիո ֆայլի բարելավում
                                    denoise boolean Անջատել աղմուկը (լռելյայն՝ ճիշտ)
                                    enhance_clarity boolean Բարձրացնել խոսքի հստակությունը (լռելյայն՝ ճիշտ)
                                    super_resolution boolean Ավտոմատ բարձրացնել ձայնի որակը (լռելյայն՝ false)
                                    strength integer 1-3 (թեթև, միջին, ուժեղ): Լռելյայն՝ 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        Ձայնայինների բաժանում նվագախմբայիններից (ձայնայինների հեռացում) կամ բաժանում սկավառակների մեջ.
                        
                            
                                
                                    file file Ավտոմատ կերպով ջնջել
                                    model string demucs (լռելյայն) կամ spleeter
                                    stems integer Ծաղիկների քանակը 2, 4, 5 կամ 6 (լռելյայն՝ 2)
                                    format string Ընտրեք ելքի ձևաչափը. wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        Հեռացնել ձայնագրություններից հնչյունները և հնչյունափոխությունը։
                        
                            
                                
                                    file file Ավտոմատ կերպով ընթերցվող ձայնային ֆայլ
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            Ազատ
                        
                        Անալիզել ձայնը նվագախմբի, BPM-ի և արագության հայտնաբերման համար։
                        
                            
                                
                                    file file Օդային ֆայլը վերլուծելու համար
                                
                            
                        
                        
                            Պատասխան
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            Ազատ
                        
                        Ավտոմատ կերպարների փոխակերպում
                        
                            
                                
                                    file file Արտադրանքը փոխակերպելու համար ձայնային ֆայլ
                                    format string Օգտագործվող ձևաչափեր՝ mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer Ընտրեք ելքի բիթերի քանակը` kbps- ով: 64, 128, 192, 256, 320
                                    sample_rate integer Օրինակների քանակը՝ 22050, 44100, 48000
                                    channels string mono կամ stereo
                                
                            
                        
                    
                
            

            
            
                Ձայնային զրույց
                
                    POST /v1/voice-chat/
                
                Ավտոմատ ձայնային կամ տեքստային հաղորդագրություն ուղարկել և ստանալ սինթետիկ ձայնային պատասխան։

                Պահանջի մարմին (multipart/form-data կամ JSON)
                
                    
                        
                            Պարամետրեր Տիպ Պահանջվում է Ապրանքանիշ
                        
                        
                            
                                audio
                                file
                                Ոչ*
                                Աուդիո մուտք (պահանջվում է audio կամ text)
                            
                            
                                text
                                string
                                Ոչ*
                                Տեքստային մուտք (պահանջվում է audio կամ text)
                            
                            
                                voice
                                string
                                Ոչ
                                AI-ի պատասխանի ձայնը։ Լռելյայն՝ af_bella
                            
                            
                                tts_model
                                string
                                Ոչ
                                TTS մոդելը պատասխանի համար։ Լռելյայն՝ kokoro
                            
                            
                                system_prompt
                                string
                                Ոչ
                                AI- ի համար յուրահատուկ համակարգային հրահանգ
                            
                            
                                conversation_id
                                string
                                Ոչ
                                Շարունակել առկա զրույցը
                            
                        
                    
                

                Պատասխան
                
                    JSON պատասխան
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                TTS խմբաքանակ
                
                    POST /v1/tts/batch/
                
                Տեղադրել մի քանի տեքստեր զուգահեռ TTS ստեղծման համար։ Առաջարկվում է webhook- ի հետազոտություն ստանալ, երբ բոլոր աշխատանքները ավարտվել են։

                Պարամետրեր
                
                    Փարամետրի ցուցակ Տիպ Ապրանքանիշ
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string Optional URL to POST results when batch completes.
                    
                

                Պատասխան
                
                    JSON պատասխան
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                GET /v1/tts/batch/result/?batch_id=abc123-ով հարցման ընթացքը
            

            
            
                Ձայնի ներկառուցում
                
                    POST /v1/voice-embed/
                
                Հետևյալ ձայնային կլոունավորման խնդրանքներում օգտագործել վերադարձված embed_id-ը` մոտավորապես ակնթարթային գեներացիայի համար։

                Պարամետրեր
                
                    Փարամետրի ցուցակ Տիպ Ապրանքանիշ
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                Պատասխան
                
                    JSON պատասխան
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                Առողջության ստուգում
                
                    GET /v1/health/
                
                Ստուգել GPU սերվերի վիճակը, բեռնված մոդելները և հերթի չափը։ Ավտոմատացում չի պահանջվում։ Քեշը պահվում է 30 վայրկյան։

                Պատասխան
                
                    JSON պատասխան
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                Տեսակների ցուցակ
                
                    GET /v1/models/
                
                Վերադարձնում է բոլոր հասանելի մոդելների ցանկը և դրանց հնարավորությունները։

                Պատասխան
                
                    JSON պատասխան
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                ձայների ցանկ
                
                    GET /v1/voices/
                
                Վերադարձնում է բոլոր հասանելի ձայների ցուցակը, որը ֆիլտրվում է ըստ մոդելի կամ լեզվի։

                Պարամետրեր
                
                    
                        
                            Պարամետրեր Տիպ Ապրանքանիշ
                        
                        
                            
                                model
                                string
                                Ֆիլտրել ըստ մոդելի ID-ի (օրինակ, kokoro)
                            
                            
                                language
                                string
                                Ֆիլտրել լեզվի կոդով (օրինակ, hy)
                            
                            
                                gender
                                string
                                Ֆիլտրել ըստ սեռի: male, female, neutral
                            
                        
                    
                

                Պատասխան
                
                    JSON պատասխան
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                Ցուցադրել վերնագրերը նոր
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                Ծննդաբերել սինխրոնացված ենթատեքստեր ցանկացած ավարտված TTS աշխատանքի համար։ Աշխատեցնում է Whisper ուղղահայացությունը ձայնի վրա և վերադարձնում SRT կամ WebVTT։ Արդյունքը պահվում է սկավառակի վրա, այնպես որ նույն uuid- ի համար երկրորդ կոչը սկավառակի կարդում է։
                Պարամետրեր
                
                    
                        Պարամետրեր Պահանջվում է Ապրանքանիշ
                        
                            uuid Այո UUID-ը վերադարձվել է /v1/tts/ կամ /v1/voice-clone/-ի կողմից։
                            format Ոչ srt (առաջին) կամ vtt.
                            download Ոչ 1 Content-Disposition: attachment ուղարկել, որպեսզի բրաուզերը պահպանի, այլ ոչ թե ցույց տա.
                            language Ոչ Հուշում ուղղահայաց մոդելի մասին (ավտոմատորեն հայտնաբերվում է, եթե բացակայում է)
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                Արտասանության բառարան նոր
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                Տեսագրության արտասանության համակարգին ասել, թե ինչպես արտասանել որոշակի բառերը։ Ստեղծված գրառումները ինքնաբերաբար կիրառվում են ձեր կատարած յուրաքանչյուր գրառումին։ 200 գրառում յուրաքանչյուր հաշվի համար։
                Պահանջի մարմին (POST)
                
                    
                        Պարամետրեր Տիպ Ապրանքանիշ
                        
                            word string Անջատելու համար բառ (օրինակ՝ GIF, Anthropic)։ Բառի սահմանը համընկնում է։
                            replacement string Օրինակ՝ jiff, ann THROP ick, ick, ick, ick, ick, ick, ick, ick։
                            language string ISO կոդը` բացառիկ: Թափանցիկ = կիրառվում է բոլոր լեզուների համար:
                            case_sensitive boolean Լռելյայն false. Հաշվի առնել տառատեսակը, երբ true
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                Դուք կարող եք նաև անցնել per-պահանջը overrides առանց պահպանելու նրանց — ներառել  արտասանությունները ցանկացած /v1/tts/ կոչը, ինչպես օբյեկտ կամ ռեժիմ (տես TTS endpoint params).
            

            
            
                Աղբյուրի նկարագրություն նոր
                Ցանկացած հոդվածի էջում

Պարամետրեր	Տիպ	Պահանջվում է	Ապրանքանիշ
file	file	Այո	Աուդիո ֆայլ (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Ավելին քան 100 Մբ
model	string	Ոչ	STT մոդել: `whisper` (լռելյայն), `faster-whisper`, `sensevoice`
language	string	Ոչ	Լեզվի կոդ. `auto` ավտոմատ հայտնաբերման համար (առաջադրված).
timestamps	boolean	Ոչ	Լռելյայն՝ `false`
diarize	boolean	Ոչ	Օգտագործել ձայնագրիչի օրացույցը։ Լռելյայն՝ `false`

Պարամետրեր	Տիպ	Պահանջվում է	Ապրանքանիշ
reference_audio	file	Այո	Հղումային ձայնային ձայնագրություն (10-30 վայրկյան խորհուրդ է տրվում). Ավելի շատ 20 Մբ
text	string	Այո	Տեքստ, որը կլոնավորված ձայնով կխոսվի։
model	string	Ոչ	Կլոնի մոդել՝ `chatterbox` (լռելյայն), `cosyvoice2`, `gpt-sovits`
format	string	Ոչ	Էքսպորտային ձևաչափը. `mp3` (լավագույնը), `wav`, `flac`
language	string	Ոչ	Ցանկացած լեզվի կոդը: Պետք է աջակցվի ընտրված մոդելի կողմից:

file file	Աուդիո ֆայլի բարելավում
denoise boolean	Անջատել աղմուկը (լռելյայն՝ ճիշտ)
enhance_clarity boolean	Բարձրացնել խոսքի հստակությունը (լռելյայն՝ ճիշտ)
super_resolution boolean	Ավտոմատ բարձրացնել ձայնի որակը (լռելյայն՝ false)
strength integer	1-3 (թեթև, միջին, ուժեղ): Լռելյայն՝ 2

file file	Ավտոմատ կերպով ջնջել
model string	`demucs` (լռելյայն) կամ `spleeter`
stems integer	Ծաղիկների քանակը 2, 4, 5 կամ 6 (լռելյայն՝ 2)
format string	Ընտրեք ելքի ձևաչափը. `wav`, `mp3`, `flac`

file file	Ավտոմատ կերպով ընթերցվող ձայնային ֆայլ
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	Արտադրանքը փոխակերպելու համար ձայնային ֆայլ
format string	Օգտագործվող ձևաչափեր՝ `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	Ընտրեք ելքի բիթերի քանակը` kbps- ով: 64, 128, 192, 256, 320
sample_rate integer	Օրինակների քանակը՝ 22050, 44100, 48000
channels string	`mono` կամ `stereo`

Պարամետրեր	Տիպ	Պահանջվում է	Ապրանքանիշ
audio	file	Ոչ*	Աուդիո մուտք (պահանջվում է `audio` կամ `text`)
text	string	Ոչ*	Տեքստային մուտք (պահանջվում է `audio` կամ `text`)
voice	string	Ոչ	AI-ի պատասխանի ձայնը։ Լռելյայն՝ `af_bella`
tts_model	string	Ոչ	TTS մոդելը պատասխանի համար։ Լռելյայն՝ `kokoro`
system_prompt	string	Ոչ	AI- ի համար յուրահատուկ համակարգային հրահանգ
conversation_id	string	Ոչ	Շարունակել առկա զրույցը

Փարամետրի ցուցակ	Տիպ	Ապրանքանիշ
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	Optional URL to POST results when batch completes.

Փարամետրի ցուցակ	Տիպ	Ապրանքանիշ
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Պարամետրեր	Տիպ	Ապրանքանիշ
model	string	Ֆիլտրել ըստ մոդելի ID-ի (օրինակ, `kokoro`)
language	string	Ֆիլտրել լեզվի կոդով (օրինակ, `hy`)
gender	string	Ֆիլտրել ըստ սեռի: `male`, `female`, `neutral`

Պարամետրեր	Պահանջվում է	Ապրանքանիշ
uuid	Այո	UUID-ը վերադարձվել է /v1/tts/ կամ /v1/voice-clone/-ի կողմից։
format	Ոչ	`srt` (առաջին) կամ `vtt`.
download	Ոչ	`1` `Content-Disposition: attachment` ուղարկել, որպեսզի բրաուզերը պահպանի, այլ ոչ թե ցույց տա.
language	Ոչ	Հուշում ուղղահայաց մոդելի մասին (ավտոմատորեն հայտնաբերվում է, եթե բացակայում է)

Պարամետրեր	Տիպ	Ապրանքանիշ
word	string	Անջատելու համար բառ (օրինակ՝ `GIF`, `Anthropic`)։ Բառի սահմանը համընկնում է։
replacement	string	Օրինակ՝ `jiff`, `ann THROP ick`, `ick`, `ick`, `ick`, `ick`, `ick`, `ick`, `ick`։
language	string	ISO կոդը` բացառիկ: Թափանցիկ = կիրառվում է բոլոր լեզուների համար:
case_sensitive	boolean	Լռելյայն `false`. Հաշվի առնել տառատեսակը, երբ `true`