እንዴት ነው የAPI ቁልፍን የምወስደው?

ለነጻ TTS.ai ሒሳብ ይመዝገቡ፣ ከዚያም ወደ ሒሳብዎ ዳሽቦርድ ይሂዱ እና "API ቁልፍን ይፈጥሩ" ይጫኑ። ቁልፍዎ sk-tts- ጋር ይቀመጣል እና በፍጥነት ሊጠቀም ይችላል። ነፃ ሒሳብ ለመጀመር 15,000 አርእስቶችን ያገኛል ፡፡

የAPIው ከ OpenAI ቅርጸት ጋር የሚስማማ ነውን?

አዎ, የኛ API OpenAI-ተኳሃኝ ጥያቄ እና መልስ ቅርጸቶች ይከተላል. የ OpenAI TTS API የሚጠቀም የእርስዎን የቀድሞ ኮድ ካለዎት, ወደ TTS.ai በመቀየር የመሰረት URL እና API ቁልፍን በጥቂት ኮድ ለውጦች መቀየር ይችላሉ.

የፕሮግራም ቋንቋዎች ምንድናቸው?

የREST API ከ HTTP ጥያቄዎች ማድረግ የሚችል ማንኛውም ቋንቋ ጋር ይሠራል. እኛ በ Python, JavaScript (Node.js እና መቃኛ), cURL, እና ሌሎች ኮድ ምሳሌዎች ይሰጣሉ. ማንኛውም ቋንቋ ከ HTTP ደንበኛ መዝገብ ቤት (Go, Ruby, Java, C #, PHP, ወዘተ) ጋር API ሊጠቀሙ ይችላሉ.

የAPI ፍጥነት ገደቦች ምንድናቸው?

ነጻ መለያዎች በየሰዓቱ 3 ጥያቄዎችን ያካትታሉ. የተከፈለባቸው ዕቅዶች በምዝገባ ደረጃዎ ላይ የተመሠረቱ ከፍተኛ ገደቦች አሏቸው: Starter (60/hour), Professional (300/hour), Enterprise (unlimited). Rate limit headers are included in every API response.

የAPI ዋጋ እንዴት ይሠራል?

የAPI ጥቅም በሞዴል ደረጃና በጽሑፍ ርዝመት ላይ የተመሠረተ ፊደላትን ይጠቀማል. ነፃ ሞዴሎች 0 ፊደላትን ይጠቀማሉ፣ መደበኛ ሞዴሎች 2x ፊደላትን ይጠቀማሉ፣ እና ፕሪሚየም ሞዴሎች 4x ፊደላትን ይጠቀማሉ። ፊደላት በሁሉም የተከፈለባቸው ዕቅዶች ውስጥ ይገኙበታል እንዲሁም እንደ ፊደል ስብስብ በየራሳቸው ሊገዙ ይችላሉ።

ምን ዓይነት መጨረሻዎች ይገኛሉ?

ይህ API ለጽሑፍ-ወደ-ንግግር (POST /v1/tts/), ንግግር-ወደ-ንግግር (POST /v1/transcribe/), የድምፅ ክሎኒንግ (POST /v1/voice-clone/), የድምፅ መለወጥ (POST /v1/voice-convert/), የንግግር ትርጉም (POST /v1/speech-translate/), የድምፅ ማሻሻያ (POST /v1/audio-enhance/), የድምፅ ማስወገድ, ቅርንጫፍ ክፍፍል, ቁልፍ እና BPM ትንተና, እና ሌሎች.

የድምፅ ቅርጸቶች

የአፕሊኬሽን ፕሮግራም መቆጣጠሪያ (API) የድምፅ ፋይሉን በWAV ቅርጸት ይመልሳል። የምርቱን ቅርጸት (mp3, wav, ogg, flac) በresponse_format parameter በመጠቀም ማሳየት ይችላሉ። MP3 ለዌብ ፕሮግራሞች፣ WAV ለተጨማሪ የድምፅ ማቀነባበሪያ ጥቅም ላይ ይውላል።

ለታሪክ-ጊዜ TTS የቀጥታ መተግበሪያ መጫኛ API አለን?

አዎ፣ የአይሲንክ ፒአይፒ የስራ ዩአይዲን ይመልሳል። ለኮኮሮ የመሳሰሉ የተደገፉ ሞዴሎች፣ የኦዲዮ ማምረት ለቅርብ ጊዜ ፕሮግራሞች በቂ ፈጣን ነው። የፖሊንግ መጨረሻው የኦዲዮ ዩአርኤልን ሂደቱ ከተጠናቀቀ በኋላ ይመልሳል።

ስህተቶችን በAPI እንዴት እቀበላለሁ?

የአይፒአይ ስታንዳርድ የኤችቲቲፒ ሁኔታ ኮዶችን (ለመጥፎ ጥያቄዎች 400, ለባለቤትነት ስህተቶች 401, ለፍጥነት ገደቦች 429, ለሰርቨር ስህተቶች 500) በጄሶን ስህተት መልዕክቶች ይመለሳል. ሁልጊዜ ስህተትን ለመቆጣጠር ስህተት ኮድ እና ስህተት መስክ በምላሾች ውስጥ ይመልከቱ.

ለኮሜርስ ፕሮግራሞች አፒአይ መጠቀም እችላለሁን?

አዎ፣ የAPI ለኮሜርሺያል ጥቅም የተሰራ ነው። ከAPI የተገኘው ድምፅ በምርቶችህ፣ ፕሮግራሞችህና በድርጅቶችህ ሊጠቀም ይችላል። ሁሉም ሞዴሎች የፍለጋ-መነሻ ፈቃዶችን ይጠቀማሉ፣ እናም በገጠመው ድምፅ ላይ ምንም የተጨማሪ መብቶች የሉም።

የሳንድቦክስ ወይም የመሞከሪያ አካባቢ አለን?

ነጻ-ደረጃ ሞዴሎች (ኮኮሮ, Piper, VITS, MeloTTS) እንደ ምርጥ sandbox ሆነው ይሠራሉ - እነርሱ 0 ፊደላትን ይጠቀማሉ እና ለሁሉም መለያዎች ይገኛሉ. ለምርት ጥቅም ወደ ፕሪሚየም ሞዴሎች ከመለወጥዎ በፊት ነፃ ሞዴሎችን በመጠቀም ማቀናጀትዎን ይሞከሩ.

እንዴት ድምጾችን እና ሞዴሎችን በAPI ውስጥ ማስቀመጥ እችላለሁ?

GET /v1/voicesን በመጠቀም ሁሉንም የተገኙ ድምጾችን በፍተሻ ምርጫዎች (ሞዴል፣ ቋንቋ፣ ፆታ) ለመዘርዘር ይጠቀሙ። GET /v1/modelsን በመጠቀም ሁሉንም የተገኙ TTS ሞዴሎችን በችሎታቸውና በደረጃው መረጃ ለመዘርዘር ይጠቀሙ። ሁለቱም መጨረሻዎች JSON መልሶችን ይመልሳሉ።

የችግር / የችሎታ ጥያቄ አቅርብ

ሰነዶች

REST API ጋር TTS.ai ወደ ፕሮግራሞችዎ ያካትቱ. OpenAI-ተኳሃኝ ቅርጸት ለ ቀላል መዛወር.

REST API OpenAI የሚስማማ JSON መልሶች ስትሪሚንግ ድጋፍ

ማጠቃለያ

The TTS.ai API provides programmatic access to all platform features: text-to-speech synthesis, speech-to-text transcription, voice cloning, audio enhancement, and more. The API uses standard REST conventions with JSON request / response bodies.

የAPI ቁልፍ

የAPI ቁልፉን ከ የሂሳብ ምርጫዎች. በፕሮ እና ኢንተርፕራይዝ ዕቅዶች ላይ ይገኛል

መሠረታዊ URL

https://api.tts.ai/v1/

ማረጋገጫ

የቀን/ሰዓት ቶኬን Authorization የገጽ አናት

ማረጋገጫ

ነጻ ደረጃ - ቁልፍ አይጠየቅም ያልታወቀ /v1/tts/ ያለ ማንኛውም ፈቃድ, እስከ 5,000 አሃዞች / ቀን ለ IP, ማንኛውም ነፃ ሞዴሎችን በመጠቀም (piper, vits, melotts, kokoro). ለነጻ መለያ ለመመዝገብ 15,000 የቦና ፊደላትን እና የፕሪሚየም ሞዴሎችን ለመድረስ.

ለፕሪሚየም ሞዴሎችና ለከፍተኛ ፍጥነት ገደቦች፣ በበርየር ቶኬን ውስጥ ማረጋገጥ Authorization የገጽ አናት.

የHTTP አናት

Authorization: Bearer sk-tts-your-api-key-here

የAPI ቁልፍህን ምስጢር አድርግ በክላኢንት ኮድ፣ በሕዝብ መዝገብ ቤቶች ወይም ሎጎዎች ውስጥ አታጋሩት። ቁልፎችን በየጊዜው ከሂሳብዎ ማስተካከያዎች ውስጥ ያዙሩ።

ሴኮንዶች

የመንግስት SDKs TTS.ai ወደ ፕሮግራምዎ ለማካተት ቀላል ያደርጋል. ሁለቱም የክፍል ምንጭ ናቸው እና GitHub ላይ ይገኛል.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

መሠረታዊ URL

መሠረታዊ URL: https://api.tts.ai/v1/

ሁሉም መጨረሻዎች ወደዚህ መሠረታዊ URL ጋር የተያያዙ ናቸው። ለምሳሌ፣ የ TTS መጨረሻው :

POST https://api.tts.ai/v1/tts/

የፍጥነት ገደቦች

API የፍጥነት ገደቦች በፕላን ይለያያሉ:

መስመር	ጥያቄዎች/ ደቂቃ	በአንድ ጊዜ	የጽሑፉ ርዝመት
ነጻ	10	2	ፊደላት
መተላለፊያ	30	3	ፊደላት
ለ	60	5	ፊደላት
ኩባንያ	300	20	ፊደላት

የፍጥነት ገደብ ርዕሶች በእያንዳንዱ መልስ ውስጥ ይገኙበታል: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

የክሬዲት ዋጋ

አገልግሎት	ዋጋ	ዩኒት
TTS (ነጻ ሞዴሎች: Piper, VITS, MeloTTS)	አንቀጽ	ፊደል(ሎች)
TTS (አስፈላጊ ሞዴሎች: ኮኮሮ, ኮሲቮይስ 2, ወዘተ.)	ፊደላት	ፊደል(ሎች)
TTS (Premium ሞዴሎች: Tortoise, Chatterbox, ወዘተ.)	አንቀጽ	ፊደል(ሎች)
ንግግር ወደ ጽሑፍ	ፊደላት	የድምፅ መጠን
የድምፅ ክሎኒንግ	አንቀጽ	ፊደል(ሎች)
የድምፅ መለወጫ	አንቀጽ	የድምፅ መጠን
የድምፅ ማሻሻያ	ፊደላት	የድምፅ መጠን
የድምፅ ማስወገድ / የድምፅ ክፍፍል	ፊደላት	የድምፅ መጠን
የንግግር ትርጉም	አንቀጽ	የድምፅ መጠን
የድምፅ ውይይት	አንቀጽ	ዙር
የፊደል ቅርጽ ምርጫዎች	ነጻ	--
የድምፅ መለወጫ	ነጻ	--

ጽሑፉን ወደ ንግግር ለውጥ

POST /v1/tts/

ጽሑፉን ወደ ንግግር ድምፅ ይለውጡ. የድምፅ ፋይሉን በተጠየቀው ቅርጸት ይመልሳል

የጠየቀው አካል

መለኪያ	ዓይነት	ያስፈልጋል	መግለጫ የለም
model	string	አዎ	ሞዴል ID (ለምሳሌ `kokoro`, `chatterbox`, `piper`). ካልተጠቀሰ፣ የተጠየቀውን `language` የሚደግፍ ሞዴል በራስ-ሰር እንመርጣለን - `kokoro` ለ en/ja/zh/ko/fr/de/it/pt/es/hi/ru፣ `piper` ለሌሎች የተደገፉ ቋንቋዎች (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.)
text	string	አዎ	ወደ ንግግር የሚቀየር ጽሑፍ. ለአንድ ጥያቄ 500 ፊደላት (የማይታወቁ), 5,000 (የነፃ ምዝገባ), 1,000,000 (የተሸፈነ) ፊደላት. ረዥም መዝገቦች በሰርቨር በኩል በራሳቸው ይከፈላሉ.
voice	string	አዎ	የድምፅ አይዲ (`/v1/voices/`ን በመጠቀም የሚገኙትን ድምጾች ዝርዝር ውስጥ ያስገቡ)
format	string	አዎ	የምርቱ ቅርጸት: `mp3` (የተለመደው), `wav`, `flac`, `ogg`
speed	float	አዎ	የንግግር ፍጥነት ማብዛኛ. ቅድመ-ሁኔታ: `1.0`. ክልል: `0.5` እስከ `2.0`
language	string	አዎ	የቋንቋ ኮድ (ለምሳሌ `en`, `es`). ካልተጠቀሰ በራስ-ሰር ይታወቃል።
instructions	string	አዎ	ተግባር / ማቅረብ cues (≤500 ፊደላት). ለምሳሌ <ኮድ>\
pronunciations	object \| array	አዎ	የየጠየቀው ተናጋሪ ይተካል። `{\\`
stream	boolean	አዎ	የቀጥታ መልስ አስጀምር. ቅድመ ዕይታ: `false`

ምሳሌ

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML መለያዎች

ቍጥሮችን፣ ቀንን፣ ገንዘብን፣ የፎን ቁጥሮችን እና አጭር ቃላትን


                    
                        
                            አተረጓጎም ፋይል (_F) እንደተናገረ
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 ጥር 31, 1999
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

አተረጓጎም	ፋይል (_F)	እንደተናገረ
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	ጥር 31, 1999
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                የቀን ቅርጽ mdy ለእንግሊዝኛና dmy በሌላ ቦታ; format=\ ጋር ይቀይሩ

                
                    
                        ምሳሌ
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                መልስ
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                ሙሉ ምሳሌ
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                ንግግር ወደ ጽሑፍ
                
                    POST /v1/stt/
                
                ድምፅን ወደ ጽሑፍ ይለውጡ. 99 ቋንቋዎችን በራስ-ሰር ለይቶ ማወቅን ይደግፋል።

                የጠየቀው አካል (multipart/form-data)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                file
                                file
                                አዎ
                                የድምፅ ፋይል (MP3, WAV, FLAC, OGG, M4A, MP4, WebM)
                            
                            
                                model
                                string
                                አዎ
                                STT ሞዴል: whisper (የተቀመጠው), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                አዎ
                                የቋንቋ ኮድ. auto ለራስ-አስተዋወቅ (የተለመደው)
                            
                            
                                timestamps
                                boolean
                                አዎ
                                የቃላት-ደረጃ ሰዓት ማስታወቂያዎችን ያካትቱ. መደበኛ: false
                            
                            
                                diarize
                                boolean
                                አዎ
                                የድምፅ መዝገብ ቤትን አስጀምር። መደበኛ፦ false
                            
                        
                    
                

                መልስ
                
                    
                        የJSON መልስ
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                የድምፅ ክሎኒንግ
                
                    POST /v1/tts/clone/
                
                ንግግርን በክሎነድ ድምፅ ውስጥ ይፈጥሩ. የመዝገብ ቤት ድምፅ እና ጽሑፍን ይጫኑ

                የጠየቀው አካል (multipart/form-data)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                reference_audio
                                file
                                አዎ
                                የድምፅ ድምፅ (10-30 ሰከንዶች ይታሰባል)
                            
                            
                                text
                                string
                                አዎ
                                የድምፅ ፋይል
                            
                            
                                model
                                string
                                አዎ
                                ክሎን ሞዴል: chatterbox (የተቀመጠው), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                አዎ
                                የምርቱ ቅርጸት: mp3 (የተለመደው), wav, flac
                            
                            
                                language
                                string
                                አዎ
                                የቋንቋ ኮድ ዒላማ. የተመረጠው ሞዴል ሊደግፈው ይገባል
                            
                        
                    
                

                መልስ
                የድምፅ ፋይሉን እንደ ቢያንስ መረጃ ይመለሳል፣ እንደ TTS መጨረሻ ነጥብ ተመሳሳይ ነው።
            

            
            
                የድምፅ መለወጫ
                
                    POST /v1/voice-convert/
                
                ድምጹን እንደ ሌላ ድምፅ እንዲሰማ ይለውጡ። የድምፅ ምንጭን ጫን እና የመጨረሻ ድምፅን ይምረጡ።

                የጠየቀው አካል (multipart/form-data)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                file
                                file
                                አዎ
                                የድምፅ ፋይል (MP3, WAV, FLAC)
                            
                            
                                target_voice
                                string
                                አዎ
                                ወደሚቀየርበት የድምፅ አይዲ (/v1/voices/ን በመጠቀም የሚገኙን ድምጾች ዝርዝር ውስጥ ያስገቡ)
                            
                            
                                model
                                string
                                አዎ
                                የድምፅ መለወጫ ሞዴል: openvoice (የተለመደው), knn-vc
                            
                            
                                format
                                string
                                አዎ
                                የምርቱ ቅርጸት: wav (የተለመደው), mp3, flac
                            
                        
                    
                

                ምሳሌ
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                መልስ
                የድምፅ ፋይሉን እንደገና ያስተካክላል
            

            
            
                የንግግር ትርጉም
                
                    POST /v1/speech-translate/
                
                የተናገረውን ድምፅ ከአንድ ቋንቋ ወደ ሌላ ይተረጉሙ። ንግግር-ወደ-ጽሑፍ፣ ትርጉም፣ እና ጽሑፍ-ወደ-ንግግርን በአንድ ጥሪ ውስጥ ያቀላቅላል

                የጠየቀው አካል (multipart/form-data)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                file
                                file
                                አዎ
                                የድምፅ ፋይል በመጀመሪያ ቋንቋ.
                            
                            
                                target_language
                                string
                                አዎ
                                የቋንቋ ኮድ (ለምሳሌ es, fr, de, ja)
                            
                            
                                voice
                                string
                                አዎ
                                የቀረበው ውጤት
                            
                            
                                preserve_voice
                                boolean
                                አዎ
                                የድምፅ ባህሪያትን ለመጠበቅ ይሞክሩ. ቅድመ-ተዘጋጅ: false
                            
                        
                    
                

                መልስ
                
                    የJSON መልስ
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                ንግግር ወደ ንግግር
                
                    POST /v1/speech-to-speech/
                
                የንግግር ዘይቤን፣ ስሜትን ወይም ይዘትን በማስቀመጥ ላይ ማስተካከል። ለድምፅ፣ ለፍጥነት እና ለግልጽነት ማስተካከል ጠቃሚ ነው።

                የጠየቀው አካል (multipart/form-data)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                file
                                file
                                አዎ
                                የድምፅ ፋይል
                            
                            
                                voice
                                string
                                አዎ
                                የድምፅ ዒላማ
                            
                            
                                model
                                string
                                አዎ
                                ሞዴል: openvoice (የተቀመጠው), chatterbox
                            
                            
                                emotion
                                string
                                አዎ
                                የሚፈለገው ስሜት: neutral, happy, sad, angry, excited
                            
                            
                                speed
                                float
                                አዎ
                                የፍጥነት ማስተካከያ. ቅድመ-አያት: 1.0. ክልል: 0.5 እስከ 2.0
                            
                        
                    
                

                መልስ
                የድምፅ ፋይሉን እንደገና ያስተካክላል
            

            
            
                የድምፅ መሣሪያዎች
                የድምፅ ማቀነባበሪያ መጨረሻ ነጥቦችን ለማሻሻል, የድምፅ ማስወገድ, ቅርንጫፍ መክፈል, እና ሌሎችም.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        የድምፅ ጥራት ማሻሻል: ድምፅ ማጥፋት, ግልጽነት ማሻሻል, ከፍተኛ ልዩነት.
                        
                            
                                
                                    file file የድምፅ ፋይል
                                    denoise boolean የድምፅ ማስወገጃን አስጀምር (የተለመደው፦ እውነት)
                                    enhance_clarity boolean የንግግር ግልጽነትን ማሻሻል (የተለመደው: እውነት)
                                    super_resolution boolean የድምፅ ጥራት ይጨምሩ (የተለመደው: ስህተት)
                                    strength integer 1-3 (ቀላል, መካከለኛ, ጠንካራ)። ቅድመ ዕይታ፦ 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        ድምፆችን ከኢንስትሩመንቶች (ድምፅ ማስወገድ) ለይተው ወይም ወደ ቅርንጫፎች ይከፋፍሉ
                        
                            
                                
                                    file file የድምፅ ፋይል
                                    model string demucs (መነሻ) ወይም spleeter
                                    stems integer የጥጥ ብዛት: 2, 4, 5, ወይም 6 (የተለመደው: 2)
                                    format string የምርቱ ቅርጸት: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        የድምፅ ማስመዝገቢያዎች
                        
                            
                                
                                    file file የድምፅ ፋይል
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            ነጻ
                        
                        የድምፅ ፋይልን ለቁልፍ፣ BPM እና የጊዜ ምልክት ለመለየት አጣራ
                        
                            
                                
                                    file file የድምፅ ፋይል
                                
                            
                        
                        
                            መልስ
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            ነጻ
                        
                        ድምፅን በተለያዩ ቅርጸቶች አንቀሳቅስ
                        
                            
                                
                                    file file የድምፅ ፋይል
                                    format string የመጨረሻው ቅርጸት: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer የምርጫው ቢትሬት በኪ.ቢ.ፒ.: 64, 128, 192, 256, 320
                                    sample_rate integer ሴምፕሊንግ ፍጥነት:
                                    channels string mono ወይም stereo
                                
                            
                        
                    
                
            

            
            
                የድምፅ ውይይት
                
                    POST /v1/voice-chat/
                
                የድምፅ ወይም የጽሑፍ መልዕክት መላክ እና የተቀናጀ ንግግር ጋር AI መልስ ማግኘት.

                የጠየቀው አካል (multipart/form-data ወይም JSON)
                
                    
                        
                            መለኪያ ዓይነት ያስፈልጋል መግለጫ የለም
                        
                        
                            
                                audio
                                file
                                አዎ*
                                የድምፅ አቅርቦት (audio ወይም text ያስፈልጋል)
                            
                            
                                text
                                string
                                አዎ*
                                የጽሑፍ ማስገባት (audio ወይም text ያስፈልጋል)
                            
                            
                                voice
                                string
                                አዎ
                                ድምፅ ለ AI መልስ. መደበኛ: af_bella
                            
                            
                                tts_model
                                string
                                አዎ
                                የTTS ሞዴል ለምላሽ. ቅድመ ዕይታ: kokoro
                            
                            
                                system_prompt
                                string
                                አዎ
                                የቀን መቁጠሪያውን ቀለም
                            
                            
                                conversation_id
                                string
                                አዎ
                                የቀድሞው ውይይት እንደገና ጀምር
                            
                        
                    
                

                መልስ
                
                    የJSON መልስ
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                ቡት TTS
                
                    POST /v1/tts/batch/
                
                ለተቃራኒ TTS ማምረት ብዙ ጽሑፎችን ያቅርቡ. ሁሉም ስራዎች ከተፈጸሙ በኋላ የዌብሆክ ጥሪን ተቀበሉ

                መለኪያዎች
                
                    መለኪያ ዓይነት መግለጫ የለም
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string የምርጫው URL ለ POST ውጤቶች በባች ወቅት ሙሉ
                    
                

                መልስ
                
                    የJSON መልስ
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                የምርጫው ሂደት /v1/tts/batch/result/?batch_id=abc123 ጋር GET
            

            
            
                የድምፅ መተካት
                
                    POST /v1/voice-embed/
                
                ከመዝገብ ቤት ውስጥ የድምፅ መተካት ይጫኑ

                መለኪያዎች
                
                    መለኪያ ዓይነት መግለጫ የለም
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                መልስ
                
                    የJSON መልስ
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                የጤና ምርመራ
                
                    GET /v1/health/
                
                የጂፒዩ ሰርቨር ሁኔታን፣ የተጫኑ ሞዴሎችን፣ የፍተሻ መጠንን ይመልከቱ። ምንም ማረጋገጫ አይጠበቅም። ለ30 ሰከንዶች ተደብቋል

                መልስ
                
                    የJSON መልስ
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                ሞዴሎችን ዝርዝር
                
                    GET /v1/models/
                
                ሁሉንም የተገኙ ሞዴሎችን በችሎቶቻቸው ዝርዝር ይመልሳል

                መልስ
                
                    የJSON መልስ
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                የድምፅ ዝርዝር
                
                    GET /v1/voices/
                
                ሁሉንም የተገኙ ድምጾች ዝርዝር ይመለሳል፣ በሞዴል ወይም በቋንቋ ሊመረመር ይችላል።

                የጥያቄው መለኪያዎች
                
                    
                        
                            መለኪያ ዓይነት መግለጫ የለም
                        
                        
                            
                                model
                                string
                                በሞዴል ID አጣራ (ለምሳሌ kokoro)
                            
                            
                                language
                                string
                                በቋንቋ ኮድ አጣራ (ለምሳሌ en)
                            
                            
                                gender
                                string
                                በፆታ አጣራ: male, female, neutral
                            
                        
                    
                

                መልስ
                
                    የJSON መልስ
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                ርዕስ አዲስ
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                ለተጠናቀቀው የቲቲኤስ ስራ ተመሳሳይ የሆኑ ርዕሶችን ይፈጥራል. በድምፅ ላይ የዊስፐር ማስተካከያ ይሠራል እና SRT ወይም WebVTT ይመለሳል. ውጤቱ በዲስክ ላይ ይቀመጣል ስለዚህም ለተመሳሳይ uuid ሁለተኛ ጥሪ የዲስክ መጻፍ ነው
                የጥያቄው መለኪያዎች
                
                    
                        መለኪያ ያስፈልጋል መግለጫ የለም
                        
                            uuid አዎ የስራ UUID በ /v1/tts/ ወይም /v1/voice-clone/ ተመልሷል
                            format አዎ srt (የተለመደ) ወይም vtt.
                            download አዎ 1 Content-Disposition: attachment እንዲልክ በመሆኑም መቃኛው ከመቅረቡ ይልቅ ያስቀመጥ።
                            language አዎ ወደ ማስተካከያ ሞዴል ማስጠንቀቂያ (በራስ-ሰር ከተለየ)
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                የድምፅ መዝገበ ቃላት አዲስ
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                የቲቲኤስ ማሽንን የተወሰኑ ቃላትን እንዴት እንደሚናገሩ ንገረው። የተጠበቁ መዝገቦች በራስ-ሰር ለሚያደርጉት የቲቲኤስ ጥያቄ ሁሉ ይተገበራሉ። ለእያንዳንዱ ሒሳብ 200 መዝገቦችን ያህል ወሰኑ።
                የጠየቀው አካል (POST)
                
                    
                        መለኪያ ዓይነት መግለጫ የለም
                        
                            word string ለመተካት ቃል (ለምሳሌ GIF, Anthropic)። የቃል ጫፍ ተገናኘ።
                            replacement string ለምሳሌ jiff, ann THROP ick.
                            language string የምርጫ ISO ኮድ. ባዶ = ለሁሉም ቋንቋዎች ይሠራል.
                            case_sensitive boolean false መነሻ ነው። true ከሆነ ፊደል አጻጻፉን በትክክል ያስተካክሉ።
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                በየጠየቁት ላይ ያለማስቀመጥ መቀየር ይችላሉ - pronunciationsን በየትኛውም /v1/tts/ ጥሪ ላይ እንደ አካል ወይም እንደ አሬጅ ያካትቱ (የTTS መጨረሻ ነጥብ ፓራሜትሮችን ይመልከቱ)።
            

            
            
                ጽሑፉን ላክ አዲስ
                አንድ

መለኪያ	ዓይነት	ያስፈልጋል	መግለጫ የለም
file	file	አዎ	የድምፅ ፋይል (MP3, WAV, FLAC, OGG, M4A, MP4, WebM)
model	string	አዎ	STT ሞዴል: `whisper` (የተቀመጠው), `faster-whisper`, `sensevoice`
language	string	አዎ	የቋንቋ ኮድ. `auto` ለራስ-አስተዋወቅ (የተለመደው)
timestamps	boolean	አዎ	የቃላት-ደረጃ ሰዓት ማስታወቂያዎችን ያካትቱ. መደበኛ: `false`
diarize	boolean	አዎ	የድምፅ መዝገብ ቤትን አስጀምር። መደበኛ፦ `false`

መለኪያ	ዓይነት	ያስፈልጋል	መግለጫ የለም
reference_audio	file	አዎ	የድምፅ ድምፅ (10-30 ሰከንዶች ይታሰባል)
text	string	አዎ	የድምፅ ፋይል
model	string	አዎ	ክሎን ሞዴል: `chatterbox` (የተቀመጠው), `cosyvoice2`, `gpt-sovits`
format	string	አዎ	የምርቱ ቅርጸት: `mp3` (የተለመደው), `wav`, `flac`
language	string	አዎ	የቋንቋ ኮድ ዒላማ. የተመረጠው ሞዴል ሊደግፈው ይገባል

file file	የድምፅ ፋይል
denoise boolean	የድምፅ ማስወገጃን አስጀምር (የተለመደው፦ እውነት)
enhance_clarity boolean	የንግግር ግልጽነትን ማሻሻል (የተለመደው: እውነት)
super_resolution boolean	የድምፅ ጥራት ይጨምሩ (የተለመደው: ስህተት)
strength integer	1-3 (ቀላል, መካከለኛ, ጠንካራ)። ቅድመ ዕይታ፦ 2

file file	የድምፅ ፋይል
model string	`demucs` (መነሻ) ወይም `spleeter`
stems integer	የጥጥ ብዛት: 2, 4, 5, ወይም 6 (የተለመደው: 2)
format string	የምርቱ ቅርጸት: `wav`, `mp3`, `flac`

file file	የድምፅ ፋይል
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

መለኪያ	ዓይነት	ያስፈልጋል	መግለጫ የለም
audio	file	አዎ*	የድምፅ አቅርቦት (`audio` ወይም `text` ያስፈልጋል)
text	string	አዎ*	የጽሑፍ ማስገባት (`audio` ወይም `text` ያስፈልጋል)
voice	string	አዎ	ድምፅ ለ AI መልስ. መደበኛ: `af_bella`
tts_model	string	አዎ	የTTS ሞዴል ለምላሽ. ቅድመ ዕይታ: `kokoro`
system_prompt	string	አዎ	የቀን መቁጠሪያውን ቀለም
conversation_id	string	አዎ	የቀድሞው ውይይት እንደገና ጀምር

መለኪያ	ዓይነት	መግለጫ የለም
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	የምርጫው URL ለ POST ውጤቶች በባች ወቅት ሙሉ

መለኪያ	ዓይነት	መግለጫ የለም
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

መለኪያ	ዓይነት	መግለጫ የለም
model	string	በሞዴል ID አጣራ (ለምሳሌ `kokoro`)
language	string	በቋንቋ ኮድ አጣራ (ለምሳሌ `en`)
gender	string	በፆታ አጣራ: `male`, `female`, `neutral`

መለኪያ	ያስፈልጋል	መግለጫ የለም
uuid	አዎ	የስራ UUID በ /v1/tts/ ወይም /v1/voice-clone/ ተመልሷል
format	አዎ	`srt` (የተለመደ) ወይም `vtt`.
download	አዎ	`1` `Content-Disposition: attachment` እንዲልክ `በመሆኑም መቃኛው ከመቅረቡ ይልቅ ያስቀመጥ።`
language	አዎ	ወደ ማስተካከያ ሞዴል ማስጠንቀቂያ (በራስ-ሰር ከተለየ)

መለኪያ	ዓይነት	መግለጫ የለም
word	string	ለመተካት ቃል (ለምሳሌ `GIF`, `Anthropic`)። የቃል ጫፍ ተገናኘ።
replacement	string	ለምሳሌ `jiff`, `ann THROP ick`.
language	string	የምርጫ ISO ኮድ. ባዶ = ለሁሉም ቋንቋዎች ይሠራል.
case_sensitive	boolean	`false` መነሻ ነው። `true` ከሆነ ፊደል አጻጻፉን በትክክል ያስተካክሉ።