Kif nista' nikseb ċavetta API?

Irreġistra għal kont TTS.ai b'xejn, imbagħad naviga lejn id-dashboard tal-kont tiegħek u kklikkja "Ġenera l-API Key." Iċ-ċavetta tiegħek se tkun prefissata bi sk-tts- u tista 'tintuża immedjatament. Kontijiet b'xejn jirċievu 15,000 karattru biex jibdew.

L-API hija kompatibbli mal-format ta' OpenAI?

Iva, l-API tagħna ssegwi formati ta' talba u tweġiba kompatibbli ma' OpenAI.Jekk għandek kodiċi eżistenti li juża l-API TTS ta' OpenAI, tista' taqleb għal TTS.ai billi tbiddel il-URL bażi u l-API key b'bidliet minimi fil-kodiċi.

Liema lingwi ta’ programmazzjoni huma appoġġati?

L-API REST taħdem ma' kwalunkwe lingwa li tista' tagħmel talbiet HTTP. Aħna nipprovdu eżempji ta' kodiċi f'Python, JavaScript (Node.js u browser), cURL, u aktar.Kull lingwa b'librerija tal-klijent HTTP (Go, Ruby, Java, C#, PHP, eċċ.) tista' tuża l-API.

X'inhuma l-limiti tar-rata tal-API?

Kontijiet ħielsa huma limitati għal 3 talbiet fis-siegħa. pjanijiet imħallsa jkollhom limiti ogħla bbażati fuq il-livell tal-abbonament tiegħek: Starter (60/siegħa), Professjonali (300/siegħa), Intrapriża (illimitat). rata limitu headers huma inklużi f'kull tweġiba API.

Kif jaħdem l-ipprezzar tal-API?

L-użu tal-API jikkunsma karattri bbażati fuq il-livell tal-mudell u t-tul tat-test.Mudelli ħielsa jużaw 0 karattri, mudelli standard jużaw karattri 2x, u mudelli premium jużaw karattri 4x.Karattri huma inklużi fil-pjanijiet kollha mħallsa u jistgħu wkoll jinxtraw separatament bħala pakketti karattru.

Liema endpoints huma disponibbli?

L-API tipprovdi endpoints għal test-to-speech (POST /v1/tts/), diskors-to-text (POST /v1/transcribe/), klonar tal-vuċi (POST /v1/voice-clone/), konverżjoni tal-vuċi (POST /v1/voice-convert/), traduzzjoni tal-vuċi (POST /v1/speech-translate/), titjib tal-awdjo (POST /v1/audio-enhance/), tneħħija tal-vuċi, qsim taż-żerriegħa, analiżi ewlenija u BPM, u aktar.

Liema formati awdjo l-API jirritorna?

L-API tirritorna awdjo fil-format WAV b'mod awtomatiku. Tista' tispeċifika l-format tal-output (mp3, wav, ogg, flac) billi tuża l-parametru response_format. MP3 huwa rakkomandat għal applikazzjonijiet tal-web, WAV għal aktar ipproċessar tal-awdjo.

Hemm API streaming għal TTS f'ħin reali?

Iva, l-API asinkrona tagħna tirritorna UUID tax-xogħol li tista' tissottometti għall-votazzjoni għar-riżultati. Għall-mudelli appoġġjati bħal Kokoro, il-ġenerazzjoni tal-awdjo hija mgħaġġla biżżejjed għal applikazzjonijiet kważi fil-ħin reali.

Kif nittratta l-iżbalji fl-API?

L-API tirritorna kodiċijiet standard tal-istatus HTTP (400 għal talbiet ħżiena, 401 għal żbalji ta' awtentikazzjoni, 429 għal limiti tar-rata, 500 għal żbalji tas-server) b'messaġġi ta' żball JSON Dejjem iċċekkja l-kodiċi tal-istatus u l-qasam tal-iżball fit-tweġibiet għall-immaniġġjar xieraq tal-iżbalji.

Nista' nuża l-API għal applikazzjonijiet kummerċjali?

Iva, l-API hija maħsuba għal użu kummerċjali. l-awdjo ġġenerat permezz tal-API jistgħu jintużaw fil-prodotti tiegħek, applikazzjonijiet, u servizzi. il-mudelli kollha jużaw liċenzji open-source, u m'hemm l-ebda royalties addizzjonali fuq awdjo ġġenerat.

Hemm sandbox jew ambjent tal-ittestjar?

Mudelli b'livell ħieles (Kokoro, Piper, VITS, MeloTTS) iservu bħala sandbox eċċellenti — jużaw karattri żero u huma disponibbli għall-kontijiet kollha.Ittestja l-integrazzjoni tiegħek b'mudelli b'xejn qabel ma taqleb għal mudelli premium għall-użu tal-produzzjoni.

Kif nagħmel lista tal-vuċijiet u l-mudelli disponibbli permezz tal-API?

Uża GET /v1/voices biex telenka l-ilħna kollha disponibbli b'għażliet ta' filtrazzjoni (mudell, lingwa, sess).Uża GET /v1/models biex telenka l-mudelli kollha disponibbli tat-TTS bil-kapaċitajiet tagħhom u l-informazzjoni dwar il-livell.Iż-żewġ punti aħħarin jirritornaw tweġibiet JSON.

Irrapporta Bug / Feature Talba

Dokumentazzjoni tal-API

Integra TTS.ai fl-applikazzjonijiet tiegħek mal-REST API tagħna. OpenAI-format kompatibbli għall-migrazzjoni faċli.

REST API Kompatibbli ma’ OpenAI Tweġibiet JSON Appoġġ għall-Istrimjar

Ħarsa ġenerali

L-API TTS.ai tipprovdi aċċess programmatiku għall-karatteristiċi kollha tal-pjattaforma: sinteżi minn test għal diskors, traskrizzjoni minn diskors għal test, klonazzjoni tal-vuċi, titjib tal-awdjo, u aktar.L-API tuża konvenzjonijiet REST standard b'korpi ta' talba/rispons JSON.

Ċavetta API

Ikseb iċ-ċavetta API tiegħek minn Settings tal-Kont. Disponibbli fuq il-pjanijiet Pro u Enterprise.

URL bażiku

https://api.tts.ai/v1/

Awtorizzazzjoni

Token tad-detentur permezz ta’ Authorization intestatura

Awtentikazzjoni

Livell ħieles - l-ebda ċavetta meħtieġa. Anonymous POSTS biex /v1/tts/ xogħol mingħajr ebda awt, sa 5,000 karattri/jum għal kull IP, bl-użu ta' kwalunkwe mill-mudelli ħielsa tagħna (piper, vits, melotts, kokoro). Sign up għal kont b'xejn biex tikseb 15,000 karattri bonus u l-aċċess għall-mudelli premium.

Għall-mudelli premium u limiti ta' rata ogħla, awtentika b'token Bearer fil- Authorization intestatura.

Intestatura HTTP

Authorization: Bearer sk-tts-your-api-key-here

Żomm iċ-ċavetta API tiegħek sigrieta. M'għandekx taqsamha fil-kodiċi tan-naħa tal-klijent, repożitorji pubbliċi, jew żraben.Rotate ċwievet regolarment mill-settings tal-kont tiegħek.

SDKs

SDKs uffiċjali jagħmluha faċli biex tintegra TTS.ai fl-applikazzjoni tiegħek.It-tnejn huma sors miftuħ u disponibbli fuq GitHub.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

URL bażiku

URL bażiku: https://api.tts.ai/v1/

Il-punti tat-tmiem kollha huma relattivi għal dan il-URL bażiku. Pereżempju, il-punt tat-tmiem tat-TTS huwa:

POST https://api.tts.ai/v1/tts/

Limiti tar-rata

Il-limiti tar-rata tal-API jvarjaw skont il-pjan:

Pjan	Talbiet/min	Konkorrenti	Tul massimu tat-test
Ħieles	10	2	500 karattru
Starter	30	3	1,000,000 karattru
Għal	60	5	1,000,000 karattru
Intrapriża	300	20	50,000 karattru

L-intestaturi tal-limitu tar-rata huma inklużi f’kull tweġiba: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Spejjeż tal-kreditu

Servizz	Spejjeż	Unità
TTS (mudelli ħielsa: Piper, VITS, MeloTTS)	1,000 karattru	għal kull 1,000 karattru
TTS (mudelli standard: Kokoro, CosyVoice 2, eċċ.)	2,000 karattru	għal kull 1,000 karattru
TTS (mudelli Premium: Tortoise, Chatterbox, eċċ.)	4 krediti	għal kull 1,000 karattru
Diskors għal Test	2,000 karattru	kull minuta ta’ awdjo
Klonazzjoni tal-vuċi	4 krediti	għal kull 1,000 karattru
Bidla tal-vuċi	3,000 karattru	kull minuta ta’ awdjo
Titjib tal-awdjo	2,000 karattru	kull minuta ta’ awdjo
Tneħħija vokali / Qsim tal-Zemgħa	3,000-4,000 karattru	kull minuta ta’ awdjo
Traduzzjoni tad-diskors	5,000 karattru	kull minuta ta’ awdjo
Chat bil-vuċi	3,000 karattru	għal kull dawra
Ewlenin & BPM Finder	Ħieles	--
Konvertitur tal-awdjo	Ħieles	--

Test għal Diskors

POST /v1/tts/

Ikkonverti test għall-awdjo diskors. Jirritorna fajl awdjo fil-format mitlub.

Korp tat-talba

Parametru	Tip	Meħtieġ	Deskrizzjoni
model	string	Nru	ID tal-mudell (eż., `kokoro`, `chatterbox`, `piper`). Jekk jitħalla barra, aħna nagħżlu awtomatikament mudell li jappoġġa l-`lingwa` mitluba — `kokoro` għal en/ja/zh/ko/fr/de/it/pt/es/hi/ru, `piper` għal lingwi oħra appoġġati (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/eċċ.).
text	string	Iva	Test biex jikkonverti għal diskors. Per-talba cap: 500 karattri (anonimi), 5,000 (kont b'xejn), 1,000,000 (pjan imħallas). inputs twal huma auto-chunked server-side.
voice	string	Iva	Voice ID (uża `/v1/voices/` biex telenka l-vuċijiet disponibbli)
format	string	Nru	Format tal-output: `mp3` (predefinit), `wav`, `flac`, `ogg`
speed	float	Nru	Multiplikatur tal-veloċità tat-taħdit. Default: `1.0`. Range: `0.5` to `2.0`
language	string	Nru	Kodiċi tal-lingwa (eż. `en`, `es`). Jinstab awtomatikament jekk jitħalla barra.
instructions	string	Nru	Indikaturi li jaġixxu/li jwasslu (≤500 karattru). eż. \
pronunciations	object \| array	Nru	Per-talba pronunzja overrides. Jew `{\`
stream	boolean	Nru	Attiva r-rispons tal-fluss. Default: `false`

Eżempju ta’ Talba

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

Tags SSML

Numri tal-wrap, dati, munita, numri tat-telefown, u akronimi fil


                    
                        
                            interpreta-as Input Mitkellma bħala
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 Diċembru wieħed u tletin, dsatax disgħa u disgħa
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

interpreta-as	Input	Mitkellma bħala
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	Diċembru wieħed u tletin, dsatax disgħa u disgħa
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                Il-format tad-data huwa mdy għall-Ingliż u dmy x'imkien ieħor; tħassar b'format=\

                
                    
                        Eżempju
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                Rispons
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                Eżempju sħiħ
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                Diskors għal Test
                
                    POST /v1/stt/
                
                Traskrizzjoni awdjo għat-test. Jappoġġja 99 lingwi bil-awto-sejbien.

                Korp tat-talba (multipart/form-data)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                file
                                file
                                Iva
                                Fajl awdjo (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Max 100MB.
                            
                            
                                model
                                string
                                Nru
                                Mudell STT: whisper (default), faster-whisper, sensevoice
                            
                            
                                language
                                string
                                Nru
                                Kodiċi tal-lingwa. auto għall-iskoperta awtomatika (default).
                            
                            
                                timestamps
                                boolean
                                Nru
                                Inkludi timestamps fil-livell tal-kelma. Default: false
                            
                            
                                diarize
                                boolean
                                Nru
                                Attiva d-dijarizzazzjoni tal-kelliem. Default: false
                            
                        
                    
                

                Rispons
                
                    
                        Rispons JSON
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                Klonazzjoni tal-vuċi
                
                    POST /v1/tts/clone/
                
                Jiġġeneraw diskors fil-vuċi kklonat. Upload referenza awdjo u test.

                Korp tat-talba (multipart/form-data)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                reference_audio
                                file
                                Iva
                                Referenza vuċi awdjo (10-30 sekonda rakkomandati). Max 20MB.
                            
                            
                                text
                                string
                                Iva
                                Test biex jitkellmu fil-vuċi klonizzati.
                            
                            
                                model
                                string
                                Nru
                                Mudell tal-klonu: chatterbox (default), cosyvoice2, gpt-sovits
                            
                            
                                format
                                string
                                Nru
                                Format tal-output: mp3 (default), wav, flac
                            
                            
                                language
                                string
                                Nru
                                Kodiċi tal-lingwa fil-mira. Għandu jkun appoġġjat mill-mudell magħżul.
                            
                        
                    
                

                Rispons
                Jirritorna l-fajl awdjo bħala data binarju, l-istess bħall-punt aħħari TTS.
            

            
            
                Bidla tal-vuċi
                
                    POST /v1/voice-convert/
                
                Ikkonverti l-awdjo biex ħoss bħal vuċi differenti. Upload awdjo sors u jagħżlu vuċi fil-mira.

                Korp tat-talba (multipart/form-data)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                file
                                file
                                Iva
                                Fajl awdjo sors (MP3, WAV, FLAC). Max 50MB.
                            
                            
                                target_voice
                                string
                                Iva
                                ID tal-vuċi fil-mira li trid tikkonverti (uża /v1/voices/ biex telenka l-vuċijiet disponibbli)
                            
                            
                                model
                                string
                                Nru
                                Mudell ta’ konverżjoni tal-vuċi: openvoice (default), knn-vc
                            
                            
                                format
                                string
                                Nru
                                Format tal-output: wav (default), mp3, flac
                            
                        
                    
                

                Eżempju ta’ Talba
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                Rispons
                Jirritorna l-fajl awdjo konvertiti bħala data binarju.
            

            
            
                Traduzzjoni tad-diskors
                
                    POST /v1/speech-translate/
                
                Ittraduċi l-awdjo mitkellem minn lingwa waħda għall-oħra.Tgħaqqad diskors-to-test, traduzzjoni, u test-to-diskors f'sejħa waħda.

                Korp tat-talba (multipart/form-data)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                file
                                file
                                Iva
                                Fajl awdjo tas-sors bil-lingwa oriġinali. Max 100MB.
                            
                            
                                target_language
                                string
                                Iva
                                Kodiċi tal-lingwa fil-mira (eż. es, fr, de, ja)
                            
                            
                                voice
                                string
                                Nru
                                Leħen għall-output tradott. Auto-magħżula jekk ommi.
                            
                            
                                preserve_voice
                                boolean
                                Nru
                                Jipprova jippreserva l-karatteristiċi tal-vuċi tal-kelliem oriġinali. Default: false
                            
                        
                    
                

                Rispons
                
                    Rispons JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                Diskors għal Diskors
                
                    POST /v1/speech-to-speech/
                
                Ittrasforma l-istil tad-diskors, l-emozzjoni jew il-kunsinna filwaqt li żżomm il-kontenut.Utli għall-aġġustament tat-ton, il-pacing u l-espressjoni.

                Korp tat-talba (multipart/form-data)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                file
                                file
                                Iva
                                Fajl awdjo tad-diskors tas-sors. Max 50MB.
                            
                            
                                voice
                                string
                                Iva
                                ID tal-vuċi fil-mira għad-diskors tal-output
                            
                            
                                model
                                string
                                Nru
                                Mudell: openvoice (default), chatterbox
                            
                            
                                emotion
                                string
                                Nru
                                Emozzjoni fil-mira: newtrali, ferħan, imdejjaq, irrabjat, eċċitat
                            
                            
                                speed
                                float
                                Nru
                                Aġġustament tal-veloċità. Default: 1.0. Medda: 0.5 sa 2.0
                            
                        
                    
                

                Rispons
                Jirritorna l-fajl awdjo trasformati bħala data binarju.
            

            
            
                Għodod tal-awdjo
                Punti tat-tmiem tal-ipproċessar tal-awdjo għat-titjib, it-tneħħija vokali, il-qsim taż-żerriegħa, u aktar.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        Ittejjeb il-kwalità tal-awdjo: denoise, ittejjeb iċ-ċarezza, riżoluzzjoni super.
                        
                            
                                
                                    file file Fajl awdjo biex ittejjeb
                                    denoise boolean Attiva l-eliminazzjoni tal-ħsejjes (default: true)
                                    enhance_clarity boolean Ittejjeb iċ-ċarezza tad-diskors (default: veru)
                                    super_resolution boolean Upscale kwalità awdjo (default: falza)
                                    strength integer 1-3 (dawl, medju, qawwi). Default: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        Separa vokali minn strumentali (tneħħija vokali) jew maqsuma fi zkuk.
                        
                            
                                
                                    file file Fajl awdjo biex jissepara
                                    model string demucs (default) jew spleeter
                                    stems integer Numru ta' zkuk: 2, 4, 5, jew 6 (default: 2)
                                    format string Format tal-output: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        Neħħi eko u reverb minn reġistrazzjonijiet awdjo.
                        
                            
                                
                                    file file Fajl awdjo li għandu jiġi pproċessat
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            Liberi
                        
                        Analiżi awdjo biex jiskopru ewlenin, BPM, u l-firma ħin.
                        
                            
                                
                                    file file Fajl awdjo biex jiġi analizzat
                                
                            
                        
                        
                            Rispons
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            Liberi
                        
                        Ikkonverti awdjo bejn formati.
                        
                            
                                
                                    file file Fajl awdjo biex jikkonverti
                                    format string Format fil-mira: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer Bitrate tal-output f’kbps: 64, 128, 192, 256, 320
                                    sample_rate integer Rata tal-kampjun: 22050, 44100, 48000
                                    channels string mono jew stereo
                                
                            
                        
                    
                
            

            
            
                Chat bil-vuċi
                
                    POST /v1/voice-chat/
                
                Ibgħat awdjo jew test u tirċievi tweġiba AI b'diskors sintetizzat.

                Korp tat-talba (multipart/form-data jew JSON)
                
                    
                        
                            Parametru Tip Meħtieġ Deskrizzjoni
                        
                        
                            
                                audio
                                file
                                Nru*
                                Input awdjo (jew awdjo jew test meħtieġ)
                            
                            
                                text
                                string
                                Nru*
                                Input tat-test (jeħtieġ awdjo jew test)
                            
                            
                                voice
                                string
                                Nru
                                Leħen għat-tweġiba tal-AI. Default: af_bella
                            
                            
                                tts_model
                                string
                                Nru
                                Mudell TTS għar-rispons. Default: kokoro
                            
                            
                                system_prompt
                                string
                                Nru
                                Custom sistema prompt għall-AI
                            
                            
                                conversation_id
                                string
                                Nru
                                Tkompli konverżazzjoni eżistenti
                            
                        
                    
                

                Rispons
                
                    Rispons JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                Lott TTS
                
                    POST /v1/tts/batch/
                
                Jippreżentaw testi multipli għall-ġenerazzjoni TTS paralleli. Faċilment jirċievu webhook callback meta l-impjiegi kollha jitlestew.

                Parametri
                
                    Parametru Tip Deskrizzjoni
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string URL fakultattiv biex POST riżultati meta lott jitlesta.
                    
                

                Rispons
                
                    Rispons JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                Progress tal-istħarriġ permezz ta’ GET /v1/tts/batch/result/?batch_id=abc123
            

            
            
                Inkorporazzjoni tal-vuċi
                
                    POST /v1/voice-embed/
                
                Uża l-embed_id li tirritorna fit-talbiet sussegwenti ta' klonazzjoni tal-vuċi għall-ġenerazzjoni kważi istantanja.

                Parametri
                
                    Parametru Tip Deskrizzjoni
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                Rispons
                
                    Rispons JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                Kontroll tas-Saħħa
                
                    GET /v1/health/
                
                Iċċekkja l-istatus tas-server tal-GPU, il-mudelli mgħobbija, u d-daqs tal-kju. L-ebda awtentikazzjoni mhi meħtieġa. Cached for 30 seconds.

                Rispons
                
                    Rispons JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                Lista tal-mudelli
                
                    GET /v1/models/
                
                Jirritorna lista tal-mudelli kollha disponibbli bil-kapaċitajiet tagħhom.

                Rispons
                
                    Rispons JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                Lista ta’ vuċijiet
                
                    GET /v1/voices/
                
                Jirritorna lista tal-vuċijiet kollha disponibbli, fakultattivament iffiltrati skont il-mudell jew il-lingwa.

                Parametri tal-mistoqsija
                
                    
                        
                            Parametru Tip Deskrizzjoni
                        
                        
                            
                                model
                                string
                                Iffiltra skont l-ID tal-mudell (eż. kokoro)
                            
                            
                                language
                                string
                                Iffiltra skont il-kodiċi tal-lingwa (eż. mt)
                            
                            
                                gender
                                string
                                Iffiltra skont is-sess: irġiel, nisa, newtrali
                            
                        
                    
                

                Rispons
                
                    Rispons JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                Sottotitoli (SRT / VTT) ġdid
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                Jiġġenera sottotitli sinkronizzati għal kull xogħol TTS komplut. Jaħdem l-allinjament Whisper fuq l-awdjo u jirritorna SRT jew WebVTT. Ir-riżultat huwa cached fuq id-diska sabiex it-tieni sejħa għall-istess uuid tkun qari tad-diska.
                Parametri tal-mistoqsija
                
                    
                        Parametru Meħtieġ Deskrizzjoni
                        
                            uuid Iva UUID tax-xogħol li tirritorna minn /v1/tts/ jew /v1/voice-clone/.
                            format Nru srt (default) jew vtt.
                            download Nru 1 biex tibgħat Content-Disposition: attachment sabiex il-brawżer jiffranka minflok juri.
                            language Nru Ħjiel għall-mudell ta’ allinjament (jinstab awtomatikament jekk jitħalla barra).
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                Dizzjunarju tal-Pronunzja ġdid
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                Għid lill-magna tat-TTS kif tippronunzja kliem speċifiku. L-entrati ssejvjati japplikaw awtomatikament għal kull talba tat-TTS li tagħmel.
                Korp tat-talba (POST)
                
                    
                        Parametru Tip Deskrizzjoni
                        
                            word string Kelma li għandha tiġi ssostitwita (eż. GIF, Anthropic). Il-konfini tal-kelma jaqblu.
                            replacement string Kif tispellih għall-mudell (eż. jiff, ann THROP ick).
                            language string Kodiċi ISO fakultattiv. vojt = japplika għal-lingwi kollha.
                            case_sensitive boolean false default. Match każ eżattament meta true.
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                Tista' wkoll tgħaddi overrides għal kull talba mingħajr ma ssalvahom — inkluż pronunciations fuq kull sejħa /v1/tts/ jew bħala oġġett jew bħala array (ara l-parametri tal-punt aħħari tat-TTS).
            

            
            
                Artikolu Narratur ġdid
                Waqqa

Parametru	Tip	Meħtieġ	Deskrizzjoni
file	file	Iva	Fajl awdjo (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Max 100MB.
model	string	Nru	Mudell STT: `whisper` (default), `faster-whisper`, `sensevoice`
language	string	Nru	Kodiċi tal-lingwa. `auto` għall-iskoperta awtomatika (default).
timestamps	boolean	Nru	Inkludi timestamps fil-livell tal-kelma. Default: `false`
diarize	boolean	Nru	Attiva d-dijarizzazzjoni tal-kelliem. Default: `false`

Parametru	Tip	Meħtieġ	Deskrizzjoni
reference_audio	file	Iva	Referenza vuċi awdjo (10-30 sekonda rakkomandati). Max 20MB.
text	string	Iva	Test biex jitkellmu fil-vuċi klonizzati.
model	string	Nru	Mudell tal-klonu: `chatterbox` (default), `cosyvoice2`, `gpt-sovits`
format	string	Nru	Format tal-output: `mp3` (default), `wav`, `flac`
language	string	Nru	Kodiċi tal-lingwa fil-mira. Għandu jkun appoġġjat mill-mudell magħżul.

Parametru	Tip	Meħtieġ	Deskrizzjoni
file	file	Iva	Fajl awdjo sors (MP3, WAV, FLAC). Max 50MB.
target_voice	string	Iva	ID tal-vuċi fil-mira li trid tikkonverti (uża `/v1/voices/` biex telenka l-vuċijiet disponibbli)
model	string	Nru	Mudell ta’ konverżjoni tal-vuċi: `openvoice` (default), `knn-vc`
format	string	Nru	Format tal-output: `wav` (default), `mp3`, `flac`

Parametru	Tip	Meħtieġ	Deskrizzjoni
file	file	Iva	Fajl awdjo tas-sors bil-lingwa oriġinali. Max 100MB.
target_language	string	Iva	Kodiċi tal-lingwa fil-mira (eż. `es`, `fr`, `de`, `ja`)
voice	string	Nru	Leħen għall-output tradott. Auto-magħżula jekk ommi.
preserve_voice	boolean	Nru	Jipprova jippreserva l-karatteristiċi tal-vuċi tal-kelliem oriġinali. Default: `false`

Parametru	Tip	Meħtieġ	Deskrizzjoni
file	file	Iva	Fajl awdjo tad-diskors tas-sors. Max 50MB.
voice	string	Iva	ID tal-vuċi fil-mira għad-diskors tal-output
model	string	Nru	Mudell: `openvoice` (default), `chatterbox`
emotion	string	Nru	Emozzjoni fil-mira: `newtrali`, `ferħan`, `imdejjaq`, `irrabjat`, `eċċitat`
speed	float	Nru	Aġġustament tal-veloċità. Default: `1.0`. Medda: `0.5` sa `2.0`

file file	Fajl awdjo biex ittejjeb
denoise boolean	Attiva l-eliminazzjoni tal-ħsejjes (default: true)
enhance_clarity boolean	Ittejjeb iċ-ċarezza tad-diskors (default: veru)
super_resolution boolean	Upscale kwalità awdjo (default: falza)
strength integer	1-3 (dawl, medju, qawwi). Default: 2

file file	Fajl awdjo biex jissepara
model string	`demucs` (default) jew `spleeter`
stems integer	Numru ta' zkuk: 2, 4, 5, jew 6 (default: 2)
format string	Format tal-output: `wav`, `mp3`, `flac`

file file	Fajl awdjo li għandu jiġi pproċessat
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	Fajl awdjo biex jikkonverti
format string	Format fil-mira: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	Bitrate tal-output f’kbps: 64, 128, 192, 256, 320
sample_rate integer	Rata tal-kampjun: 22050, 44100, 48000
channels string	`mono` jew `stereo`

Parametru	Tip	Meħtieġ	Deskrizzjoni
audio	file	Nru*	Input awdjo (jew `awdjo` jew `test` meħtieġ)
text	string	Nru*	Input tat-test (jeħtieġ `awdjo` jew `test`)
voice	string	Nru	Leħen għat-tweġiba tal-AI. Default: `af_bella`
tts_model	string	Nru	Mudell TTS għar-rispons. Default: `kokoro`
system_prompt	string	Nru	Custom sistema prompt għall-AI
conversation_id	string	Nru	Tkompli konverżazzjoni eżistenti

Parametru	Tip	Deskrizzjoni
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	URL fakultattiv biex POST riżultati meta lott jitlesta.

Parametru	Tip	Deskrizzjoni
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Parametru	Tip	Deskrizzjoni
model	string	Iffiltra skont l-ID tal-mudell (eż. `kokoro`)
language	string	Iffiltra skont il-kodiċi tal-lingwa (eż. `mt`)
gender	string	Iffiltra skont is-sess: `irġiel`, `nisa`, `newtrali`

Parametru	Meħtieġ	Deskrizzjoni
uuid	Iva	UUID tax-xogħol li tirritorna minn /v1/tts/ jew /v1/voice-clone/.
format	Nru	`srt` (default) jew `vtt`.
download	Nru	`1` biex tibgħat `Content-Disposition: attachment` sabiex il-brawżer jiffranka minflok juri.
language	Nru	Ħjiel għall-mudell ta’ allinjament (jinstab awtomatikament jekk jitħalla barra).

Parametru	Tip	Deskrizzjoni
word	string	Kelma li għandha tiġi ssostitwita (eż. `GIF`, `Anthropic`). Il-konfini tal-kelma jaqblu.
replacement	string	Kif tispellih għall-mudell (eż. `jiff`, `ann THROP ick`).
language	string	Kodiċi ISO fakultattiv. vojt = japplika għal-lingwi kollha.
case_sensitive	boolean	`false` default. Match każ eżattament meta `true`.