Doiciméadú API

Comhtháthú TTS.ai i do chuid iarratais lenár REST API. OpenAI-comhoiriúnach formáid le haghaidh imirce éasca.

API REST Comhoiriúnach do OpenAI Freagraí JSON Tacaíocht Sruthaithe

Forbhreathnú

Soláthraíonn an API TTS.ai rochtain ríomhchláraithe ar gach gné den ardán: sintéis téacs-go-urlabhra, trascríobh ó chaint go téacs, clónáil gutha, feabhsú fuaime, agus níos mó.Baineann an API úsáid as coinbhinsiúin chaighdeánacha REST le comhlachtaí iarratais / freagartha JSON.

Eochair API

Faigh d'eochair API ó Socruithe Cuntais. Ar fáil ar phleananna Pro agus Fiontair.

URL Bunúsach

https://api.tts.ai/v1/

Údarú

Comhartha iompróra trí Authorization ceanntásc

Fíordheimhniú

Sraith saor in aisce - níl aon eochair ag teastáil. Postanna gan ainm chuig /v1/tts/ obair gan aon auth, suas le 5,000 carachtair / lá in aghaidh an IP, ag baint úsáide as aon cheann dár samhlacha saor in aisce (piper, vits, melotts, kokoro). Cláraigh le haghaidh cuntas saor in aisce a fháil 15,000 carachtair bónas agus rochtain ar samhlacha préimhe.

Éilíonn gach iarratas API fíordheimhniú trí chomhartha Bearer sa Authorization ceanntásc.

Ceanntásc HTTP
Authorization: Bearer sk-tts-your-api-key-here
Coinnigh d'eochair API faoi rún. Ná roinn é i gcód taobh an chliaint, i stórtha poiblí, nó i logaí. Rothlaigh eochracha go rialta ó shocruithe do chuntais.

SDKanna

Tá SDKanna oifigiúla ann a éascaíonn TTS.ai a chomhtháthú i d’iarratas.Tá an dá cheann acu foinse oscailte agus ar fáil ar GitHub.

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

URL Bunúsach

URL Bunúsach: https://api.tts.ai/v1/

Tá gach críochphointe coibhneasta leis an mbonn- URL seo. Mar shampla, is é seo an críochphointe TTS:

POST https://api.tts.ai/v1/tts/

Teorainneacha Ráta

Athraíonn teorainneacha ráta API de réir plean:

Plean Iarratais/ nóiméad Comhuaineach Fad Uasta Téacs
Saor 10 2 500 carachtar
Tosaitheoir 30 3 1,000,000 carachtar
Pro 60 5 1,000,000 carachtar
Fiontraíocht 300 20 50,000 carachtar

Tá ceannteidil teorainn ráta san áireamh i ngach freagra: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Costais Chreidmheasa

Seirbhís Costas Aonad
TTS (samhlacha saor in aisce: Piper, VITS, MeloTTS) 1 chreidmheas in aghaidh 1, 000 carachtar
TTS (samhlacha caighdeánacha: Kokoro, CosyVoice 2, etc.) 2 creidmheasanna in aghaidh 1, 000 carachtar
TTS (samhlacha Préimhe: Tortoise, Chatterbox, etc.) 4 creidmheasanna in aghaidh 1, 000 carachtar
Urlabhra go Téacs 2 creidmheasanna in aghaidh an nóiméid fuaime
Clónáil Gutha 4 creidmheasanna in aghaidh 1, 000 carachtar
Athraigh GuthName 3 creidmheasanna in aghaidh an nóiméid fuaime
Feabhsú Fuaime 2 creidmheasanna in aghaidh an nóiméid fuaime
Deireadh a chur le Guth / Scaipeadh Stem 3-4 creidmheas in aghaidh an nóiméid fuaime
Aistriúchán Urlabhra 5 creidmheasanna in aghaidh an nóiméid fuaime
Comhrá GuthaComment 3 creidmheasanna in aghaidh an tsaoil
Aimsitheoir Eochair & BPM Saor --
Tiontaire FuaimeName Saor --

Téacs- go- Caint

POST /v1/tts/

Tiontaigh téacs go fuaime cainte. Fillfidh sé seo comhad fuaime san fhormáid iarrtha.

Corp an Iarratais

ParaiméadairCineálRiachtanachCur Síos
model string & Ná Sábháil Aitheantas Samhail (m.sh. kokoro, chatterbox, piper)
text string Téacs le tiontú go caint (uasmhéid 5,000 carachtar le haghaidh Pro, 50,000 le haghaidh Enterprise)
voice string Aitheantas Gutha (úsáid /v1/voices/ chun na guthanna atá ar fáil a liostáil)
format string & Ná Sábháil Formáid aschurtha: mp3 (réamhshocraithe), wav, flac, ogg
speed float & Ná Sábháil Iolraitheoir luais labhartha. Réamhshocrú: 1.0. Raon: 0.5 go 2.0
language string & Ná Sábháil Cód teanga (m.sh. en, es). Braitear go huathoibríoch é má fhágtar ar lár é.
instructions string & Ná Sábháil Cúiseanna gníomhaíochta / seachadta (≤500 carachtar). m.sh. \
pronunciations object | array & Ná Sábháil Sáraithear fuaimniú de réir iarratais. {\
stream boolean & Ná Sábháil Cumasaigh freagra sruthaithe. Réamhshocrú: false

Iarratas Samplach

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

Clibeanna SSML

Uimhreacha, dátaí, airgeadra, uimhreacha teileafóin, agus acrainmneacha a fhilleadh i

interpret- asIonchurLabhairt mar
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31Nollaig tríocha-aon, naoi déag nócha-naoi
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

Formáid réamhshocraithe an dáta: mdy le haghaidh Béarla agus dmy in áiteanna eile; sáraigh le format=\

Sampla
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

Freagra

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

Sampla iomlán

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

Urlabhra go Téacs

POST /v1/stt/

Trascríobh fuaime go téacs. Tacaíonn 99 teanga le auto- bhrath.

Corp an Iarratais (multipart/form-data)

ParaiméadairCineálRiachtanachCur Síos
file file Comhad fuaime (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Uasmhéid 100MB.
model string & Ná Sábháil Samhail STT: whisper (réamhshocrú), faster-whisper, sensevoice
language string & Ná Sábháil Cód teanga. auto le haghaidh braite uathoibríoch (réamhshocrú).
timestamps boolean & Ná Sábháil Cuir stampaí ama ar leibhéal focal san áireamh. Réamhshocrú: false
diarize boolean & Ná Sábháil Cumasaigh diailiú cainteoirí. Réamhshocrú: false

Freagra

Freagra JSON
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

Clónáil Gutha

POST /v1/tts/clone/

Gineann sé seo guth clónáilte. Uasluchtaigh fuaim agus téacs tagartha.

Corp an Iarratais (multipart/form-data)

ParaiméadairCineálRiachtanachCur Síos
reference_audio file Fuaim guth tagartha (moltar 10-30 soicind). Max 20MB.
text string Téacs le labhairt sa ghuth clónáilte.
model string & Ná Sábháil Samhail chlónála: chatterbox (réamhshocrú), cosyvoice2, gpt-sovits
format string & Ná Sábháil Formáid aschurtha: mp3 (réamhshocraithe), wav, flac
language string & Ná Sábháil Cód na sprioctheanga. Caithfidh an tsamhail roghnaithe tacú leis.

Freagra

Fill an comhad fuaime mar shonraí dénártha, mar an gcéanna leis an gcríochphointe TTS.

Athraigh GuthName

POST /v1/voice-convert/

Tiontaigh fuaime a fhuaim cosúil le guth éagsúla. Uasluchtaigh foinse fuaime agus roghnaigh sprioc guth.

Corp an Iarratais (multipart/form-data)

ParaiméadairCineálRiachtanachCur Síos
file file Comhad fuaime foinse (MP3, WAV, FLAC). Uasmhéid 50MB.
target_voice string Sprioc- aitheantas gutha le tiontú go (úsáid /v1/voices/ chun na guthanna atá ar fáil a liostáil)
model string & Ná Sábháil Samhail chomhshó gutha: openvoice (réamhshocrú), knn-vc
format string & Ná Sábháil Formáid aschurtha: wav (réamhshocraithe), mp3, flac

Iarratas Samplach

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

Freagra

Fill an comhad fuaime comhshóite mar shonraí dénártha.

Aistriúchán Urlabhra

POST /v1/speech-translate/

Aistriú fuaime labhartha ó theanga amháin go teanga eile.Comhcheanglaíonn urlabhra-go-téacs, aistriúchán, agus téacs-go-urlabhra i glaoch amháin.

Corp an Iarratais (multipart/form-data)

ParaiméadairCineálRiachtanachCur Síos
file file Comhad fuaime foinseach sa bhunteanga. Uasmhéid 100MB.
target_language string Cód na sprioctheanga (m.sh. es, fr, de, ja)
voice string & Ná Sábháil Guth le haghaidh aschurtha aistrithe. Roghnófar go huathoibríoch é mura ndéantar é.
preserve_voice boolean & Ná Sábháil Déan iarracht an cainteoir bunaidh a chaomhnú

Freagra

Freagra JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

Urlabhra go Urlabhra

POST /v1/speech-to-speech/

Trasfhoirmigh stíl cainte, mothúchán, nó seachadadh agus an t- ábhar á choinneáil. Úsáideach chun ton, luas, agus sainráiteacht a choigeartú.

Corp an Iarratais (multipart/form-data)

ParaiméadairCineálRiachtanachCur Síos
file file Comhad fuaime cainte foinseach. Uasmhéid 50MB.
voice string Sprioc- Aitheantas Gutha don chaint aschurtha
model string & Ná Sábháil Samhail: openvoice (réamhshocrú), chatterbox
emotion string & Ná Sábháil Sprioc- mhothúchán: neutral, happy, sad, angry, excited
speed float & Ná Sábháil Coigeartú luais. Réamhshocrú: 1.0. Raon: 0.5 go 2.0

Freagra

Fill an comhad fuaime trasfhoirmithe mar shonraí dénártha.

Uirlisí FuaimeName

Deireadhphointí próiseála fuaime chun feabhas a chur, a bhaint gutha, scoilteadh gas, agus níos mó.

POST /v1/audio/enhance/

Feabhas a chur ar cháilíocht fuaime: denoise, soiléireacht a fheabhsú, réiteach Super.

file fileComhad fuaime le feabhsú
denoise booleanCumasaigh díthorann (réamhshocrú: true)
enhance_clarity booleanFeabhsaigh soiléireacht na cainte (réamhshocrú: true)
super_resolution booleanCáilíocht fuaime uasscálaithe (réamhshocrú: bréagach)
strength integer1- 3 (éadrom, meánach, láidir). Réamhshocrú: 2
POST /v1/audio/separate/

Guthaí ar leith ó uirlisí (baint gutha) nó scoilt i gais.

file fileComhad fuaime le scaradh
model stringdemucs (réamhshocraithe) nó spleeter
stems integerLíon na ngeall: 2, 4, 5, nó 6 (réamhshocrú: 2)
format stringFormáid aschurtha: wav, mp3, flac
POST /v1/audio/dereverb/

Bain macalla agus reverb ó thaifeadtaí fuaime.

file fileComhad fuaime le próiseáil
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ Saor

Anailís fuaime a bhrath eochair, BPM, agus síniú ama.

file fileComhad fuaime le hanailísiú
Freagra
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ Saor

Tiontaigh fuaime idir formáidí.

file fileComhad fuaime le tiontú
format stringSpriocfhormáid: mp3, wav, flac, ogg, m4a, aac
bitrate integerRáta giotán aschurtha i kbps: 64, 128, 192, 256, 320
sample_rate integerRáta samplach: 22050, 44100, 48000
channels stringmonostereo

Comhrá GuthaComment

POST /v1/voice-chat/

Seol fuaime nó téacs agus freagra AI a fháil le caint shintéisiú.

Corp an Iarratais (multipart/form-data nó JSON)

ParaiméadairCineálRiachtanachCur Síos
audio file & Ná Sábháil* Ionchur fuaime (audiotext ag teastáil)
text string & Ná Sábháil* Ionchur téacs (audiotext ag teastáil)
voice string & Ná Sábháil Guth le haghaidh freagra AI. Réamhshocrú: af_bella
tts_model string & Ná Sábháil Samhail TTS don fhreagra. Réamhshocrú: kokoro
system_prompt string & Ná Sábháil Pras córais saincheaptha le haghaidh AI
conversation_id string & Ná Sábháil Lean comhrá atá ann cheana

Freagra

Freagra JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

Baisc TTS

POST /v1/tts/batch/

Cuir téacsanna iolracha isteach le haghaidh giniúna comhthreomhara TTS. Roghnach, faigh aisghlao webhook nuair a chríochnaíonn gach jab.

Paraiméadair

ParaiméadairCineálCur Síos
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringURL Roghnach chun torthaí POST nuair a chríochnaíonn bhaisc.

Freagra

Freagra JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

Dul chun cinn na vótála le GET /v1/tts/batch/result/?batch_id=abc123

Leabaigh Guth

POST /v1/voice-embed/

Réamhríomh leabaithe gutha ó fhuaim tagartha. Úsáid an embed_id a fhillfear in iarratais chlónála gutha ina dhiaidh sin le haghaidh giniúna beagnach láithreach.

Paraiméadair

ParaiméadairCineálCur Síos
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Freagra

Freagra JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

Seiceáil Sláinte

GET /v1/health/

Seiceáil stádas an fhreastalaí GPU, samhlacha luchtaithe, agus méid an chiú. Níl aon fhíordheimhniú de dhíth. Tá an taisce ar feadh 30 soicind.

Freagra

Freagra JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

Liosta Samhlacha

GET /v1/models/

Fillteáin liosta de na samhlacha go léir atá ar fáil lena gcumas.

Freagra

Freagra JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

Liosta Guthanna

GET /v1/voices/

Fillteann sé seo liosta de na guthanna go léir atá ar fáil, scagtha de réir múnla nó teanga.

Paraiméadair an Iarratais

ParaiméadairCineálCur Síos
model string Scag de réir aitheantais mhúnla (m.sh. kokoro)
language string Scag de réir cód teanga (m. sh. ga)
gender string Scag de réir inscne: female, female, neutral

Freagra

Freagra JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

Fotheidil (SRT / VTT) nua

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

Gineann sé seo fotheidil shioncronaithe d' aon jab TTS críochnaithe. Riteann sé ailíniú Whisper thar an fhuaim agus fillteann sé SRT nó WebVTT. Déantar an toradh a thaisceadh ar an diosca, mar sin is léitheoireacht diosca é an dara glaoch ar an uuid céanna.

Paraiméadair an Iarratais

ParaiméadairRiachtanachCur Síos
uuidUUID an jabanna a d'fhill /v1/tts/ nó /v1/voice-clone/.
format& Ná Sábháilsrt (réamhshocrú) nó vtt.
download& Ná Sábháil1 chun Content-Disposition: attachment a sheoladh ionas go sábhálfaidh an brabhsálaí seachas go dtaispeánfaidh sé.
language& Ná SábháilLeid don tsamhail ailínithe (a bhraitear go huathoibríoch má fhágtar ar lár é).
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

Foclóir Fuaimnithe nua

GET POST DELETE /api/v1/pronunciations/

Cuir in iúl don inneall TTS conas focail áirithe a fhuaimniú. Cuirfear iontrálacha sábháilte i bhfeidhm go huathoibríoch ar gach iarratas TTS a dhéanann tú. Teorainn 200 iontráil in aghaidh an chuntais.

Corp an Iarratais (POST)

ParaiméadairCineálCur Síos
wordstringFocal le sárú (m.sh. GIF, Anthropic). Comhoiriúnú teorann focal.
replacementstringConas é a litriú don tsamhail (m.sh. jiff, ann THROP ick).
languagestringCód ISO roghnach. Folamh = baineann sé le gach teanga.
case_sensitivebooleanRéamhshocrú false. Comhoiriúnaigh cás go díreach nuair a bhíonn true.
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

Is féidir leat sáruithe in aghaidh an iarratais a chur ar aghaidh freisin gan iad a shábháil — cuir pronunciations ar aon ghlao /v1/tts/ mar rud nó mar eagar (féach na paraiméadair deiridh TTS).

Cainteoir Alt nua

Buail tag