Tahirin-kevitra

Ampidiro ao anatin'ny rindranasanao ny TTS.ai amin'ny alalan'ny API REST-ntsika. Lamina mifanaraka amin'ny OpenAI ho an'ny fifindra-monina mora.

API REST Mifanaraka amin'ny OpenAI Valiny JSON Fandraisana an-tànana

Topy maso

Ny TTS.ai API dia manome fidirana amin'ny alalan'ny rindrambaiko amin'ireo endriky ny sehatra rehetra: fandikana lahatsoratra ho teny, fandikana teny ho teny, fandikana feo, fanatsarana ny feo, ary maro hafa.

Famaha API

Maka ny famaha API avy amin'ny Fandrindrana ny kaonty. Azo ampiasaina amin'ny programa Pro sy Enterprise.

URL fototra

https://api.tts.ai/v1/

Fanamarinana

Ny token'ny mpitondra amin'ny alalana Authorization loham-pejy

Fanamarinana

Tsy misy ny famantarana ny famantarana ny famantarana. POST tsy fantatra anarana ho an'ny /v1/tts/ miasa tsy misy fanamarinana, hatramin'ny 5.000 marika/andro isaky ny IP, amin'ny fampiasana ny iray amin'ireo modely maimaimpoana (piper, vits, melotts, kokoro). Misoratra anarana amin'ny kaonty maimaimpoana mba hahazoana marika fanampiny 15.000 sy hidirana amin'ireo modely premium.

Ho an'ny modely premium sy ny fetra avo kokoa, dia ampidiro ny marika Bearer ao amin'ny Authorization loham-pejy.

Loham-pejy HTTP
Authorization: Bearer sk-tts-your-api-key-here
Ataovy miafina ny famaha API-nao. Aza mizara izany amin'ny alalan'ny rindran'asa eo amin'ny lafiny mpivatsy, tahirin-kevitra ho an'ny daholobe, na tatitra. Afindrao matetika ireo famaha avy amin'ny fandrindrana ny kaontinao.

SDK

Ny SDK ofisialy dia manamora ny fampidirana ny TTS.ai ao anatin'ny rindran'asao. Ireo roa ireo dia loharano misokatra ary azo jerena ao amin'ny GitHub.

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

URL fototra

URL fototra: https://api.tts.ai/v1/

Mifandray amin'ity URL fototra ity ny endpoint rehetra. Ohatra, ny endpoint TTS dia:

POST https://api.tts.ai/v1/tts/

Fetra amin'ny tahan'ny fidirana

Miovaova arakaraka ny drafitra ny fetra amin'ny tahan'ny API:

Plan Fanontaniana/minitra Mifanaraka Halavan'ny lahabolana ambony indrindra
Free 10 2 Marika 500
Mpandefa 30 3 Marika 1,000,000
Pro 60 5 Marika 1,000,000
Enterprise 300 20 Marika 50.000

Ao anatin'ny valintenin'ny tsirairay ny loham-pejy momba ny fetrany: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Fandoavana trosa

Sampan'asa Sanda Unit
TTS (Modely maimaimpoana: Piper, VITS, MeloTTS) Marika 1,000 isan'ny marika 1000
TTS (Modely mahazatra: Kokoro, CosyVoice 2, sns.) 2,000 characters isan'ny marika 1000
TTS (Modely Premium: Tortoise, Chatterbox, sns.) Marika 4,000 isan'ny marika 1000
Hanova teny ho lahabolana 2,000 characters isan'ny minitra
Fandraisana an-tsoratra feo Marika 4,000 isan'ny marika 1000
Mpanova feo 3,000 marika isan'ny minitra
Fanatsarana ny feo 2,000 characters isan'ny minitra
Fandraisana feo / Fampisarahana feo 3,000-4,000 characters isan'ny minitra
Fandikan-teny Marika 5,000 isan'ny minitra
Resadresaka an-peo 3,000 marika isan-tokony
Key Finder & BPM Free --
Mpanova feo Free --

Soratra mankany amin'ny feo

POST /v1/tts/

Manova ny lahabolana ho feo. Mamaly ny raki-peo amin'ny lamina takiana.

Ny vatan'ilay fangatahana

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
model string Tsy misy IDn'ny modely (ohatra, kokoro, chatterbox, piper). Raha tsy voalaza, dia misafidy modely iray izay manohana ny teny takiana izahay — kokoro ho an'ny en/ja/zh/ko/fr/de/it/pt/es/hi/ru, piper ho an'ny teny hafa raisina an-tànana (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/etc.).
text string Eny Soratra hanovaina ho feo. Fetra isan-takiana: marika 500 (tsy fantatra), 5000 (kaonty maimaimpoana), 1 000 000 (fifanarahana mividy). Hozaraina ho ampahany hoazy eo amin'ny mpizara ireo fandefasana lava.
voice string Eny IDn'ny feo (ampiasao ny /v1/voices/ hanehoana ireo feo misy)
format string Tsy misy Lamin'ny famoahana: mp3 (tsotra), wav, flac, ogg
speed float Tsy misy Fampitomboana ny hafainganan'ny fitenenana. 1.0 ny sanda tsotra. Isa: 0.5 ka hatramin'ny 2.0
language string Tsy misy Fangon'ny teny (ohatra, en, es). Hita hoazy raha tsy voalaza.
instructions string Tsy misy Famantarana ny fiasan'ny/fandefasana (≤500 marika). ohatra \
pronunciations object | array Tsy misy Tsy raisina an-tànana ny fehezanteny isan-takiana. Na {\
stream boolean Tsy misy Alefaso ny valin'ny streaming. Fandraisana tsotra: false

Ohatra

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

Tag SSML

Mampiditra isa, daty, vola, laharan'ny finday, ary teny fohy anatin'ny

interpret-asFampidiranaNotenenina toy izao
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31Desambra telopolo sy iray, sivy amby roapolo sy sivy
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

mdy ny lamin'ny daty tsotra ho an'ny teny Anglisy ary dmy any an-kafa; ampiato amin'ny format=\

Ohatra
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

Valiny

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

Ohatra feno

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

Hanova teny ho lahabolana

POST /v1/stt/

Manova feo ho lasa lahabolana. Mandray an-tànana ny teny 99 miaraka amin'ny famantarana hoazy.

Ny vatan'ilay fangatahana (multipart/form-data)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
file file Eny Raki-peo (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). 100MB farafahakeliny.
model string Tsy misy Modelin'ny STT: whisper (tsotra), faster-whisper, sensevoice
language string Tsy misy Fangon'ny teny. auto ho an'ny famantarana hoazy (tsotra).
timestamps boolean Tsy misy Ataovy tafiditra ny famaritana ny fotoana amin'ny ambaratongan'ny teny. Famaritana tsotra: false
diarize boolean Tsy misy Alefaso ny fanoratana amin'ny diary ny mpandahateny. Tsotra: false

Valiny

Valiny JSON
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

Fandraisana an-tsoratra feo

POST /v1/tts/clone/

Mamorona kabary amin'ny alalan'ny feo nalaina. Akaro ny feo sy ny lahabolana voalaza.

Ny vatan'ilay fangatahana (multipart/form-data)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
reference_audio file Eny Feo-peo fototra (10-30 segondra no toro-hevitra). 20MB farafahakeliny.
text string Eny Soratra holazaina amin'ny feo voakidy.
model string Tsy misy Modelin'ny klona: chatterbox (tsotra), cosyvoice2, gpt-sovits
format string Tsy misy Lamin'ny famoahana: mp3 (tsotra), wav, flac
language string Tsy misy Fangon'ny teny iantefana. Tsy maintsy raisin'ny modely voafaritra an-tànana izany.

Valiny

Mamaly ny rakitra audio amin'ny endrika data binary, mitovy amin'ny farany TTS.

Mpanova feo

POST /v1/voice-convert/

Manova ny feo ho toy ny feo hafa. Akaro ny feo loharano ary safidio ny feon'ny tanjona.

Ny vatan'ilay fangatahana (multipart/form-data)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
file file Eny Raki-peo loharano (MP3, WAV, FLAC). 50MB farafahakeliny.
target_voice string Eny Ny ID-n'ny feon'ny tanjona hanovaina (ampiasao ny /v1/voices/ hanehoana ny lisitry ny feon'ny mpampiasa)
model string Tsy misy Modelin'ny fanovana feo: openvoice (tsotra), knn-vc
format string Tsy misy Lamin'ny famoahana: wav (tsotra), mp3, flac

Ohatra

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

Valiny

Mamaly ny rakitra audio nanovaina ho data binary.

Fandikan-teny

POST /v1/speech-translate/

Manova feo avy amin'ny teny iray ho amin'ny teny iray hafa. Mampifandray ny fiteny ho an-tsoratra, ny fandikan-teny, ary ny lahabolana ho an-tsoratra anatin'ny antso iray.

Ny vatan'ilay fangatahana (multipart/form-data)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
file file Eny Rakitra audio loharano amin'ny teny niaviany. 100MB farafahakeliny.
target_language string Eny Fangon'ny teny iantefana (ohatra, es, fr, de, ja)
voice string Tsy misy Feo ho an'ny famoahana fandikan-teny. Safidio hoazy raha tsy voalaza.
preserve_voice boolean Tsy misy Manandrana mametra ny toetran'ny feony. Famaritana tsotra: false

Valiny

Valiny JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

Teny amin'ny Teny

POST /v1/speech-to-speech/

Manova ny fomba fiteny, ny fihetseham-po, na ny fanehoana raha toa ka tsy miova ny votoaty. Mety ampiasaina amin'ny fanatsarana ny feo, ny fivoahana, ary ny fitenenana.

Ny vatan'ilay fangatahana (multipart/form-data)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
file file Eny Raki-peo loharano. 50MB farafahakeliny.
voice string Eny IDn'ny feo iantefana ho an'ny feon'ny famoahana
model string Tsy misy Modely: openvoice (tsotra), chatterbox
emotion string Tsy misy Fihetseham-po kendrena: tsy miangatra, faly, mampalahelo, tezitra, mihetsi-po
speed float Tsy misy Fandrindrana ny hafainganan'ny fandefasana. 1.0 no sanda tsotra. Isa: 0.5 ka hatramin'ny 2.0

Valiny

Mamaly ny rakitra audio nanovaina ho data binary.

Fitaovana audio

Fiandohan'ny fikarakarana ny feo ho an'ny fanatsarana, fanafoanana ny feo, fizarazarana ny fototra, ary maro hafa.

POST /v1/audio/enhance/

Manatsara ny kalitaon'ny feo: manafoana ny tabataba, manatsara ny fahazavana, fanatsarana ny vahaolana.

file fileRaki-peo hanatsarana
denoise booleanAlefaso ny fanafoanana ny feo (tsotra: marina)
enhance_clarity booleanManatsara ny fahamendrehan'ny feo (tsotra: marina)
super_resolution booleanMampandeha ny kalitaon'ny feo (tsotra: diso)
strength integer1-3 (maivana, antonony, mafy). Lasitra: 2
POST /v1/audio/separate/

Mizara ny feo avy amin'ny fitaovana (fanafoanana ny feo) na mizara amin'ny tahony.

file fileRaki-peo hozaraina
model stringdemucs (default) na spleeter
stems integerIsan'ny andry: 2, 4, 5, na 6 (tsotra: 2)
format stringLamin'ny famoahana: wav, mp3, flac
POST /v1/audio/dereverb/

Manaisotra ny echo sy ny reverb amin'ny fandraiketana feo.

file fileRaki-peo hosokafana
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ Free

Manadihady ny feo mba hahitana ny kitendry, ny BPM, ary ny fanamarinana ny fotoana.

file fileRaki-peo hozaraina
Valiny
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ Free

Manova ny feo amin'ny lamin'ny feo maro.

file fileRaki-peo hanovaina
format stringLamin'ny tanjona: mp3, wav, flac, ogg, m4a, aac
bitrate integerBitraten'ny famoahana (kbps): 64, 128, 192, 256, 320
sample_rate integerIsan'ny santionany: 22050, 44100, 48000
channels stringmono na stereo

Resadresaka an-peo

POST /v1/voice-chat/

Mandefa feo na soratra ary mahazo valinteny avy amin'ny AI miaraka amin'ny fitenenana novokarina.

Ny vatan'ilay fangatahana (multipart/form-data na JSON)

FamaritanaKarazanaTsy maintsy ataoFanoritsoritana
audio file Tsy misy* Fidirana feo (na audio na text no ilaina)
text string Tsy misy* Fampidirana lahabolana (na audio na text no ilaina)
voice string Tsy misy Feo ho an'ny valin'ny AI. Tsotra: af_bella
tts_model string Tsy misy Modelin'ny TTS ho an'ny valinteny. Lasitra: kokoro
system_prompt string Tsy misy Fampandrenesana safidy ho an'ny AI
conversation_id string Tsy misy Manohy resadresaka efa misy

Valiny

Valiny JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

Batch TTS

POST /v1/tts/batch/

Mandefa lahabolana maro ho an'ny famoronana TTS mifanaraka. Azo atao ny mandray antso webhook rehefa vita ny asa rehetra.

Famaritana

Mpizahaky ny macroKarazanaFanoritsoritana
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringURL safidy ho an'ny vokatra POST rehefa vita ny batch.

Valiny

Valiny JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

Fivoaran'ny fitsapankevitra amin'ny alalan'ny GET /v1/tts/batch/result/?batch_id=abc123

Fampidirana feo

POST /v1/voice-embed/

Mamaritra mialoha ny fampidirana feo avy amin'ny feo mpisolo. Ampiasao ny embed_id averina amin'ny fangatahana fandikana feo manaraka mba hamoronana haingana.

Famaritana

Mpizahaky ny macroKarazanaFanoritsoritana
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Valiny

Valiny JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

Fanamarinana ny fahasalamana

GET /v1/health/

Mijery ny toetr'ilay mpizara GPU, ny modely nakarina, ary ny haben'ny filaharana. Tsy mila fanamarinana. Voatahiry mandritra ny 30 segondra.

Valiny

Valiny JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

Lisitry ny modely

GET /v1/models/

Manome lisitr'ireo modely misy rehetra miaraka amin'ny fahaizany.

Valiny

Valiny JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

Lisitry ny feo

GET /v1/voices/

Manome lisitr'ireo feo misy rehetra, azo sivana araka ny modely na ny teny.

Mpizahaky ny fanatanterahana

FamaritanaKarazanaFanoritsoritana
model string Sivana araka ny ID modely (ohatra, kokoro)
language string Sivana araka ny famantaran'ny teny (ohatra, en)
gender string Sivana araka ny karazany: lahy, vavy, tsy miangatra

Valiny

Valiny JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

Dikanteny (SRT / VTT) vaovao

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

Mamorona dikanteny mifanaraka amin'ny fotoana ho an'ny asa TTS vita. Mandefa ny fifampizarana Whisper amin'ny feo ary mamerina SRT na WebVTT. Apetraka anaty cache amin'ny kapila ny vokatra, ka ny antso faharoa amin'ny uuid mitovy dia vakiana amin'ny kapila.

Mpizahaky ny fanatanterahana

FamaritanaTsy maintsy ataoFanoritsoritana
uuidEnyNy UUID'ny asa naverina avy amin'ny /v1/tts/ na /v1/voice-clone/.
formatTsy misysrt (tsotra) na vtt.
downloadTsy misy1 handefasana Content-Disposition: attachment mba handraiketan'ny mpitety ny rakitra fa tsy haneho azy.
languageTsy misyTorohevitra momba ny modelin'ny fampifanitsiana (hita hoazy raha tsy voalaza).
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

Rakibolan'ny fiteny vaovao

GET POST DELETE /api/v1/pronunciations/

Milaza amin'ny milina TTS ny fomba filazana teny voafaritra. Ireo angona voatahiry dia ampiharina hoazy amin'ny fangatahana TTS rehetra ataonao. Fetra 200 ny angona isaky ny kaonty.

Ny vatan'ilay fangatahana (POST)

FamaritanaKarazanaFanoritsoritana
wordstringTeny ho tsindriana (ohatra: GIF, Anthropic). Mifanaraka amin'ny sisin'ny teny.
replacementstringNy fiteny hoe "code" dia midika hoe "soratra" (na "soratra" na "soratra" na "soratra" na "soratra" na "soratra").
languagestringFangon'ny ISO safidy. Foana = mihatra amin'ny teny rehetra.
case_sensitivebooleanfalse tsotra. Mampifanaraka ny haben'ny litera raha toa ka true.
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

Azonao atao koa ny mandefa ny fanovana ny fangatahana isan-taonany tsy misy fandraiketana azy ireo — ampidiro ny pronunciations amin'ny antso /v1/tts/ rehetra ho toy ny zavatra na ny tabilao (jereo ny param-pamantarana ny TTS endpoint).

Mpitantara lahatsoratra vaovao

Apetraho eo amin'ny pejy lahatsoratra iray ny tag