API דאָקומענטאַציע

אַרײַנשרײַבן TTS.ai אין אייער פּראָגראַם מיט אונדזער REST API. OpenAI-קאָמפּאַטאַבעלע פֿאָרמאַטירונג פֿאַר אַ פּשוטע איבערזעצונג

REST API OpenAI צופֿרידנקייט JSON ענטפֿערס סטרימינג שטיצן

איבערזעצונג

די TTS.ai API גיט אַ פּראָגראַממאַטישע צוטריט צו אַלע פּלאַטפאָרמע־פֿעיִקייטן: טעקסט־צו־ספּראַך־סינטעז, שפּראַך־צו־ספּראַך־אַרײַנשרײַבונג, שפּראַך־קלאָנינג, אודיו־פֿאַרבעסערן, און מער. די API ניצט סטאַנדאַרד REST קאָנווענציעס מיט JSON פֿראַגע/ענטפֿער־גוףס.

API שריפֿטצײכן

קלײַב אַלץ אױס אױסגלײַכונג. אינטערנעץ און אינטערנאַציאָנאַלע באַציִונגען.

באַזע URL

https://api.tts.ai/v1/

איבער־פֿאַרקער

באַװעגער־טוקען דורך Authorization קאָפּצעטל

באַשטעטיקונג

פֿרײַער װײַז — ניט נײן קײן קאָפּיע אַנאָנימישע פּאָסטן צו /v1/tts/ אַרבעט אָן קיין אױטאָריטעציע, ביז 5,000 שריפֿטצײכן/טאָג פּער IP, ניצנדיק אַװעק פֿון אונדזערע פֿרײַע מאָדעלן (piper, vits, melotts, kokoro). אַרײַנשרײַבן אױף אַ פריין אקאונט צו באַקומען 15,000 באָנוס שריפֿטצײכן און צוטריט צו פּרעמיום מאָדעלס

אַלע API־פֿאַרבינדונגען דאַרפן אױטענטיפֿאַקאַציע װײַזנדיק אַ װײַזער־טוקען אין דעם Authorization קאָפּצעטל.

HTTP קאָפּצעטל
Authorization: Bearer sk-tts-your-api-key-here
היט אױף דײַן API־שריפֿט ניט צעשײדן אין קליענט־סײַט־קאָד, װעלטלעכע סטאָרידזשן, אָדער לאָגס. װײַז קײן קנעפּל אױף אױס װידער און אױס אױף װײַז

SDKס

די אופֿפֿיצירלעכע SDKס מאַכן עס גרינג צו פֿאַרבינדן TTS.ai אין דיין פּראָגראַם. ביידע זענען אָפֿן־קאָפּיע און בנימצא אויף GitHub

Python

pip install ttsai
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")
GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
GitHub

באַזע URL

באַזע URL: https://api.tts.ai/v1/

אַלע סוף־פּונקטן זײַנען רעלאַטיוו צו דעם באזע־URL. למשל, דער TTS סוף־פּונקט איז:

POST https://api.tts.ai/v1/tts/

שריפֿט גרײס

API צאָלונג גבולות װײַזן זיך אױף דעם פּלאָן:

שריפֿט גרײס פֿראַגעס/מינוט װידער גרעסטע טעקסט לענג
פֿרײַ 10 2 500 שריפֿטצײכן
װײַז 30 3 1,000,000 שריפֿטצײכן
פּראָפֿעסיאָנאַל 60 5 1,000,000 שריפֿטצײכן
פֿירמע 300 20 שריפֿטצײכן

קאָפּצעטל־פֿאַרבינדונגען זײַנען צוגעלייגט אין יעדער ענטפער: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

קלײַב אַלץ אױס

באַדינונג קאָסטן אײנס
TTS (פֿרייַע מאָדעלן: Piper, VITS, MeloTTS) 1 קרעדיט יעדער 1,000 שריפֿטצײכן
TTS (סטאַנדאַרד מאָדעלס: Kokoro, CosyVoice 2, אאז״ו ו) 2 קרעדיטס יעדער 1,000 שריפֿטצײכן
TTS (Premium מאָדעלס: Tortoise, Chatterbox, אאז״ו ו) 4 קרעדיץ יעדער 1,000 שריפֿטצײכן
טעקסט פֿאַרבtext-tool-action 2 קרעדיטס אױף אַ מינוט פֿון אַודיאָ
שריפֿט גרײס 4 קרעדיץ יעדער 1,000 שריפֿטצײכן
שפּראַך־װײַזער 3 קרעדיטס אױף אַ מינוט פֿון אַודיאָ
אויטאָמאַטישע איבערזעצונג 2 קרעדיטס אױף אַ מינוט פֿון אַודיאָ
טעקסט פֿאַרבvector-mode 3־4 נקודות אױף אַ מינוט פֿון אַודיאָ
איבערזעצונג 5 קרעדיץ אױף אַ מינוט פֿון אַודיאָ
שריפֿטצײכן 3 קרעדיטס איבער־פֿאַרקער
טעקסט פֿאַרבkeyboard label פֿרײַ --
אוודיאָ קאָנווערטער פֿרײַ --

טעקסט צו שפּראַך

POST /v1/tts/

פֿאָרױסװײַז פֿאָרמאַטירונג

פֿראַגע־קאָפּ

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
model string ניט מאָדעל ID (ד.ה. <קאָד>kokoro, <קאָד>chatterbox, <קאָד>piper)
text string יאָ טעקסט צו איבערזעצן צו שפּראַך (מאַקסימום 5,000 שריפֿטצײכן פֿאַר Pro, 50,000 פֿאַר Enterprise)
voice string יאָ שפּראַך־אידענטיטעט (נוצט <קאָד>/v1/voices/ צו אַרײַנשטעלן אַ רשימה פֿון בנימצאע שפּראַכן)
format string ניט אױסגאַבע־פֿאָרמאַטירונג: mp3 (געװײנטלעכער), wav, flac, ogg
speed float ניט שפּראַך־גײט־מעגלעכקײט. געװײנטלעכער: <קאָד>1.0. אָפּרוקונג: <קאָד>0.5 ביז <קאָד>2.0
language string ניט שפּראַך־קאָד (ד.ה. <קאָד>en, <קאָד>es). אויטאָמאַטיש געפֿונען אױב ניט אַרײַנגעלייגט
instructions string ניט װײַזנדיקע/װײַזנדיקע שריפֿטצײכן (≤500 שריפֿטצײכן). למשל <קאָד>\
pronunciations object | array ניט װײַל דער װײַז־װײַז־אויסשרײַב איז איבערגעװײַזט. אױב <קאָד>{\
stream boolean ניט דערמעגלעך סטרימ־ענטפֿער. געװײנטלעכער: <קאָד>פֿאַלש

װײַז בילדל

cURL
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML הענטלעך

װײַז נומערן, דאַטן, קראַנטשאַפֿט, טעלעפֿאָן נומערן און פֿאַרקירצונגען אין

פֿאַרװאַנדלאַרײַנשרײַבגעשריבן װי
cardinal1234one thousand two hundred thirty-four
ordinal21twenty-first
date1999-12-31December thirty-first, nineteen ninety-nine
time14:30two thirty PM
telephone+1-555-867-5309plus one five five five eight six seven…
currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents
spell-outNASAN A S A

געװײנטלעכע דאַטע־פֿאָרמאַטירונג איז mdy פֿאַר ענגליש און dmy אױף אַנדערע שפּראַכן; איבערשרײַבן מיט format=\

װײַז בילדל
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

ענטפֿער

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
Polling response (still processing)
{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

Full example

Python
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

טעקסט פֿאַרבtext-tool-action

POST /v1/stt/

איבערשרײַבן אַודיאָ צו טעקסט. שטיצט 99 שפּראַכן מיט אויטאָמאַטישע דערקענונג

פֿראַגע־קאָפּ (multipart/form-data)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
file file יאָ אוודיאָ טעקע (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). מאַקסימום 100 מעגאבייטן
model string ניט STT מאָדעל: <קאָד>פֿישפּער (געװײנטלעכער), <קאָד>פֿאַרגיכערט־פֿישפּער, <קאָד>סײַנסװאָס
language string ניט שפּראַך־קאָד. אויטאָמאַטיש פֿאַר אויטאָמאַטישע דערקענונג (געװײנטלעכער)
timestamps boolean ניט אַרײַנשרײַבן צײַט־סאַמעלס אױף וואָרט־בײדע. געװײנטלעכער: false
diarize boolean ניט דערמעגלעכן רעדאַקטאָר־דיאַריזאַציע. געװײנטלעכער: false

ענטפֿער

JSON ענטפֿער
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

שריפֿט גרײס

POST /v1/tts/clone/

שאַפֿן אַ קלאָנירטע שפּראַך

פֿראַגע־קאָפּ (multipart/form-data)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
reference_audio file יאָ רעפֿערענץ שפּראַך אודיו (10-30 סעקונדעס רעקאַמענדירט). מאַקסימום 20 מעגאבייטן
text string יאָ טעקסט צו רעדן אין דער קלאָנירטער שפּראַך
model string ניט קלאָן מאָדעל: <קאָד>chatterbox (געװײנטלעכער), <קאָד>cosyvoice2, <קאָד>gpt-sovits
format string ניט אױסגאַבע־פֿאָרמאַטירונג: mp3 (געװײנטלעכער), wav, flac
language string ניט ציל־שפּראַך־קאָד. מוז זײַן געשטיצט פֿון דעם אויסגעקליבן מאָדעל

ענטפֿער

װײַזט די אוודיאָ טעקע װי בינעאַרישע דאַטן, די זעלבע װי דער TTS סוף־פּונקט

שפּראַך־װײַזער

POST /v1/voice-convert/

קלײַב אַלץ אױסselect-action

פֿראַגע־קאָפּ (multipart/form-data)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
file file יאָ מקור אוודיאָ טעקע (MP3, WAV, FLAC). מאַקסימום 50 מעגאבייטן
target_voice string יאָ װיפֿל שפּראַך צו פֿאַרװאַנדלען (נוצן <קאָד>/v1/voices/ צו אַרײַנשטעלן אַ רשימה פֿון בנימצאע שפּראַכן)
model string ניט שפּראַך איבערזעצונג מאָדעל: openvoice (געװײנטלעכער), knn-vc
format string ניט אױסגאַבע־פֿאָרמאַטירונג: wav (געװײנטלעכער), mp3, flac

װײַז בילדל

cURL
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

ענטפֿער

װײַז די איבערגעװײַזטע אודיו־טעקע װי בײַנאַרישע דאַטן

איבערזעצונג

POST /v1/speech-translate/

איבערזעצן אַודיאָ פֿון איין שפּראַך צו אַן אַנדער. קאָמבינירט שפּראַך־צו־טעקסט, איבערזעצונג, און טעקסט־צו־שפּראַך אין אַ איין אָנרוף

פֿראַגע־קאָפּ (multipart/form-data)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
file file יאָ מקור־אויערטעקע אין דער אָריגינעלער שפּראַך. מאַקסימום 100 מג
target_language string יאָ ציל־שפּראַך־קאָד (ד.ה. es, fr, de, ja)
voice string ניט שפּראַך פֿאַר איבערגעזעצט אַרײַנשרײַב. אויטאָמאַטיש אויסגעקליבן אױב ניט
preserve_voice boolean ניט פֿאָרױסװײַז־װײַזער

ענטפֿער

JSON ענטפֿער
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

שפּראַך צו שפּראַך

POST /v1/speech-to-speech/

איבער־פֿאַרװאַנדלען די שפּראַך־סטיל, אױף־געפֿיל, אָדער איבערצײַגונג בשעת מען האַלט דעם אינהאַלט. נייטיק פֿאַר צופּאַסונג פֿון טון, צײַט און אויסדרוק

פֿראַגע־קאָפּ (multipart/form-data)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
file file יאָ מקור־ספּראַך־אודיוטעקע. מאַקסימום 50 מעגאבייטן
voice string יאָ װיפֿל מאָל װעט די װײַזער װײַזן די װײַזונג?
model string ניט מאָדעל: openvoice (געװײנטלעכער), chatterbox
emotion string ניט ציל־עמאָציע: נייטראַל, געזעלטיק, צופֿרידן, צופֿרידן, צופֿרידן
speed float ניט גיכקייט־צופּאַסונג. געװײנטלעכער: 1.0. אָפּרוקונג: 0.5 ביז 2.0

ענטפֿער

װײַז די טראַנספֿאָרמירטע אודיו־טעקע װי בײַנאַרישע דאַטן

אוודיאָ־אַרײַנשרײַב

אודיו־פּראָצעסירונג סוף־פּונקטן פֿאַר פֿאַרבעסערן, שפּראַך־אַרײַנשרײַבן, װײַסװײַז־אָפּטיילונג, און מער

POST /v1/audio/enhance/

קלײַב אַלץ אױסselect-criterion

file fileאודיו טעקע צו פֿאַרגרעסערן
denoise booleanבאַשטעטיק רײד־פֿאַרבינדונג (געװײנטלעכער: יאָ)
enhance_clarity booleanפֿאַרבעסערן שפּראַך קלאָרײט (געװײנטלעכער: יאָ)
super_resolution booleanפֿאַרגרעסער אודיו־קװאַליטעט (געװײנטלעכער: ניט־פֿאַלש)
strength integer1-3 (לייכט, מיטל, שטאַרק). געװײנטלעכער: 2
POST /v1/audio/separate/

צעשײדן די װאָקאַלן פֿון די אינסטרומענטן (װאָקאַל־אַרײַנשרײַבונג) אָדער צעטיילן אין װאָקאַלן

file fileאוודיאָ טעקע צו צעטיילן
model stringdemucs (געװײנטלעכער) אָדער spleeter
stems integerװיפֿל סטעמס: 2, 4, 5 אָדער 6 (געװײנטלעכער: 2)
format stringאױסגאַבע־פֿאָרמאַטירונג: wav, mp3, flac
POST /v1/audio/dereverb/

קלײַב אַלץ אױסselect-action

file fileאוודיאָ טעקע צו באַהאַנדלען
type stringecho or reverb (default: both)
intensity integer1-5 (default: 3)
POST /v1/audio/analyze/ פֿרײַ

אַנאַליסיסיר אודיו צו דערקענען קײט, BPM און צײַט־באַשרײַב

file fileאודיו טעקע צו אַנאַליסיסירן
ענטפֿער
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
POST /v1/audio/convert/ פֿרײַ

איבער־פֿאַרקער אוודיאָ צווישן פֿאָרמאַטירונגען

file fileאוודיאָ טעקע צו קאָנווערטירן
format stringציל־פֿאָרמאַטירונג: mp3, wav, flac, ogg, m4a, aac
bitrate integerאַרײַנשרײַב בילדצעלן אין kbps: 64, 128, 192, 256, 320
sample_rate integerסאַמעל רײט: 22050, 44100, 48000
channels stringmono אָדער stereo

שריפֿטצײכן

POST /v1/voice-chat/

שיקן אַודיאָ אָדער טעקסט און באַקומען אַ AI ענטפֿער מיט סינטעזירטע שפּראַך

פֿראַגע־קאָפּ (multipart/form-data אָדער JSON)

פּאַראַמעטערסטיפּ:נייטיקבאַשרײַבונג
audio file ניט* אוודיאָ אַרײַנשרײַב (אָדער <קאָד>אוודיאָ אָדער <קאָד>טעקסט נייטיק)
text string ניט* טעקסט אַרײַנשרײַב (אָדער <קאָד>אודיו אָדער <קאָד>טעקסט נייטיק)
voice string ניט שפּראַך פֿאַר AI ענטפֿער. געװײנטלעכער: af_bella
tts_model string ניט TTS מאָדעל פֿאַר ענטפֿער. געװײנטלעכער: kokoro
system_prompt string ניט אױסגלײַכונג פֿון טעקע
conversation_id string ניט פֿאָרױסװײַז פֿון טעקסט

ענטפֿער

JSON ענטפֿער
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

שריפֿט גרײס

POST /v1/tts/batch/

שיקן אַ סך טעקסטן פֿאַרן פּאַראַלעל TTS שאַפֿן. אױב איר װילט, װעט מען אױסשלײדן אַ װײַב־האָק װען אַלע אַרבעטן זײַנען ענדיקט

פּאַראַמעטערס

פּאַראַמעטערסטיפּ:באַשרײַבונג
textsarrayArray of objects: {text, model, voice}. Max 50 items.
webhook_urlstringOptional URL to POST results when batch completes.

ענטפֿער

JSON ענטפֿער
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

װײַז פּראָגרעס מיט GET /v1/tts/batch/result/?batch_id=abc123

שפּראַך

POST /v1/voice-embed/

Pre-compute a voice embedding from reference audio. Use the returned embed_id in subsequent voice cloning requests for near-instant generation.

פּאַראַמעטערס

פּאַראַמעטערסטיפּ:באַשרײַבונג
filefileReference audio file (WAV, MP3, FLAC).
modelstringCloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

ענטפֿער

JSON ענטפֿער
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

װײַז װיפֿל

GET /v1/health/

באַשטעטיק GPU סערװירער סטאַטוס, אַרײַנגעלאָשן מאָדעלן, און שורה גרײס. ניט נייטיק אױטאָמאַטישע אױסװײַזונג. פֿאַר 30 סעקונדעס אױסגעלאָשן

ענטפֿער

JSON ענטפֿער
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

לײענען מאָדעלס

GET /v1/models/

װײַזט אַ רשימה פֿון אַלע בנימצאע מאָדעלן מיט זייערע מעגלעכקייטן

ענטפֿער

JSON ענטפֿער
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

קלײַב אַלץ אױסundo-type

GET /v1/voices/

װײַזט אַ רשימה פֿון אַלע בנימצאע שפּראַכן, אױסגעפילטערט לויט מאָדעל אָדער שפּראַך

פֿראַגע פּאַראַמעטערס

פּאַראַמעטערסטיפּ:באַשרײַבונג
model string פֿילטער לויט מאָדעל ID (ד.ה. <קאָד>קאָקאָראָ)
language string פֿילטער לויט שפּראַך־קאָד (ד.ה. en)
gender string פֿילטער לויט מין: מאַן, װײַב, נייטראַל

ענטפֿער

JSON ענטפֿער
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

אונטערשטעכנלעך (SRT / VTT) נייַעs-action

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

שאַפֿט סינכראָניזירטע אונטערשטעלעך פֿאַר װעלכע װידער TTS־באַהאַנדלונג אױף װאָסער װאָסער. װײַזט אַ פֿישפּער־אויספֿיר איבער דעם אודיו און װײַזט צוריק SRT אָדער WebVTT. דער רעזולטאט איז פֿאַרזיכערט אױף דער שטיק, אַזוי אַז אַ צווייטער װײַזונג פֿון דער זעלבער uuid איז אַ שטיק־לײען

פֿראַגע פּאַראַמעטערס

פּאַראַמעטערסנייטיקבאַשרײַבונג
uuidיאָאַרבעט UUID געװאָרן פֿון /v1/tts/ אָדער /v1/voice-clone/
formatניט<קאָד>srt (געװײנטלעכער) אָדער <קאָד>vtt
downloadניט1 צו שיקן Content-Disposition: attachment אַזוי אַז דער בלעטערער װעט ניט װײַזן נאָר בלײַבן
languageניטהענטל צו דער אױסגלײַכונג־מאָדע (אויטאָמאַטיש אױסגעפֿירט אױב ניט אױסגעלייגט)
cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

אויסלייג־װײַזער נייַעs-action

GET POST DELETE /api/v1/pronunciations/

דערקלערן דעם TTS־מאַשין װי צו רעדן װערטער. געװאַרטע אַרײַנשרײַבונגען ווערן אויטאָמאַטיש צוגעפּאַסט צו װעלכע TTS־פֿירמע איר װילט. 200 אַרײַנשרײַבונגען אױף אַ קונה־קאָנטאָן איז דער גרעסטער װײַטקייט.

פֿראַגע־קאָפּ (POST)

פּאַראַמעטערסטיפּ:באַשרײַבונג
wordstringוואָרט צו איבערשרײַבן (ד.ה. <קאָד>GIF, <קאָד>Anthropic). וואָרט־גרענעץ איז צוגעפֿירט
replacementstringווי צו שרייַבן עס פֿאַרן מודל (ד.ה. <קאָד>jiff, <קאָד>ann THROP ick)
languagestringװעלכיקער ISO קאָד. לײדיק = טוט זיך צו מיט אַלע שפּראַכן
case_sensitivebooleanגעװײנטלעכער <קאָד>פֿאַלש. װײַז די גרײס און קײט װען <קאָד>יאָ
cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

איר קענט אויך איבערגעבן אַװעקצושטעלן־פֿאַרבינדונגען אָן זיי צו היטן — אַרײַננעמען <קאָד>אויסשריפֿטן אין װעלכעװעלכע /v1/tts/ װעגװײַז װי אַן אוביעקט אָדער אַ אַרײַנשרײַב (זען די TTS סוף־פּאַראַמעטערס)

אַרטיקל־פֿאָרש נייַעs-action

װײַז/היטן טעקסט־פֿאַרב

HTML
<script src="https://tts.ai/narrator.js"
    data-pk="pk-tts-your-publishable-key"
    data-voice="af_bella"
    data-model="kokoro"
    data-extract="auto"
    data-position="bottom"
    data-color="#e60000"
    data-locale="en"></script>

אָפּציעס

פּאַראַמעטערסבאַשרײַבונג
data-pkדערװײַלנדיקער קײט (pk-tts-…). דאָמאַין באַגרענעצונגען אױףגעװײסן דורך דעם קײטס <קאָד>צוגעלײגטע_דאָמאַינס פעלד
data-voiceסטײַב־ID. געװײנטלעכער <קאָד>af_bella
data-modelTTS מאָדעל ID. געװײנטלעכער <קאָד>קאָקאָרו
data-extractאויטאָמאַטיש (געװײנטלעכער) — װײַזט אױס אַרטיקל/הײם/.פּאָסט־אינפֿאָרמאַציע/.אַרײַנשרײַב־אינפֿאָרמאַציע סעלעקציעס, װעט צוריקגיין צו די גרעסטע אױספֿאָרמירונג פֿון דער אײנס. אָדער װײַזט אַ CSS סעלעקציע צו אַ ספּעסאַפירטע עלעמענט
data-position<קאָד>בײַם װײַטערן (געװײנטלעכער) אָדער <קאָד>אויסן
data-colorװײַז־פֿאַרב (אַ CSS־פֿאַרב). געװײנטלעכער <קאָד>#e60000
data-min-chars / data-max-charsאיבערלאָזן דעם שורה אױב דער אַרטיקל איז קײנער װי די קלענסטע שריפֿטצײכן (געװײנטלעכער 200). װײַז די גרעסטע שריפֿטצײכן (געװײנטלעכער 50,000)

מקור אויף GitHub:

קלײַב אַלץ אױס

אינערלעכער קנעפּל־סטייל אַרײַנשרײַב. װײַזט צו זײַן <קאָד><סקריפּט> הענטל און װײַזט אַ קנעפּל־געטרינקענע קורצע שטיקל. אַנדערש פֿון דער אַרטיקל־פֿאָרשער אויבן (װאָס שעפּט זיך אויטאָמאַטיש אַ בלעטער־װײַזנדיקע שורה און װײַזט דעם װײַזן

HTML
<script src="https://tts.ai/widget.js"
    data-voice="af_bella"
    data-model="kokoro"
    data-style="full"
    data-theme="light"></script>

קלײַב אַלץ אױס

אַרײַנשטעלן אַ רעפֿערענץ־אויער אַמאָל, באַקומען אַ װײַטער־װײַזנדיקע שפּראַך־איד, און דערנאָך אַרײַנשטעלן דעם איד אין TTS־פֿירער, אין װײַזונג אַז מען װעט ניט איבעראַרײַנשטעלן דעם אויער אױף יעדער װײַזונג. ידעאַל פֿאַר װײַטער־װײַזנדיקע אײנסונגען

װײַז פֿאָרמאַטירונג ס'איז פריי צו אַרײַנשטעלן (ניט קיין טעגלעכע צאָלונג, ניט קיין סלאָץ־קאָפּ). אַרײַנשטעלן צאָלונג: 500 שריפֿטצײכן אַמאָליק פֿאַר יעדער שפּראַך. פֿאַר יעדער ניצט צאָלונג: +50 שריפֿטצײכן צוגעגעבן צו יעדער TTS־גענעװערירונג װאָס רעפֿערענץ צו דער געװאַרטער שפּראַך, איבער די נאָרמאַלע גענעװערירונג צאָלונג. ארײַנשטעלן שפּראַכן װאָס דו װילסט ניט איצט צו היטן זיי װי װײַל; אױסװײַז אױף קיין צײַט. בײדע זענען פרייע API־צורופֿן.

אַרײַנשטעלן אַ שפּראַך

POST https://tts.ai/api/v1/user-voices/ אױסגעלופֿן

פֿעלדער: טעקע (דערפֿאַרט, 5-30ס אודיו), נאָמען (דערפֿאַרט), שפּראַך (אָפּציעל, געװײנטלעכער en), מאָדעל (אָפּציעל — װײַזט זיך אויטאָמאַטיש cosyvoice2 פֿאַר zh/ja/ko אַפֿילו openvoice), צושטימען_באַשטימט (דערפֿאַרט, װידער אַ אמתער באַטרעף)

curl -X POST https://tts.ai/api/v1/user-voices/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@reference.wav" \
  -F "name=My Narrator" \
  -F "language=en" \
  -F "consent_confirmed=true"

# Response:
{
  "public_id": "uv_a1b2c3d4e5f6",
  "id": 42,
  "name": "My Narrator",
  "model_name": "openvoice",
  "language": "en",
  "reference_audio_url": "https://tts.ai/media/user-voices/....wav",
  "storage_status": "active",
  "created_at": "2026-04-17T03:45:00+00:00"
}

ניצן די געװײנטלעכע שפּראַך

POST צו /api/v1/tts/ (צונויפֿשײדן: װײַב VPS־געסט, ניט api.tts.ai) מיט user_voice_id. מיר אַרײַנשטעלן די װײַזונג־קאָפּיע און װײַזונג־רױט צום קלאָנינג־פּאַפּיל

curl -X POST https://tts.ai/api/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'

# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.

קלײַב אַלץ אױסselect-action

GET    https://tts.ai/api/v1/user-voices/           # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6

אױסמעקן

אױסגעאַרבעטע שפּראַכן בלײַבן אין דיין אױסגאַבע, אָבער קענען ניט ווערן גענוצט אין TTS. פֿאַרנומען פֿאַר װײַל די רשימה בלײַבט קלאָר

POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/

קאָד אַרײַנשרײַב

טעקסט צו שפּראַך

Python - requests
import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

טעקסט פֿאַרבtext-tool-action

Python - requests
# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

שריפֿט גרײס

Python - requests
# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

טעקסט צו שפּראַך

JavaScript - fetch
const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

טעקסט פֿאַרבtext-tool-action

JavaScript - fetch
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

טעקסט צו שפּראַך

cURL
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

טעקסט פֿאַרבtext-tool-action

cURL
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

שריפֿט גרײס

cURL
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

אויטאָמאַטישע איבערזעצונג

cURL
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

דורכפֿאַל־קאָדז

אַלע דורכפֿאַלן װײַזן אַ JSON ענטפֿער מיט אַ error פֿעלדער

דורכפֿאַל־ענטפֿער־פֿאָרעם
{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough characters for this request.",
    "characters_required": 4000,
    "characters_available": 2000
  }
}
HTTP־סטאַטוסדורכפֿאַל־קאָדבאַשרײַבונג
400 bad_request אומלעקסיקע פֿראַגע־פּאַראַמעטערס. װײַז די טעות־װײַזונג פֿאַר מער אינפֿאָרמאַציע
401 unauthorized ניט־אָ אָדער אומלעקסיקער API־קלאַװיש
402 insufficient_credits ניט גענוג קרעדיטס. קויפן מער אין /pricing/
403 forbidden דו האָסט ניט דערלויבט צוצוטריט צו דער װעלט (דאָס הייסט, צו װײַזן אַן אַנדערן ניצער ס׳איז אױסגעפֿירט). API צוטריט איז אױסגעלופֿן אין װעלכעװײניקע פּלאָנען
404 not_found מאָדעל אָדער שפּראַך ניט געפֿונען
413 file_too_large די אַרײַנגעלייגטע טעקע איז גרעסער װי די גרײס־גרענעץ
429 rate_limited צופֿיל פֿראַגעס. קאָנטראָליר קאָפּצעטל־גאַראַנטירן
500 internal_error סערװירער טעות. פּרובירן שפּעטער
503 model_loading מאָדעל אַרײַנשטעלן. פּרובירן אױך אין אַ פּאָר סעקונדעס

טעקסט פֿאַרבtext-tool-action

פֿאַר לאַנג־לײַטנדיקע אַרבעטן (סטאַם צעשײדונג, באַטש TTS), קענט איר געבן אַ webhook_url פּאַראַמעטער. ווען די אַרבעט איז ענדיקט, װעלן מיר פּאָסטן דעם רעזולטאט צו אייער URL

טעקסט פֿאַרבtext-tool-action
{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}
Webhook רעזולטאטן זײַנען בנימצא צו אָפּלאָדן פֿאַר 24 שעה אױף דעם ענדיקן. זײַט זיכער צו אָפּלאָדן זיי באַלד

קלײַב אַלץ אױס

אַרײַנשטעלן TTS.ai אין אייער פּראָגראַם