API skjölun
Samþætta TTS.ai í forritum þínum með REST API okkar. OpenAI-samhæft snið fyrir auðveldan flutning.
Yfirlit
TTS.ai API veitir forritunarlegan aðgang að öllum eiginleikum vettvangsins: texta-til-tal myndun, tal-til-texta uppskrift, rödd klónun, hljóð aukahluti, og fleira.API notar staðlaða REST samninga með JSON beiðni / svar líkama.
API lykill
Fáðu API lykilinn þinn frá Stillingar reiknings. Í boði á Pro og Enterprise áætlunum.
Grunnslóð
https://api.tts.ai/v1/
Auðkenning
Bearer Token í gegnum Authorization haus
Auðkenning
/v1/tts/ Vinna án auth, allt að 5.000 stafir / dag á IP, með því að nota einhvern af okkar ókeypis módel (piper, vits, melotts, kokoro). Skráðu þig fyrir ókeypis reikning til að fá 15.000 bónus stafi og aðgang að úrvals módel.
Fyrir aukagjald módel og hærri takmörk, staðfesta með Bearer tákn í Authorization haus.
Authorization: Bearer sk-tts-your-api-key-here
SDK
Opinber SDK auðvelda að samþætta TTS.ai í forritið þitt.Bæði eru opinn uppspretta og fáanleg á GitHub.
Python
pip install ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
text="Hello world!",
model="kokoro"
)
client.save(audio, "output.wav")
JavaScript / Node.js
npm install @ttsainpm/ttsai
const { TTSClient } = require('@ttsainpm/ttsai');
const client = new TTSClient({
apiKey: 'sk-tts-...'
});
const audio = await client.generate({
input: 'Hello world!',
model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');
Grunnslóð
Allir endapunktar eru í tengslum við þessa grunnslóð. Til dæmis er TTS endapunkturinn:
Takmörk hraða
API hlutfall takmarkanir eru mismunandi eftir áætlun:
| Plan | Beiðnir / mín | Samtímis | Hámarks textalængd |
|---|---|---|---|
| Frjáls | 10 | 2 | 500 stafir |
| Ræsir | 30 | 3 | 1.000.000 stafir |
| Pro | 60 | 5 | 1.000.000 stafir |
| Fyrirtæki | 300 | 20 | 50.000 stafir |
Hraðtakmörk hausar eru innifalin í hverju svari: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.
Lánskostnaður
| Þjónusta | Kostnaður | Einingar |
|---|---|---|
| TTS (Free módel: Piper, VITS, MeloTTS) | 1.000 stafir | á hverja 1.000 stafi |
| TTS (Standard módel: Kokoro, CosyVoice 2, osfrv) | 2.000 stafir | á hverja 1.000 stafi |
| TTS (Premium módel: Tortoise, Chatterbox osfrv.) | 4.000 stafir | á hverja 1.000 stafi |
| Tal í texta | 2.000 stafir | á mínútu af hljóði |
| Raddklónun | 4.000 stafir | á hverja 1.000 stafi |
| RaddbreytirName | 3.000 stafir | á mínútu af hljóði |
| Hljóðuppfærsla | 2.000 stafir | á mínútu af hljóði |
| Vocal Fjarlægja / Stem skipting | 3.000-4.000 stafir | á mínútu af hljóði |
| TalþýðingName | 5.000 stafir | á mínútu af hljóði |
| Raddspjall | 3.000 stafir | í hvern leik |
| Key & BPM leitarvél | Frjáls | -- |
| Hljóðbreytir | Frjáls | -- |
Texti í talName
Umbreyta texta í talhljóð. Sýnir hljóðskrá á beiðnu sniði.
Beiðni
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| model | string | Nei | Tegundar-ID (t.d. kokoro, chatterbox, piper). Ef sleppt er, veljum við sjálfkrafa gerð sem styður beðið tungumál — kokoro fyrir en/ja/zh/ko/fr/de/it/pt/es/hi/ru, piper fyrir önnur tungumál (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/o.s.frv.). |
| text | string | Já | Texti til að breyta í tal. Hámark á beiðni: 500 stafir (nafnlaus), 5. 000 (frjáls reikningur), 1. 000. 000 (greiddur reikningur). Langar inntaksupplýsingar eru sjálfkrafa brotnar niður á miðlarahlið. |
| voice | string | Já | Voice ID (notaðu |
| format | string | Nei | Úttakssnið: mp3 (sjálfgefið), wav, flac, ogg |
| speed | float | Nei | Talhraða margfaldari. Sjálfgefið: 1.0. Svið: 0.5 til 2.0 |
| language | string | Nei | Tungumálakóði (t.d. en, es). Finnst sjálfkrafa ef sleppt er. |
| instructions | string | Nei | Virka / afhendingu vísbending (≤500 stafir). t.d. |
| pronunciations | object | array | Nei | Annaðhvort {\ |
| stream | boolean | Nei | Virkja straumsvar. Sjálfgefið: false |
Dæmi um beiðni
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{
"model": "kokoro",
"text": "Hello from TTS.ai! This is a test.",
"voice": "af_bella",
"format": "mp3"
}' \
--output output.mp3
SSML merki
Wrap tölur, dagsetningar, gjaldmiðill, símanúmer og skammstafanir í Sjálfgefið dagsetningarsnið er The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result. Poll this endpoint every 1-2 seconds until Fetch the Streaming alternative: For supported models (Kokoro, MeloTTS), use
túlka Inntak Talað sem cardinal1234one thousand two hundred thirty-four ordinal21twenty-first date1999-12-31December thirty-first, nineteen ninety-nine time14:30two thirty PM telephone+1-555-867-5309plus one five five five eight six seven… currency$1,234.56one thousand two hundred thirty-four dollars and fifty-six cents spell-outNASAN A S A mdy fyrir ensku og dmy annars staðar; yfirfæra með format=\{
"model": "kokoro",
"voice": "af_bella",
"text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}Svar
Step 1: Submit request
{
"uuid": "77b71db532874ce98e84a69a2d740d4c",
"job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
"status": "queued",
"credits_used": 11,
"credits_remaining": 15000
}Step 2: Poll for result
status is completed or failed.{
"status": "completed",
"result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}{
"status": "processing"
}Step 3: Download audio
result_url from the completed response to download the audio file.Full example
import requests, time
API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"
# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]
# 2. Poll for result
while True:
result = requests.get(f"{BASE}/v1/speech/results/",
params={"uuid": uuid}).json()
if result["status"] == "completed":
# 3. Download audio
audio = requests.get(result["result_url"])
with open("output.mp3", "wb") as f:
f.write(audio.content)
break
elif result["status"] == "failed":
raise Exception(result.get("error", "Generation failed"))
time.sleep(1.5)POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.
Tal í texta
Umrita hljóð í texta. Styður 99 tungumál með sjálfvirkri uppgötvun.
Beiðni (multipart/form-data)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| file | file | Já | Hljóðskrá (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Hámark 100MB. |
| model | string | Nei | STT líkan: hvísla (sjálfgefið), hraðari-hvísla, skynsamleg-rödd |
| language | string | Nei | Tungumálakóði. auto fyrir sjálfvirka uppgötvun (sjálfgefið). |
| timestamps | boolean | Nei | Sjálfgefið: false |
| diarize | boolean | Nei | Sjálfgefið: false |
Svar
{
"text": "Hello, this is a transcription test.",
"language": "en",
"duration": 3.5,
"segments": [
{
"start": 0.0,
"end": 1.8,
"text": "Hello, this is",
"speaker": "SPEAKER_00"
},
{
"start": 1.8,
"end": 3.5,
"text": "a transcription test.",
"speaker": "SPEAKER_00"
}
]
}
Raddklónun
Búa til ræðu í klónuðu rödd. Hlaða tilvísun hljóð og texta.
Beiðni (multipart/form-data)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| reference_audio | file | Já | Tilvísun rödd hljóð (10-30 sekúndur mælt með). Max 20MB. |
| text | string | Já | Texti til að tala í klónuðu rödd. |
| model | string | Nei | Klón líkan: chatterbox (sjálfgefið), cosyvoice2, gpt-sovits |
| format | string | Nei | Úttakssnið: mp3 (sjálfgefið), wav, flac |
| language | string | Nei | Tungumálakóði. Verður að vera studdur af valið gerð. |
Svar
Sýnir hljóðskrána sem tvíundagögn, eins og TTS endapunkturinn.
RaddbreytirName
Umbreyta hljóð til að hljóma eins og önnur rödd. Hlaða upp hljóð og velja mark rödd.
Beiðni (multipart/form-data)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| file | file | Já | Upprunaleg hljóðskrá (MP3, WAV, FLAC). Hámark 50MB. |
| target_voice | string | Já | Tilgreindu raddauðkenni sem á að breyta í (notaðu /v1/voices/ til að skrá tiltækar raddir) |
| model | string | Nei | Raddbreytingarlíkan: openvoice (sjálfgefið), knn-vc |
| format | string | Nei | Úttakssnið: wav (sjálfgefið), mp3, flac |
Dæmi um beiðni
curl -X POST https://api.tts.ai/v1/voice-convert/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@source_audio.mp3" \
-F "target_voice=af_bella" \
-F "model=openvoice" \
-o converted.wav
Svar
Skilur eftir breytta hljóðskrá sem tvíundagögn.
TalþýðingName
Sameinar tal-til-texta, þýðing, og texti-til-tal í einu símtali.Það er auðvelt að nota og auðvelt að nota.
Beiðni (multipart/form-data)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| file | file | Já | Upprunaleg hljóðskrá á upprunalegu tungumáli. Hámark 100MB. |
| target_language | string | Já | Tungumálakóði (t.d. |
| voice | string | Nei | Rödd fyrir þýtt úttak. Sjálfvirkt valið ef sleppt er. |
| preserve_voice | boolean | Nei | Reyna að varðveita upprunalega raddeiginleika ræðumannsins. Sjálfgefið: false |
Svar
{
"original_text": "Hello, how are you?",
"translated_text": "Hola, como estas?",
"source_language": "en",
"target_language": "es",
"audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
"credits_used": 5
}
Tal til tals
Umbreyta talstíl, tilfinningar, eða afhendingu en halda innihaldi. Gagnlegt fyrir að stilla tón, hraða og tjáningarmátt.
Beiðni (multipart/form-data)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| file | file | Já | Upprunaleg tal hljóðskrá. Hámark 50MB. |
| voice | string | Já | Markmið raddgreining fyrir framleiðsla ræðu |
| model | string | Nei | Model: openvoice (sjálfgefið), chatterbox |
| emotion | string | Nei | Tilfinningar: |
| speed | float | Nei | Hraðastilling. Sjálfgefið: 1.0. Svið: 0.5 til 2.0 |
Svar
Sýnir breytta hljóðskrá sem tvíunda gögn.
HljóðtólName
Hljóðvinnsla endapunkta til að auka, radd fjarlægja, stilkur skipting, og fleira.
Auka hljóðgæði: denoise, bæta skýrleika, frábær upplausn.
| file file | Hljóðskrá til að auka |
| denoise boolean | Virkja hávaðaeyðingu (sjálfgefið: satt) |
| enhance_clarity boolean | Auka talskýringu (sjálfgefið: satt) |
| super_resolution boolean | Uppskalun hljóðgæða (sjálfgefið: ósatt) |
| strength integer | 1- 3 (létt, meðal, sterkt). Sjálfgefið: 2 |
Aðskilja raddir frá hljóðfærum (rödd fjarlægja) eða skipt í stilkar.
| file file | Hljóðskrá sem á að aðskilja |
| model string | demucs (sjálfgefið) eða spleeter |
| stems integer | Fjöldi stilka: 2, 4, 5 eða 6 (sjálfgefið: 2) |
| format string | Úttakssnið: wav, mp3, flac |
Fjarlægðu echo og reverb frá hljóðupptökum.
| file file | Hljóðskrá sem á að vinna úr |
| type string | echo or reverb (default: both) |
| intensity integer | 1-5 (default: 3) |
Greina hljóð til að greina lykil, BPM og tíma undirskrift.
| file file | Hljóðskrá til að greina |
{
"key": "C",
"scale": "Major",
"bpm": 120.0,
"time_signature": "4/4",
"camelot": "8B",
"compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
Umbreyta hljóð milli snið.
| file file | Hljóðskrá sem á að umbreyta |
| format string | Marksnið: mp3, wav, flac, ogg, m4a, aac |
| bitrate integer | Úttaks bitahraði í kbps: 64, 128, 192, 256, 320 |
| sample_rate integer | Sýnatökutíðni: 22050, 44100, 48000 |
| channels string | mono eða stereo |
Raddspjall
Senda hljóð eða texta og fáðu AI svar með samsettri ræðu.
Beiðni (multipart/form-data eða JSON)
| Viðföng | Tegund | Nauðsynlegt | Lýsing |
|---|---|---|---|
| audio | file | Nei* | Hljóðinntak (annaðhvort hljóð eða texti nauðsynlegt) |
| text | string | Nei* | Texta inntak (annaðhvort audio eða text nauðsynlegt) |
| voice | string | Nei | Sjálfgefið: af_bella |
| tts_model | string | Nei | TTS líkan fyrir svar. Sjálfgefið: kokoro |
| system_prompt | string | Nei | Sérsniðin kerfiskveikja fyrir AI |
| conversation_id | string | Nei | Halda áfram núverandi samtali |
Svar
{
"conversation_id": "conv_abc123",
"user_text": "What is the capital of France?",
"ai_text": "The capital of France is Paris.",
"audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
"credits_used": 3
}
Batch TTS
Sendu inn marga texta fyrir samhliða TTS myndun. Valfrjálst að fá webhook callback þegar öllum verkefnum er lokið.
Breytur
| Breyta | Tegund | Lýsing |
|---|---|---|
| texts | array | Array of objects: {text, model, voice}. Max 50 items. |
| webhook_url | string | Optional URL to POST results when batch completes. |
Svar
{
"batch_id": "abc123",
"total": 3,
"completed": 0,
"status": "processing"
}
Framvinda könnunar með GET /v1/tts/batch/result/?batch_id=abc123
Innfelling raddupplýsinga
Forreikna innfellingu radd frá tilvísunarhljóði. Notaðu skilað embed_id í síðari beiðnir um raddklónun til að ná næstum samstundis myndun.
Breytur
| Breyta | Tegund | Lýsing |
|---|---|---|
| file | file | Reference audio file (WAV, MP3, FLAC). |
| model | string | Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts. |
Svar
{
"embed_id": "emb_abc123",
"model": "chatterbox",
"duration_ms": 450
}
Heilsuskoðun
Athuga stöðu GPU þjóns, hlaðin líkön og biðröðastærð. Engin auðkenning krafist. Skyndiminni í 30 sekúndur.
Svar
{
"status": "online",
"latency_ms": 45,
"queue_size": 3,
"models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
Listi yfir gerðir
Sýnir lista yfir allar tiltækar gerðir með getu þeirra.
Svar
{
"models": [
{
"id": "kokoro",
"name": "Kokoro",
"type": "tts",
"tier": "standard",
"languages": ["en", "ja", "ko", "zh", "fr"],
"supports_cloning": false,
"supports_streaming": true,
"credits_per_1k_chars": 2
},
{
"id": "chatterbox",
"name": "Chatterbox",
"type": "tts",
"tier": "premium",
"languages": ["en"],
"supports_cloning": true,
"supports_streaming": true,
"credits_per_1k_chars": 4
}
]
}
Listi yfir raddir
Sýnir lista yfir allar tiltækar raddir, valfrjálst síað eftir gerð eða tungumáli.
Stillingar fyrirspurnar
| Viðföng | Tegund | Lýsing |
|---|---|---|
| model | string | Sía eftir tegundarnúmeri (t.d. kokoro) |
| language | string | Sía eftir tungumálakóða (t.d. |
| gender | string | Sía eftir kyni: karlkyns, kvenkyns, hlutlaust |
Svar
{
"voices": [
{
"id": "af_bella",
"name": "Bella",
"model": "kokoro",
"language": "en",
"gender": "female",
"preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
}
],
"total": 142
}
Texti (SRT / VTT) nýtt
Búa til samstillta texta fyrir öll TTS verk sem eru lokið. Keyrir Whisper samræmingu yfir hljóð og skilar SRT eða WebVTT. Niðurstaðan er skyndiminni á disknum svo annað símtal fyrir sama uuid er lestur á disk.
Stillingar fyrirspurnar
| Viðföng | Nauðsynlegt | Lýsing |
|---|---|---|
| uuid | Já | Verk UUID skilað af / v1 / tts / eða / v1 / voice- clone /. |
| format | Nei | srt (sjálfgefið) eða vtt. |
| download | Nei | 1 til að senda Content-Disposition: attachment þannig að vafrinn vistir frekar en birtir. |
| language | Nei | Vísbending um samræmingarlíkanið (sjálfvirkt greint ef sleppt er). |
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
Framburður orðabók nýtt
Segðu TTS vélinni hvernig á að bera fram tiltekin orð. Vistaðar færslur eru sjálfkrafa beitt á hverja TTS beiðni sem þú gerir. 200 færslur á reikning.
Beiðni (POST)
| Viðföng | Tegund | Lýsing |
|---|---|---|
| word | string | Orðið sem á að yfirfæra (t.d. GIF, Anthropic). Orðmörk samsvarandi. |
| replacement | string | Hvernig á að stafa það fyrir líkanið (t.d. jiff, ann THROP ick). |
| language | string | Valfrjáls ISO kóði. Tómur = gildir um öll tungumál. |
| case_sensitive | boolean | Sjálfgefið false. Passa hástafi nákvæmlega þegar true. |
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
-H "Authorization: Bearer sk-tts-..." \
-H "Content-Type: application/json" \
-d '{"word": "GIF", "replacement": "jiff"}'
# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."
# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
Þú getur líka sent fram yfirfærslur á hverri beiðni án þess að vista þær — með pronunciations á hvaða /v1/tts/ kall sem er, annað hvort sem hlut eða fylki (sjá TTS endapunkts breytur).
Greinarlesari nýtt
Slepptu einu merki á hvaða greinarsíðu sem er og gestir fá fasta lesandi bar sem segir síðuna við smell.Sjálfvirkt greinir greinarlíkamann, styður sérsniðna rödd / líkan / stöðu / hreim lit.
<script src="https://tts.ai/narrator.js"
data-pk="pk-tts-your-publishable-key"
data-voice="af_bella"
data-model="kokoro"
data-extract="auto"
data-position="bottom"
data-color="#e60000"
data-locale="en"></script>
Valkostir
| Viðföng | Lýsing |
|---|---|
data-pk | Útgefanlegur lykill (pk-tts-…). Takmarkanir á lénum framfylgdar í gegnum allowed_domains reitinn í lyklinum. |
data-voice | Sjálfgefið af_bella. |
data-model | TTS líkana- auðkenni. Sjálfgefið kokoro. |
data-extract | auto (sjálfgefið) — reynir að velja grein/megin/.post-content/.entry-content, fellur aftur á þéttasta málsgreinarhópinn. Eða framkvæma hvaða CSS-val sem er til að miða á tiltekinn þátt. |
data-position | bottom (sjálfgefið) eða top. |
data-color | Hreinleiki (hver CSS litur). Sjálfgefið #e60000. |
data-min-chars / data-max-chars | Sleppa yfir línuna ef greinin er styttri en lágmarks- stafir (sjálfgefið 200). Takmarka innslátt við hámarks- stafir (sjálfgefið 50. 000). |
Hlusta hnappur græjaName
Innfelld hnappagerð. Birtist við hliðina á merkinu og spilar stuttan hluta sem kveiktur er á með hnappi. Mismunandi frá greinarlesaranum hér að ofan (sem setur sjálfkrafa inn síðuslá og segir frá allri greininni).
<script src="https://tts.ai/widget.js"
data-voice="af_bella"
data-model="kokoro"
data-style="full"
data-theme="light"></script>
Vistaðar raddir (Varanlegar klónir)
Hladdu upp tilvísunarhljóði einu sinni, fáðu aftur viðvarandi voice_id, þá vísaðu til þess auðkennis í TTS-beiðnum í stað þess að hlaða hljóðinu aftur í hvert símtal.
Hlaða inn rödd
POST
https://tts.ai/api/v1/user-voices/
Auðkenningar er krafist
Reitir: skrá (krafist, 5-30s hljóð), nafn (krafist), tungumál (valfrjálst, sjálfgefið en), gerð (valfrjálst — velur sjálfkrafa cosyvoice2 fyrir zh/ja/ko annars openvoice), samþykki_staðfest (krafist, hvaða satt gildi sem er).
curl -X POST https://tts.ai/api/v1/user-voices/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@reference.wav" \
-F "name=My Narrator" \
-F "language=en" \
-F "consent_confirmed=true"
# Response:
{
"public_id": "uv_a1b2c3d4e5f6",
"id": 42,
"name": "My Narrator",
"model_name": "openvoice",
"language": "en",
"reference_audio_url": "https://tts.ai/media/user-voices/....wav",
"storage_status": "active",
"created_at": "2026-04-17T03:45:00+00:00"
}
Notaðu vistuðu röddina í TTS
POST til /api/v1/tts/ (ATH: vef VPS gestgjafi, ekki api.tts.ai) með Við hlaða geymt hljóð og leið til klónun leiðslum.
curl -X POST https://tts.ai/api/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'
# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.
Listi / eyða
GET https://tts.ai/api/v1/user-voices/ # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6
Archive / endurvirkja (ókeypis)
Geymdar raddir eru áfram á reikningnum þínum en ekki er hægt að nota í TTS. Gagnlegt fyrir sofandi notendur svo listi þinn er hreinn.
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/
Dæmi um kóða
Texti í talName
import requests
API_KEY = "sk-tts-your-key"
# Text to Speech
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
"format": "mp3"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
print(f"Credits used: {response.headers.get('X-Credits-Used')}")
Tal í texta
# Speech to Text
with open("recording.mp3", "rb") as f:
response = requests.post(
"https://api.tts.ai/v1/stt/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"file": f},
data={"model": "faster-whisper", "timestamps": "true"}
)
result = response.json()
print(result["text"])
Raddklónun
# Voice Cloning
with open("reference.wav", "rb") as ref:
response = requests.post(
"https://api.tts.ai/v1/tts/clone/",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"reference_audio": ref},
data={
"text": "This speech uses a cloned voice.",
"model": "chatterbox"
}
)
with open("cloned_output.mp3", "wb") as f:
f.write(response.content)
Texti í talName
const API_KEY = 'sk-tts-your-key';
// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
method: 'POST',
headers: {
'Authorization': `Bearer ${API_KEY}`,
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'kokoro',
text: 'Hello from TTS.ai!',
voice: 'af_bella',
format: 'mp3'
})
});
const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();
Tal í texta
// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');
const response = await fetch('https://api.tts.ai/v1/stt/', {
method: 'POST',
headers: { 'Authorization': `Bearer ${API_KEY}` },
body: formData
});
const result = await response.json();
console.log(result.text);
Texti í talName
# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
-H "Authorization: Bearer sk-tts-your-key" \
-H "Content-Type: application/json" \
-d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
-o output.mp3
Tal í texta
# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@recording.mp3" \
-F "model=faster-whisper" \
-F "timestamps=true"
Raddklónun
# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "reference_audio=@reference.wav" \
-F "text=This uses a cloned voice." \
-F "model=chatterbox" \
-o cloned.mp3
Hljóðuppfærsla
# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
-H "Authorization: Bearer sk-tts-your-key" \
-F "file=@noisy_audio.mp3" \
-F "denoise=true" \
-F "enhance_clarity=true" \
-o enhanced.mp3
Villukóðar
Allar villur skila JSON svari með error - Á sviđinu.
{
"error": {
"code": "insufficient_credits",
"message": "You do not have enough characters for this request.",
"characters_required": 4000,
"characters_available": 2000
}
}
| HTTP staða | Villukóði | Lýsing |
|---|---|---|
| 400 | bad_request |
Ógild viðföng beiðni. Athugaðu villuboðin fyrir frekari upplýsingar. |
| 401 | unauthorized |
Vantar eða ógildur API lykill. |
| 402 | insufficient_credits |
Ekki nóg stafi. Kaupa meira á / pricing /. |
| 403 | forbidden |
Þú hefur ekki heimild til að fá aðgang að þessu auðlindinni (t.d. að kanna starf annars notanda). API aðgangur sjálft er innifalið í öllum áætlunum. |
| 404 | not_found |
Líkan eða rödd fannst ekki. |
| 413 | file_too_large |
Skráin sem var hlaðið inn fer yfir stærðartakmörkin. |
| 429 | rate_limited |
Of margar beiðnir. Athugaðu hraðatakmarkanir hausa. |
| 500 | internal_error |
Þjónusta villa. Reyndu aftur seinna. |
| 503 | model_loading |
Hleð inn líkani. Reyndu aftur eftir nokkrar sekúndur. |
Vefhögg
Fyrir verkefni sem taka langan tíma að ljúka (t.d. að skipta upp stofni, batch TTS) geturðu notað webhook_url breytu. Þegar verkinu er lokið munum við senda niðurstöðuna á slóðina þína.
{
"event": "task.completed",
"task_id": "task_abc123",
"status": "success",
"result_url": "https://api.tts.ai/v1/results/task_abc123",
"credits_used": 12,
"created_at": "2025-01-15T10:30:00Z",
"completed_at": "2025-01-15T10:30:45Z"
}
Tilbúinn til að byggja?
Fáðu API lykilinn þinn og byrjaðu að samþætta TTS.ai í forritin þín.