Bagaimana saya mendapatkan kunci API?

Sign up for a free TTS.ai account, then navigate to your account dashboard and click "Generate API Key." Your key will be prefixed with sk-tts- and can be used immediately. Free accounts receive 15,000 characters to get started.

Apakah API kompatibel dengan format OpenAI?

Ya, API kami mengikuti permintaan dan format respon OpenAI. Jika Anda memiliki kode yang ada yang menggunakan TTS API OpenAI, Anda dapat beralih ke TTS.ai dengan mengubah kunci URL dasar dan API dengan perubahan kode minimal.

Bahasa pemrograman apa saja yang didukung?

API TERBAIK bekerja dengan bahasa apa pun yang dapat membuat permintaan HTTP. Kami menyediakan contoh kode dalam Python, JavaScript (Node.js dan peramban), TURL, dan lagi. Setiap bahasa dengan perpustakaan klien HTTP (Go, Ruby, Java, C#, PHP, dsb.) dapat menggunakan API.

Berapa batas tingkat API?

Akun bebas terbatas pada 3 permintaan per jam. Rencana yang dibayar memiliki batas yang lebih tinggi berdasarkan tingkat langganan Anda: Starter (60/jam), Profesional (300/jam), Enterprise (tak terbatas). Tajuk batas Rate disertakan dalam setiap respon API.

Bagaimana cara kerja harga API?

Penggunaan API mengkonsumsi karakter berdasarkan panjang tingkat model dan teks. Model gratis menggunakan 0 karakter, model standar menggunakan 2x karakter, dan model premium menggunakan 4x karakter. Karakter termasuk dalam semua rencana yang dibayar dan juga dapat dibeli secara terpisah sebagai paket karakter.

Apa saja titik akhir yang tersedia?

API menyediakan titik akhir bagi text-to-voice-conversi (POS/v1/tts/), pidato-to-text (POST /v1/trrancite/), cloning suara (POSE /v1/voice-clope/), konversi suara (POS /v1/voice-convert/), terjemahan pidato (POST /v1/spee-translatate/), peningkatan audio (POSE /1 /1/auendioance/), penghapusan, batang suara, pemisahan, kunci/BPOMM, dan analisis lainnya.

Format audio apa yang kembalinya API?

API mengembalikan audio dalam format WAV secara baku. Anda dapat menentukan format keluaran (mp3, wav, gg, flac) menggunakan parameter respon_format. MP3 direkomendasikan untuk aplikasi web, WAV untuk pemrosesan audio lebih lanjut.

Apakah ada API streaming untuk TTS real-time?

Ya, async API kami mengembalikan UUID pekerjaan yang dapat anda jajak pendapat untuk hasil. Untuk model yang didukung seperti Kokoro, pembuatan audio cukup cepat untuk aplikasi waktu dekat. Titik jajak pendapat mengembalikan URL audio ketika pemrosesan selesai.

Bagaimana cara menangani kesalahan di API?

API mengembalikan kode status HTTP standar (400 untuk permintaan buruk, 401 untuk galat auth, 429 untuk batas laju, 500 untuk kesalahan server) dengan pesan galat JSON. Selalu periksa kode status dan ruas galat dalam respon untuk penanganan galat yang tepat.

Dapatkah saya menggunakan API untuk aplikasi komersial?

Ya, API dirancang untuk penggunaan komersial. Audio yang dihasilkan melalui API dapat digunakan dalam produk, aplikasi, dan jasa Anda. Semua model menggunakan lisensi open-source, dan tidak ada royalti tambahan pada audio yang dihasilkan.

Apakah ada sandbox atau lingkungan pengujian?

Model Free-tier (Kokoro, Piper, VITS, Melotts) berfungsi sebagai kotak pasir yang sangat bagus mereka menggunakan nol karakter dan tersedia untuk semua akun. uji integrasi Anda dengan model gratis sebelum beralih ke model premium untuk penggunaan produksi.

Bagaimana saya daftar tersedia suara dan model melalui API?

Gunakan GET /v1/voices untuk daftar semua suara yang tersedia dengan pilihan penyaringan (model, bahasa, gender). Gunakan GET /v1/model untuk daftar semua model TTS yang tersedia dengan kemampuan mereka dan informasi tier. Kedua titik akhir mengembalikan respon JSON.

Laporkan Permintaan Kutu / Fitur

Dokumentasi API

Integrate TTS.ai ke aplikasi Anda dengan API RAT kami. Format yang kompatibel dengan OpenAI untuk migrasi mudah.

API RAT Kompatibel OpenAI JSON Tanggapan Dukungan streaming

Ringkasan

API TTS.ai menyediakan akses programmatis ke semua fitur platform: sintesis text-to-speech, transkripsi bicara-ke-teks, kloning suara, peningkatan audio, dan lebih. API menggunakan konvensi REST standar dengan permintaan JSON/reponse tubuh.

Kunci API

Dapatkan kunci API Anda dari Pengaturan Akun. Tersedia pada rencana Pro dan Enterprise.

URL Dasar

https://api.tts.ai/v1/

Auth

Token pembawa melalui Authorization tajuk

Otentikasi

Tak ada kunci yang diperlukan. Kepada POST tanpa nama /v1/tts/ bekerja tanpa auth apapun, hingga 5.000 karakter/hari per IP, menggunakan salah satu model gratis kami (piper, vits, melotts, kokoro). Daftarkan akun gratis untuk mendapatkan 15.000 karakter bonus dan akses ke model premium.

Untuk model premium dan batas tingkat yang lebih tinggi, otentikasi dengan token Bearer dalam Authorization tajuk.

Header HTTP

Authorization: Bearer sk-tts-your-api-key-here

Simpan rahasia kunci API Anda. Jangan bagi dalam kode sisi klien, repositori publik, atau log. Putar kunci secara teratur dari pengaturan akun Anda.

SDK

Official SDKs make it easy to integrate TTS.ai into your application. Both are open source and available on GitHub.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

URL Dasar

URL Dasar: https://api.tts.ai/v1/

Semua titik akhir relatif terhadap URL dasar ini. Sebagai contoh, titik akhir TTS adalah:

POST https://api.tts.ai/v1/tts/

Batas Laju

Batas tingkat API bervariasi menurut rencana:

Rencana	Permintaan/min	Bersama	Panjang Teks Max
Bebas	10	2	500 karakter
Pemulai	30	3	1.000.000 karakter
Pro	60	5	1.000.000 karakter
Enterprise	300	20	50.000 karakter

Tingkat batas header termasuk dalam setiap respon: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Biaya Kredit

Layanan	Biaya	Unit
TTS (model gratis: Piper, VITS, Melotts)	1.000 karakter	per 1.000 karakter
TTS (model Standard: Kokoro, CosyVoice 2, dsb.)	2.000 karakter	per 1.000 karakter
TTS (model Premium: Tortoise, Chatterbox, dll)	4.000 karakter	per 1.000 karakter
Pidato ke Teks	2.000 karakter	per menit audio
Kloning Suara	4.000 karakter	per 1.000 karakter
Voice Changer	3.000 karakter	per menit audio
Peningkatan Audio	2.000 karakter	per menit audio
Vokal Removal / Stem Splitting	3.000-4.000 karakter	per menit audio
Terjemahan Tutur Kata	5.000 karakter	per menit audio
Percakapan Suara	3.000 karakter	per putaran
Pencari Tombol & BPM	Bebas	--
Pengkonversi Audio	Bebas	--

Teks ke Pidato

POST /v1/tts/

Ubah teks ke audio pidato. Mengembalikan berkas audio dalam format yang diminta.

Badan Permintaan

Parameter	Tipe	Diperlukan	Deskripsi
model	string	Tidak	Model ID (e.g., koro`, chatterbox , untuk en/jazh/fr/de/hi/hi/ru, yang diminta untuk bahasa-bahasa lain (/arpl/c/l/c/fida//fi/tv/t).`
text	string	Ya	Teks untuk dikonversi ke pidato. Per-request cap: 500 karakter (anonim), 5.000 (akun bebas), 1.000.000 (rencana berbayar). masukan panjang adalah auto-chounded server-side.
voice	string	Ya	ID suara (gunakan /v1/voices/ untuk daftar suara yang tersedia)
format	string	Tidak	Format keluaran: mp3 (baku), `wav`, flac, `ogg`
speed	float	Tidak	Speaking speed multiplier. Baku: 1.0. Range: ke 2.0
language	string	Tidak	Kode bahasa (mis., en, es). Auto-dideteksi jika diabaikan.
instructions	string	Tidak	Tanda penyampaian / akting (500 karakter). mis. \
pronunciations	object \| array	Tidak	Per-request pengucapan overrides. Either `{\`
stream	boolean	Tidak	Aktifkan respon streaming. Baku: false

Permintaan Contoh

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

Tag SSML

Wrap nomor, tanggal, mata uang, nomor telepon, dan akronim dalam

interpretasi sebagai	Masukan	Disampaikan sebagai
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	Desember tiga puluh satu, sembilan belas sembilan puluh sembilan
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A

Format tanggal baku ke mdy untuk bahasa Inggris dan dmy di tempat lain; override dengan format=\

Contoh

{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}

Tanggapan

The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

Step 1: Submit request

Response (JSON)

{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}

Step 2: Poll for result

GET /v1/speech/results/?uuid=<job_uuid>

Poll this endpoint every 1-2 seconds until status is completed or failed.

Polling response (completed)

{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}

Polling response (still processing)

{
  "status": "processing"
}

Step 3: Download audio

Fetch the result_url from the completed response to download the audio file.

Contoh lengkap

Python

import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)

Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.

Pidato ke Teks

POST /v1/stt/

Transkrip audio ke teks. Mendukung 99 bahasa dengan auto-deteksi.

Badan Permintaan (multipart/form-data)

Parameter	Tipe	Diperlukan	Deskripsi
file	file	Ya	Berkas audio (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). Max 100MB.
model	string	Tidak	STT model: `wissper` (baku), `pe-whisper`, sensevoice
language	string	Tidak	Kode bahasa. auto untuk auto-deteksi (baku).
timestamps	boolean	Tidak	Sertakan penanda waktu tingkat kata. Baku: false
diarize	boolean	Tidak	Aktifkan diarisasi speaker. Baku: false

Tanggapan

JSON Response

{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}

Kloning Suara

POST /v1/tts/clone/

Hasilkan pidato dalam suara kloning. Unggah sebuah referensi audio dan teks.

Badan Permintaan (multipart/form-data)

Parameter	Tipe	Diperlukan	Deskripsi
reference_audio	file	Ya	Audio suara referensi (10-30 detik direkomendasikan). Max 20MB.
text	string	Ya	Teks untuk berbicara dalam suara kloning.
model	string	Tidak	Model Clone: `Chatterbox` (baku), `cocyvoice2`, `gpt-sovits`
format	string	Tidak	Format keluaran: mp3 (baku), wav, flac
language	string	Tidak	Kode bahasa target. Harus didukung oleh model yang dipilih.

Tanggapan

Mengembalikan berkas audio sebagai data biner, sama seperti titik akhir TTS.

Voice Changer

POST /v1/voice-convert/

Ubah audio ke suara lain. Unggah audio sumber dan pilih suara target.

Badan Permintaan (multipart/form-data)

Parameter	Tipe	Diperlukan	Deskripsi
file	file	Ya	Berkas audio sumber (MP3, WAV, FLAC). Max 50MB.
target_voice	string	Ya	Target ID suara untuk dikonversi ke (gunakan /v1/voices/ untuk mendaftar suara yang tersedia)
model	string	Tidak	Model konversi suara: openvoice (baku), kn-vc
format	string	Tidak	Format keluaran: wav (baku), mp3, flac

Permintaan Contoh

cURL

curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav

Tanggapan

Mengembalikan berkas audio yang dikonversi sebagai data biner.

Terjemahan Tutur Kata

POST /v1/speech-translate/

Terjemahkan audio yang digunakan dari satu bahasa ke bahasa lain. Combined speech-to-text, terjemahan, dan teks-to-peech dalam satu panggilan.

Badan Permintaan (multipart/form-data)

Parameter	Tipe	Diperlukan	Deskripsi
file	file	Ya	Berkas audio sumber dalam bahasa asli. Max 100MB.
target_language	string	Ya	Target kode bahasa (e.g., es, `fr`, , , )
voice	string	Tidak	Suara untuk keluaran terjemahan. Dipilih otomatis bila diabaikan.
preserve_voice	boolean	Tidak	Mencoba mempertahankan karakteristik suara pembicara asli. Baku: false

Tanggapan

JSON Response

{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}

Tutur Kata

POST /v1/speech-to-speech/

Ubah gaya bicara, emosi, atau pengiriman sewaktu menyimpan isi. Berguna untuk menyesuaikan nada, kecepatan, dan ekspresif.

Badan Permintaan (multipart/form-data)

Parameter	Tipe	Diperlukan	Deskripsi
file	file	Ya	Berkas audio pidato sumber. Max 50MB.
voice	string	Ya	Target ID suara untuk pidato keluaran
model	string	Tidak	Model: openvoice (baku), chatterbox
emotion	string	Tidak	Emosi target: neutral, senang, ad, , ,
speed	float	Tidak	Penyesuaian kecepatan. Baku: 1.0. Jarak: 0.5 ke 2.0

Tanggapan

Mengembalikan berkas audio yang diubah sebagai data biner.

Perkakas Audio

Titik akhir pemrosesan audio untuk peningkatan, penghapusan vokal, pemisahan batang, dan masih banyak lagi.

POST /v1/audio/enhance/

Tingkatkan kualitas audio: denoise, meningkatkan kejelasan, resolusi super.

file file	Berkas audio yang akan ditambahkan
denoise boolean	Aktifkan denoising (baku: benar)
enhance_clarity boolean	Tingkatkan kejelasan ucapan (baku: benar)
super_resolution boolean	Kualitas audio kelas atas (baku: salah)
strength integer	1-3 (cahaya, sedang, kuat). Baku: 2

POST /v1/audio/separate/

Pisahkan vokal dari instrumental (penghapusanvokal) atau pecah menjadi batang.

file file	Berkas audio untuk dipisahkan
model string	`demucs` (baku) atau `spleeter`
stems integer	Jumlah batang: 2, 4, 5, atau 6 (baku: 2)
format string	Format keluaran: wav, mp3, flac

POST /v1/audio/dereverb/

Hapus gema dan reverb dari rekaman audio.

file file	Berkas audio untuk diproses
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

POST /v1/audio/analyze/ Bebas

Analisis audio untuk mendeteksi kunci, BPM, dan tanda tangan waktu.

file file

Berkas audio untuk dianalisa

Tanggapan

{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}

POST /v1/audio/convert/ Bebas

Ubah audio antar format.

file file	Berkas audio untuk dikonversi
format string	Format target: mp3, wav, flac, ,
bitrate integer	Bitrate keluaran di kbps: 64, 128, 192, 256, 320
sample_rate integer	Laju sampel: 22050, 44100, 48 000
channels string	`mono` atau `stereo`

Percakapan Suara

POST /v1/voice-chat/

Kirim audio atau teks dan terima jawaban AI dengan pidato yang disintesis.

Badan Permintaan (multipart/form-data atau JSON)

Parameter	Tipe	Diperlukan	Deskripsi
audio	file	Tidak*	Masukan audio (yang dibutuhkan audio atau text)
text	string	Tidak*	Masukan teks (baik audio atau text dibutuhkan)
voice	string	Tidak	Suara untuk respon AI. Baku: af_bella
tts_model	string	Tidak	Model TTS untuk respon. Baku: koro
system_prompt	string	Tidak	Prompt sistem gubahan bagi AI
conversation_id	string	Tidak	Lanjutkan percakapan yang sudah ada

Tanggapan

JSON Response

{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}

Batch TTS

POST /v1/tts/batch/

Kirim beberapa teks untuk pembuatan TTS paralel. Pilihannya menerima panggilan webhook ketika semua pekerjaan selesai.

Parameter

Parameter	Tipe	Deskripsi
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	URL opsional ke hasil POST ketika batch selesai.

Tanggapan

JSON Response

{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}

Kemajuan polon dengan GET /v1/tts/batch/result/?batch_id=abc123

Embedding Suara

POST /v1/voice-embed/

Pra-compate sebuah embedding suara dari audio referensi. Gunakan embed_id yang dikembalikan dalam permintaan kloning suara selanjutnya untuk generasi dekat-instant.

Parameter

Parameter	Tipe	Deskripsi
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Tanggapan

JSON Response

{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}

Pemeriksaan Kesehatan

GET /v1/health/

Periksa status server GPU, model yang dimuat, dan ukuran antrian. Tak diperlukan otentikasi. Cached selama 30 detik.

Tanggapan

JSON Response

{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}

Daftar Model

GET /v1/models/

Mengembalikan daftar semua model yang tersedia dengan kemampuan mereka.

Tanggapan

JSON Response

{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}

Daftar Suara

GET /v1/voices/

Mengembalikan daftar semua suara yang tersedia, dengan pilihan tersaring berdasarkan model atau bahasa.

Parameter Kuiri

Parameter	Tipe	Deskripsi
model	string	Filter menurut model ID (misalnya, kokoro)
language	string	Filter oleh kode bahasa (mis, en)
gender	string	Filter by gender: male, `women`, neutral

Tanggapan

JSON Response

{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}

Teks (SRT / VTT) baru

GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1

Hasilkan subtitel yang disinkronkan untuk pekerjaan TTS yang telah selesai. Jalankan Whisper alignment atas audio dan mengembalikan SRT atau WebVTT. Hasil dicache di disk sehingga panggilan kedua untuk uuid yang sama adalah sebuah baca disk.

Parameter Kuiri

Parameter	Diperlukan	Deskripsi
uuid	Ya	UUID Job dikembalikan oleh /v1/tts/atau /v1/voice-clone/.
format	Tidak	srt (baku) atau vtt.
download	Tidak	1 untuk mengirim Konten-Disposisi: lampiran sehingga peramban menyimpan daripada menampilkan.
language	Tidak	Petunjuk ke model perataan (oto-dideteksi jika diabaikan).

cURL

curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt

Kamus Pengucapan baru

GET POST DELETE /api/v1/pronunciations/

Beritahu mesin TTS bagaimana mengucapkan kata-kata spesifik. Masukan disimpan otomatis ke setiap TTS meminta Anda membuat. Batas per-akun 200-entry.

Badan Permintaan (POST)

Parameter	Tipe	Deskripsi
word	string	Kata untuk menimpa (mis. GIF, Antropik). Batas-kata cocok.
replacement	string	Bagaimana mengejanya untuk model (mis. jiff, ann THROP ick ).
language	string	Kode ISO opsional. Kosong = berlaku untuk semua bahasa.
case_sensitive	boolean	Default false. Match case persis ketika true.

cURL

# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."

Anda juga dapat melewati overrides per-request tanpa menyimpannya termasuk janji pada setiap /v1/tts/panggilan sebagai baik sebuah objek atau sebuah array (lihat params titik akhir TTS).

Artikel Narator baru

Jatuhkan satu tag pada halaman artikel apapun dan pengunjung mendapatkan sebuah bar pembaca tetap yang menceritakan halaman pada klik. Auto-detects tubuh artikel, mendukung suara kustom / model / aksen warna.

HTML

<script src="https://tts.ai/narrator.js"
    data-pk="pk-tts-your-publishable-key"
    data-voice="af_bella"
    data-model="kokoro"
    data-extract="auto"
    data-position="bottom"
    data-color="#e60000"
    data-locale="en"></script>

Opsi

Parameter	Deskripsi
`data-pk`	Kunci yang dapat diterbitkan (pk-tts-...). Pembatasan domain dipaksakan melalui kunci tallow_domains field.
`data-voice`	ID suara. Default af_bella.
`data-model`	ID model TTS. Default koro.
`data-extract`	auto (baku) coba artikel/main/.post-content/.entry-content pemilih, kembali ke cluster paragraf padat. Atau melewati pemilih CSS untuk menargetkan suatu elemen tertentu.
`data-position`	bottom (baku) atau top.
`data-color`	Warna sen (semua warna CSS). Baku #e600.000.
`data-min-chars` / `data-max-chars`	Lewati bar jika artikel lebih pendek dari min-chars (baku 200). Cap masukan di max-chars (baku 50.000).

Sumber pada GitHub:

Widget Tombol Dengar

Inline tombol-style embed. Renders di samping tag dan memainkan snippet pendek dengan tombol pemicu. Bentuk berbeda dari Artikel Narator di atas (yang auto-injects sebuah halaman-panning bar dan narasi seluruh artikel).

HTML

<script src="https://tts.ai/widget.js"
    data-voice="af_bella"
    data-model="kokoro"
    data-style="full"
    data-theme="light"></script>

Disimpan Suara (Kloning Pesisten)

Unggah suatu audio referensi sekali, dapatkan kembali voice_id yang persisten, lalu referensikan id dalam TTS permintaan bukan memuat ulang audio setiap panggilan. Ideal untuk integrasi volume tinggi.

Pricing: Penyimpanan gratis (tidak ada sewa harian, tidak ada tutup slot). Unggah biaya: 500 karakter satu kali per suara. Per-gunakan charge: +50 karakter ditambahkan ke setiap generasi TTS yang mereferensikan suara yang disimpan, di atas biaya generasi normal. Suara archive Anda tidak perlu sekarang untuk membuat mereka tidak aktif; mengaktifkan kembali setiap saat. Keduanya adalah panggilan API gratis.

Unggah suatu suara

POST https://tts.ai/api/v1/user-voices/ Diperlukan Auth

Formulir multipart. Fields: berkas (dibutuhkan, audio 5-30s), nama (diperlukan), bahasa (opsional, baku en), model (opsional ▪ pemungut-otomatis kosyvoice2 untuk zh/ja/ko lainnya openvoice), persetujuan_confirmed (dibutuhkan, nilai kebenaran).

curl -X POST https://tts.ai/api/v1/user-voices/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@reference.wav" \
  -F "name=My Narrator" \
  -F "language=en" \
  -F "consent_confirmed=true"

# Response:
{
  "public_id": "uv_a1b2c3d4e5f6",
  "id": 42,
  "name": "My Narrator",
  "model_name": "openvoice",
  "language": "en",
  "reference_audio_url": "https://tts.ai/media/user-voices/....wav",
  "storage_status": "active",
  "created_at": "2026-04-17T03:45:00+00:00"
}

Gunakan suara yang disimpan dalam TTS

POST ke /api/v1/tts/ (NOTE: web VPS host, bukan api.tts.ai) dengan user_voice_id. Kami memuat audio dan rute anda yang tersimpan ke jaringan pipa kloning.

curl -X POST https://tts.ai/api/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"text":"Hello from my saved voice","user_voice_id":"uv_a1b2c3d4e5f6"}'

# Returns a queued job — poll /v1/speech/results/?uuid=... for the audio URL.

Daftar / hapus

GET    https://tts.ai/api/v1/user-voices/           # list your saved voices + quota info
DELETE https://tts.ai/api/v1/user-voices/?public_id=uv_a1b2c3d4e5f6

Arsip / diaktifkan (bebas)

Suara yang diarsipkan tetap di akun Anda tetapi tidak dapat digunakan dalam TTS. Berguna untuk pengguna akhir aktif sehingga daftar Anda tetap bersih.

POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/archive/
POST https://tts.ai/api/v1/user-voices/uv_a1b2c3d4e5f6/reactivate/

Contoh Kode

Teks ke Pidato

Permintaan Python

import requests

API_KEY = "sk-tts-your-key"

# Text to Speech
response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": f"Bearer {API_KEY}"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
        "format": "mp3"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

print(f"Credits used: {response.headers.get('X-Credits-Used')}")

Pidato ke Teks

Permintaan Python

# Speech to Text
with open("recording.mp3", "rb") as f:
    response = requests.post(
        "https://api.tts.ai/v1/stt/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"file": f},
        data={"model": "faster-whisper", "timestamps": "true"}
    )

result = response.json()
print(result["text"])

Kloning Suara

Permintaan Python

# Voice Cloning
with open("reference.wav", "rb") as ref:
    response = requests.post(
        "https://api.tts.ai/v1/tts/clone/",
        headers={"Authorization": f"Bearer {API_KEY}"},
        files={"reference_audio": ref},
        data={
            "text": "This speech uses a cloned voice.",
            "model": "chatterbox"
        }
    )

with open("cloned_output.mp3", "wb") as f:
    f.write(response.content)

Teks ke Pidato

JavaScript - ambil

const API_KEY = 'sk-tts-your-key';

// Text to Speech
const response = await fetch('https://api.tts.ai/v1/tts/', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${API_KEY}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    model: 'kokoro',
    text: 'Hello from TTS.ai!',
    voice: 'af_bella',
    format: 'mp3'
  })
});

const audioBlob = await response.blob();
const audioUrl = URL.createObjectURL(audioBlob);
const audio = new Audio(audioUrl);
audio.play();

Pidato ke Teks

JavaScript - ambil

// Speech to Text
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'faster-whisper');

const response = await fetch('https://api.tts.ai/v1/stt/', {
  method: 'POST',
  headers: { 'Authorization': `Bearer ${API_KEY}` },
  body: formData
});

const result = await response.json();
console.log(result.text);

Teks ke Pidato

cURL

# Text to Speech
curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model":"kokoro","text":"Hello!","voice":"af_bella","format":"mp3"}' \
  -o output.mp3

Pidato ke Teks

cURL

# Speech to Text
curl -X POST https://api.tts.ai/v1/stt/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@recording.mp3" \
  -F "model=faster-whisper" \
  -F "timestamps=true"

Kloning Suara

cURL

# Voice Cloning
curl -X POST https://api.tts.ai/v1/tts/clone/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "reference_audio=@reference.wav" \
  -F "text=This uses a cloned voice." \
  -F "model=chatterbox" \
  -o cloned.mp3

Peningkatan Audio

cURL

# Audio Enhancement
curl -X POST https://api.tts.ai/v1/audio/enhance/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@noisy_audio.mp3" \
  -F "denoise=true" \
  -F "enhance_clarity=true" \
  -o enhanced.mp3

Kode Galat

Semua kesalahan mengembalikan respon JSON dengan error lapangan.

Format Respon Galat

{
  "error": {
    "code": "insufficient_credits",
    "message": "You do not have enough characters for this request.",
    "characters_required": 4000,
    "characters_available": 2000
  }
}

Status HTTP	Kode Galat	Deskripsi
400	`bad_request`	Parameter permintaan tak valid. Periksa pesan galat untuk rincian.
401	`unauthorized`	Hilang atau kunci API tak valid.
402	`insufficient_credits`	Tak cukup karakter.
403	`forbidden`	Anda tidak memiliki hak akses ke sumber daya ini (mis. polling pekerjaan pengguna lain). Akses API termasuk pada setiap rencana.
404	`not_found`	Model atau suara tidak ditemukan.
413	`file_too_large`	Berkas yang diunggah melebihi batas ukuran.
429	`rate_limited`	Terlalu banyak permintaan. Periksa batas tingkat header.
500	`internal_error`	Galat server. Coba lagi nanti.
503	`model_loading`	Model sedang dimuat. coba lagi dalam beberapa detik.

Webhook

Untuk tugas yang berjalan panjang (stem split, batch TTS), Anda dapat menyediakan webhook_url parameter. Ketika tugas selesai, kami akan POST hasil ke URL Anda.

Webhook Payload

{
  "event": "task.completed",
  "task_id": "task_abc123",
  "status": "success",
  "result_url": "https://api.tts.ai/v1/results/task_abc123",
  "credits_used": 12,
  "created_at": "2025-01-15T10:30:00Z",
  "completed_at": "2025-01-15T10:30:45Z"
}

Hasil Webhook tersedia untuk diunduh selama 24 jam setelah pelengkapan. Pastikan untuk segera mengunduhnya.

Siap Membangun?

Ambil kunci API Anda dan mulai mengintegrasikan TTS.ai ke dalam aplikasi Anda.

Daftar Bebas Tilik Rencana