Mba'éichapa ojehupyty peteĩ clave API?

Oñeme'ẽ peteĩ cuenta TTS.ai-pe, upéi ojupive panel de control de tu cuenta ha ohesa'ỹijo "Generar clave API". Tuichave clave-pe oñemoĩta prefijo sk-tts- ha ikatu ojeporu pya'e. Umi cuenta libre-pe oñeme'ẽ 15.000 carácter oñepyrũ hag̃ua.

API-pa ojoaju formato OpenAI rehe?

Aye, API ñanepegua oipuru formato de solicitud ha respuesta OpenAI-pe g̃uarã. Oguerekoramo código oĩva ko'agãite oipuruhápe API TTS OpenAI mba'éva, ikatu oñemoambue TTS.ai-pe omoambuévo URL base ha clave API código oñemoambue'ỹre.

Mba'e programación lenguaje-pa ojeykeko?

API REST omba'apo oimeraẽ lenguaje-pe ikatuhápe ojapo HTTP ñeporandu. Oikuave'ẽ código techapyrã Python, JavaScript (Node.js ha navegador), cURL ha ambue. Oĩpa lenguaje oguerekóva peteĩ biblioteca cliente HTTP (Go, Ruby, Java, C#, PHP, ha ambue) ikatu oiporu API.

Mba'épa hína API tasa límite?

Umi cuenta libre oguereko límite 3 ñeikotevẽ peteĩ araope. Umi plan ojejapyhyva oguereko límite tuichavéva, ojehecha rire mba'épa oguerekóva suscripción: Starter (60/araope), Professional (300/araope), Enterprise (iñambue'ỹva). Umi tasa límite rehegua cabecera oĩ peteĩteĩ respuesta API ryepýpe.

Mba'éichapa omba'apo API repy ñeme'ẽ?

API jeporu oiporu caracteres oñemopyendáva modelo nivel ha texto pukukue rehe. Umi modelo gratuito oiporu 0 caracter, umi modelo estándar oiporu 2x caracter ha umi modelo premium oiporu 4x caracter. Umi caracter oĩ opaichagua plan-pe ojejapyhyhápe ha ikatu ojejapyhy avei peteĩteĩ umi paquete de caracter-pe.

Mba'e punto final-pa oĩ?

API ome'ẽ punto final ñe'ẽnguéra rehe ñembohasa (POST/v1/tts/), ñe'ẽnguéra rehe ñembohasa (POST/v1/transcribe/), ñe'ẽnguéra clonación (POST/v1/voice-clone/), ñe'ẽnguéra ñembohasa ñembohasa (POST/v1/voice-convert/), ñe'ẽnguéra ñembohasa ñembohasa (POST/v1/speech-translate/), ñe'ẽnguéra ñembohetave (POST/v1/audio-enhance/), ñe'ẽnguéra ñembogue, ñe'ẽnguéra ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'o, ñe'ẽnguéra ñemboja'o rehegua ñemboja'

Mba'eichagua audio formato-pa ome'ẽ API?

API-pe ojehu jey hína audio formato WAV-pe por defecto. Ikatu omoĩ formato de salida (mp3, wav, ogg, flac) oipurukuévo parámetro response_format. MP3 oñemohendaporãve umi aplicación web-pe g̃uarã, WAV oñeg̃uenohẽ hag̃ua audio.

Oĩpa peteĩ API transmisión rehegua TTS tiempo real-pe g̃uarã?

Jepéramo, API asincrónica ome'ẽ jey peteĩ UUID tembiapo rehegua ikatuhápe ojehecha umi resultado. Umi modelo oykekóva, taha'e Kokoro, ñehendurã generación pya'etereive hína umi aplicación-pe g̃uarã aimete tiempo real-pe. Upe punto final ñehendurã ome'ẽ jey ñehendurã URL oñemohu'ã rire proceso.

Mba'éichapa ikatu mandu'a umi error API-pe?

API ome'ẽ código estándar estado HTTP rehegua (400 umi petición incorrecta-pe g̃uarã, 401 error de autenticación-pe g̃uarã, 429 tasa límite-pe g̃uarã, 500 servidor error-pe g̃uarã) umi error mensaje JSON ndive. Ko'ágãite peve, oñehesa'ỹijo umi código de estado ha error campo umi respuesta-pe, error jejapo porã hag̃ua.

Ikatu hína ojeporu API aplicación comercial-pe g̃uarã?

Aye, API oñemohenda ojeporu hag̃ua ñemuhápe. Umi sonido oñemoheñóiva API rupive ikatu ojeporu umi mba'e rejapóva, aplicación ha servicio-pe. Opaite modelo oipuru código abierto licencia, ha ndaipóri royalty adicional sonido oñemoheñóiva rehe.

Oĩpa peteĩ entorno de prueba térã sandbox?

Umi modelo de nivel libre (Kokoro, Piper, VITS, MeloTTS) oiko peteĩ caja de arena-ramo: oiporu cero caracter ha oĩ disponible opaite cuenta-pe. Ojehecha integración modelo libre-kuéra ndive oñemoambue mboyve modelo premium jeporurã producción-pe g̃uarã.

Mba'éichapa amoĩnge ñe'ẽ ha modelo oĩva API rupive?

Oiporu GET /v1/voices ojehechauka hag̃ua opaite ñe'ẽ oĩva ñehesa'ỹijo rupive (modelo, ñe'ẽ, género). Oiporu GET /v1/modelos ojehechauka hag̃ua opaite modelo TTS oĩva umi capacidad ha información nivel oguerekóva ndive. Mokõive punto final ome'ẽ jey ñembohovái JSON.

Oñe'ẽ peteĩ error rehegua reporte/ mba'eporã ñeikotevẽ

API Documentación

Oike TTS.ai-pe nde aplicación-pe API REST rupive. Formato OpenAI-pe ojokupytykuaáva ikatu hag̃uaicha oñemoambue pya'eve.

API REST OpenAI-pe he'iháicha Respuestas JSON Apopyrã jeikehápe

Resumen

API TTS.ai ome'ẽ acceso programación rupive opaite umi característica plataforma rehegua: síntesis texto-gui ñe'ẽ, ñe'ẽ transcripción-gui ñe'ẽ, ñe'ẽ clonación, ñehendurã ñembohetave ha ambue.

Clave API

Oñeme'ẽ llave API-pe Configuración de cuenta. Ojejuhu opaichagua plan-pe, oikehápe avei umi cuenta libre.

URL base

https://api.tts.ai/v1/

Autorización

Token portador rupive Authorization cabecera

Autenticación

Nivel libre - ndoikotevẽi clave. POST anónimo-kuéra /v1/tts/ omba'apo'ỹre peteĩ autorización-gui, 5.000 caractere peve peteĩ árape peteĩ IP-pe g̃uarã, oipurukuévo oimeraẽ ñane modelo libre (piper, vits, melotts, kokoro). Oñemoinge peteĩ cuenta-pe ojehepyme'ẽ hag̃ua 15.000 carácter adicional ha ojeike hag̃ua modelo premium-pe.

Umi modelo premium ha límite de tasa ijyvatevévape g̃uarã, ojehechakuaa peteĩ token portador-pe. Authorization cabecera.

HTTP cabecera

Authorization: Bearer sk-tts-your-api-key-here

Ojeporúvo clave API secreto. Ndaha'éi omboja'o código cliente-pegua, repositorio público térã registro-pe. Oñemoambue umi clave katui nde cuenta configuración-pe.

SDK

Umi SDK oficial ombohape ikatu hag̃uaicha TTS.ai oñemoĩnge porã app-pe. Mokõive hína código abierto ha ikatu ojejuhu GitHub-pe.

Python

pip install ttsai

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")
audio = client.generate(
    text="Hello world!",
    model="kokoro"
)
client.save(audio, "output.wav")

GitHub

JavaScript / Node.js

npm install @ttsainpm/ttsai

const { TTSClient } = require('@ttsainpm/ttsai');

const client = new TTSClient({
  apiKey: 'sk-tts-...'
});
const audio = await client.generate({
  input: 'Hello world!',
  model: 'kokoro'
});
await client.saveToFile(audio, 'output.wav');

GitHub

URL base

URL base: https://api.tts.ai/v1/

Opaite punto final ha'e hína upe URL base reheguápe. Techapyrã, punto final TTS ha'e:

POST https://api.tts.ai/v1/tts/

Tasa límite

API tasa límite iñambue peteĩteĩ umi plan rupive:

Plano	Solicitud/min	Concurrente	Ñe'ẽnguéra papapy tuichavéva
Libre	10	2	500 caractere
Arranque	30	3	1.000.000 caractere
Pro	60	5	1.000.000 caractere
Negocio+	300	20	50.000 caractere

Umi cabecera límite de tasa oĩ peteĩteĩ respuesta ryepýpe: X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset.

Caracter jeporu

Servicio	Presupuesto	Unidad
TTS (modelo-kuéra libre: Piper, VITS, MeloTTS)	1000 caractere	1000 caractere rupi
TTS (modelo estándar: Kokoro, CosyVoice 2, ha ambue)	2000 caractere	1000 caractere rupi
TTS (modelo premium: Tortoise, Chatterbox, ha ambue)	4000 caractere	1000 caractere rupi
Ñe'ẽ ñeikumby	2000 caractere	por minuto de sonido
Clonación ñe'ẽnguéra rehe	4000 caractere	1000 caractere rupi
Ñe'ẽ ñemoambue	3000 caractere	por minuto de sonido
Ñemboaje audio-pe	2000 caractere	por minuto de sonido
Vocal ñembogue/Voz ñemboja'o	3,000-4,000 caractere	por minuto de sonido
Ñemoambue	5000 caractere	por minuto de sonido
Ñembohasa	3000 caractere	peteĩ turno-pe
Buscador de claves y BPM	Libre	--
Conversor de audio	Libre	--

Ñe'ẽnguéra.:

POST /v1/tts/

Oñemoambue jehaipy ñe'ẽnguérape. Ombovy'a peteĩ ñe'ẽnguéra archivo formato ojeipotávape.

Solicitud retepy

Parámetro	Type	Oñeikotevẽ	Descripción
model	string	No	ID modelo-pegua (techapyrã, `ñemohenda`, `mbohapyha`, `pimiento`Oñemomombyry jave, ojeiporavokuaa peteĩ modelo oykekohápe pe ojejerureva'ekue. `lenguaje` — `ñemohenda` en/ja/zh/ko/fr/de/it/pt/es/hi/ru, `pimiento` Ambue ñe'ẽnguérape g̃uarã (ar/pl/nl/cs/da/fi/el/hu/tr/uk/vi/eta.).
text	string	Ha'e	Ñe'ẽ oñemoambuéva ñe'ẽ'aporã. Solicitud rehegua límite: 500 carácter (anónimo), 5,000 (cuenta libre), 1,000,000 (plan pago). Umi entrada puku oñemohenda jey server-pe.
voice	string	Ha'e	ID ñe'ẽ (jeporu `/v1/voces/` (omoĩnge hag̃ua ñe'ẽnguéra oĩvaíva apytépe)
format	string	No	Formato de salida: `mp3` (por defecto), `wav`, `flac`, `ogg`
speed	float	No	Oñe'ẽ pya'eve rehegua multiplicador. Por defecto: `1.0`Rango: `0.5` mokõi `2.0`
language	string	No	Ñe'ẽ rehegua código (techapyrã, `ha`, `es`). Ojejuhu jey jey ojeipe'áramo.
instructions	string	No	Actuación/entrega rehegua señal (≤500 carácter). techapyrã. `\`
pronunciations	object \| array	No	Oñemoambue ñe'ẽnguéra peteĩteĩ. `^`
stream	boolean	No	Oñembohapévo respuesta de transmisión. Por defecto: `falso`

Ñemboaje techapyrã

cURL

curl -X POST https://api.tts.ai/v1/tts/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kokoro",
    "text": "Hello from TTS.ai! This is a test.",
    "voice": "af_bella",
    "format": "mp3"
  }' \
  --output output.mp3

SSML etiquetas

Ojehai papapykuéra, ára, moneda, papapy teléfono ha siglas


                    
                        
                            Interpretar Entrada Oñe'ẽháicha
                        
                        
                            cardinal 1234 one thousand two hundred thirty-four
                            ordinal 21 twenty-first
                            date 1999-12-31 31 jasypoteĩ ary 1999
                            time 14:30 two thirty PM
                            telephone +1-555-867-5309 plus one five five five eight six seven…
                            currency $1,234.56 one thousand two hundred thirty-four dollars and fifty-six cents
                            spell-out NASA N A S A

Interpretar	Entrada	Oñe'ẽháicha
`cardinal`	`1234`	one thousand two hundred thirty-four
`ordinal`	`21`	twenty-first
`date`	`1999-12-31`	31 jasypoteĩ ary 1999
`time`	`14:30`	two thirty PM
`telephone`	`+1-555-867-5309`	plus one five five five eight six seven…
`currency`	`$1,234.56`	one thousand two hundred thirty-four dollars and fifty-six cents
`spell-out`	`NASA`	N A S A


                Formato de fecha por defecto ha'e md Ñe'ẽnguéra Sãmbyhyhára dmy ambue hendápe; ojeipy'apy hese formato=\

                
                    
                        Techapyrã
                        
                    
{
  "model": "kokoro",
  "voice": "af_bella",
  "text": "Your appointment is on <say-as interpret-as=\"date\">2026-04-26</say-as> at <say-as interpret-as=\"time\">14:30</say-as>. Please call <say-as interpret-as=\"telephone\">+1-555-867-5309</say-as> if you need to reschedule."
}
                

                Respuesta
                The TTS endpoint queues your request and returns a JSON response with a job UUID. You then poll for the result.

                Step 1: Submit request
                
                    
                        Response (JSON)
                    
{
  "uuid": "77b71db532874ce98e84a69a2d740d4c",
  "job_id": "f21316bb-aefa-480d-8523-701d1e3184ce",
  "status": "queued",
  "credits_used": 11,
  "credits_remaining": 15000
}
                

                Step 2: Poll for result
                
                    GET /v1/speech/results/?uuid=<job_uuid>
                
                Poll this endpoint every 1-2 seconds until status is completed or failed.
                
                    
                        Polling response (completed)
                    
{
  "status": "completed",
  "result_url": "https://api.tts.ai/static/downloads/77b71db5.../output.mp3"
}
                
                
                    
                        Polling response (still processing)
                    
{
  "status": "processing"
}
                

                Step 3: Download audio
                Fetch the result_url from the completed response to download the audio file.

                Techapyrã tuichakue
                
                    
                        Python
                        
                    
import requests, time

API_KEY = "sk-tts-your-key"
BASE = "https://api.tts.ai"

# 1. Submit TTS request
resp = requests.post(f"{BASE}/v1/tts/", json={
    "model": "kokoro",
    "text": "Hello from TTS.ai!",
    "voice": "af_bella"
}, headers={"Authorization": f"Bearer {API_KEY}"})
data = resp.json()
uuid = data["uuid"]

# 2. Poll for result
while True:
    result = requests.get(f"{BASE}/v1/speech/results/",
        params={"uuid": uuid}).json()
    if result["status"] == "completed":
        # 3. Download audio
        audio = requests.get(result["result_url"])
        with open("output.mp3", "wb") as f:
            f.write(audio.content)
        break
    elif result["status"] == "failed":
        raise Exception(result.get("error", "Generation failed"))
    time.sleep(1.5)
                

                Streaming alternative: For supported models (Kokoro, MeloTTS), use POST /v1/tts/stream/ for real-time Server-Sent Events (SSE) streaming — no polling needed.



            
            
                Ñe'ẽ ñeikumby
                
                    POST /v1/stt/
                
                Oñemoambue ñe'ẽnguéra. Oipytyvõ 99 ñe'ẽnguérape ha ojejuhu jey jey hesekuéra.

                Solicitud retepy (multipart/form-data)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                file
                                file
                                Ha'e
                                Umi archivo de sonido (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). 100MB peve.
                            
                            
                                model
                                string
                                No
                                Modelo STT: susurro (por defecto), susurro-pypukuvéva, sensevoice
                            
                            
                                language
                                string
                                No
                                Lenguaje reko. auto Detección automática-pe g̃uarã (por defecto).
                            
                            
                                timestamps
                                boolean
                                No
                                Oike avei umi marca de tiempo ñe'ẽ-pegua. Por defecto: falso
                            
                            
                                diarize
                                boolean
                                No
                                Oñemu diagnóstico ñehendurã. Por defecto: falso
                            
                        
                    
                

                Respuesta
                
                    
                        Respuesta JSON
                    
{
  "text": "Hello, this is a transcription test.",
  "language": "en",
  "duration": 3.5,
  "segments": [
    {
      "start": 0.0,
      "end": 1.8,
      "text": "Hello, this is",
      "speaker": "SPEAKER_00"
    },
    {
      "start": 1.8,
      "end": 3.5,
      "text": "a transcription test.",
      "speaker": "SPEAKER_00"
    }
  ]
}
                
            

            
            
                Clonación ñe'ẽnguéra rehe
                
                    POST /v1/tts/clone/
                
                Oñemohenda ñe'ẽ peteĩ ñe'ẽ clonada-pe. Oñemohenda peteĩ ñe'ẽnguéra referencia ha peteĩ jehaipy.

                Solicitud retepy (multipart/form-data)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                reference_audio
                                file
                                Ha'e
                                Ñe'ẽ rehegua audio referencia (10-30 segundo recomendado). Máx. 20MB.
                            
                            
                                text
                                string
                                Ha'e
                                Ñe'ẽnguéra ojeiporúva ñe'ẽ clonada-pe.
                            
                            
                                model
                                string
                                No
                                Modelo clon: mbohapyha (por defecto), voz agradable 2, gpt-sovits
                            
                            
                                format
                                string
                                No
                                Formato de salida: mp3 (por defecto), wav, flac
                            
                            
                                language
                                string
                                No
                                Ñe'ẽ rehegua código ojehupytyséva. Oñeme'ẽ va'erã modelo ojeporavóvape.
                            
                        
                    
                

                Respuesta
                Ojevy jey audio archivo dato binario-ramo, punto final TTS-peguaicha.
            

            
            
                Ñe'ẽ ñemoambue
                
                    POST /v1/voice-convert/
                
                Oñemoambue audio peteĩ ñe'ẽ ambueháicha. Omoĩnge audio fuente ha oiporavo ñe'ẽ ojehupytyséva.

                Solicitud retepy (multipart/form-data)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                file
                                file
                                Ha'e
                                Audio archivo fuente (MP3, WAV, FLAC). 50MB peve.
                            
                            
                                target_voice
                                string
                                Ha'e
                                ID ñe'ẽnguéra ojehupytyséva oñemoambue hag̃ua (jeporu /v1/voces/ (omoĩnge hag̃ua ñe'ẽnguéra oĩvaíva apytépe)
                            
                            
                                model
                                string
                                No
                                Modelo ñehendurã ñemoambue: openvoice (por defecto), knn-vc
                            
                            
                                format
                                string
                                No
                                Formato de salida: wav (por defecto), mp3, flac
                            
                        
                    
                

                Ñemboaje techapyrã
                
                    
                        cURL
                        
                    
curl -X POST https://api.tts.ai/v1/voice-convert/ \
  -H "Authorization: Bearer sk-tts-your-key" \
  -F "file=@source_audio.mp3" \
  -F "target_voice=af_bella" \
  -F "model=openvoice" \
  -o converted.wav
                

                Respuesta
                Ojevy jey umi archivo de sonido oñemoambuéva dato binario-ramo.
            

            
            
                Ñemoambue
                
                    POST /v1/speech-translate/
                
                Oñemoambue ñe'ẽnguéra ojeiporúva peteĩ ñe'ẽme ambue ñe'ẽme. Oñemohenda ñe'ẽnguéra peteĩ ñe'ẽme ambue ñe'ẽme, ñe'ẽnguéra peteĩ ñe'ẽme ha ñe'ẽnguéra ambue ñe'ẽme peteĩ ñe'ẽme.

                Solicitud retepy (multipart/form-data)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                file
                                file
                                Ha'e
                                Ñemoarandu rehegua archivo ñe'ẽ ypype. 100MB peve.
                            
                            
                                target_language
                                string
                                Ha'e
                                Código lenguaje ojeguerekóva (techapyrã, es, fr, oguerekóva, Ha'e)
                            
                            
                                voice
                                string
                                No
                                Ñe'ẽ ñeikumby rehegua. Ojeiporavo'ỹre.
                            
                            
                                preserve_voice
                                boolean
                                No
                                Oñeha'ã oñeñangareko umi ñe'ẽnguéra ypy rehe. Por defecto: falso
                            
                        
                    
                

                Respuesta
                
                    Respuesta JSON
{
  "original_text": "Hello, how are you?",
  "translated_text": "Hola, como estas?",
  "source_language": "en",
  "target_language": "es",
  "audio_url": "https://api.tts.ai/v1/results/translate_abc123.mp3",
  "credits_used": 5
}
                
            

            
            
                Ñe'ẽ ñe'ẽ'ỹme
                
                    POST /v1/speech-to-speech/
                
                Oñemoambue ñe'ẽnguéra estilo, emoción térã ñeikumby, hakatu oñeñongatu umi contenido. Oikoporãva oñemohenda hag̃ua tono, ritmo ha expresividad.

                Solicitud retepy (multipart/form-data)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                file
                                file
                                Ha'e
                                Audio rehegua archivo ñe'ẽnguéra rehegua. Máximo 50MB.
                            
                            
                                voice
                                string
                                Ha'e
                                ID ñe'ẽnguéra oguerekóva ñe'ẽnguéra salida-pegua
                            
                            
                                model
                                string
                                No
                                Modelo: openvoice (por defecto), mbohapyha
                            
                            
                                emotion
                                string
                                No
                                Emoción ojejuhutava: neutral, feliz, Sábado, iñarandúva, animado
                            
                            
                                speed
                                float
                                No
                                Ajuste de velocidad. Por defecto: 1.0Rango: 0.5 mokõi 2.0
                            
                        
                    
                

                Respuesta
                Ojevy jey umi archivo de sonido oñemoambuéva dato binario-ramo.
            

            
            
                Audio-pegua herramienta-kuéra
                Umi punto final ñehesa'ỹijo ñehendurã ñembohetave, ñehendurã ñeguenohẽ, ñehendurã ñemboja'o ha ambue.

                
                
                    
                        
                            POST /v1/audio/enhance/
                        
                        Oñemoporãve ñe'ẽnguéra calidad: oñemboguejyve ruido, oñemoporãve ñeikumby ha oñemohenda porãve.
                        
                            
                                
                                    file file Umi archivo de sonido oñemomorãvéva
                                    denoise boolean Oñemu'ã desruido (por defecto: verdadero)
                                    enhance_clarity boolean Oñembohetave ñe'ẽnguéra ñemohenda (por defecto: verdadero)
                                    super_resolution boolean Oñembohetave ñehendurã calidad (por defecto: falso)
                                    strength integer 1-3 (py'ỹinte, medio, imbarete). Por defecto: 2
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/separate/
                        
                        Ojeipapa umi vocal umi instrumental-gui (vocal ñembogue) térã oñemboja'o umi tallo-pe.
                        
                            
                                
                                    file file Umi archivo de sonido ojeipe'atava
                                    model string demucs (por defecto) térã spleeter
                                    stems integer Ta'ãnga mbohapyha: 2, 4, 5 térã 6 (por defecto: 2)
                                    format string Formato de salida: wav, mp3, flac
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/dereverb/
                        
                        Oñemomombyry eco ha reverberación umi ñehendurã ñeguenohẽgui.
                        
                            
                                
                                    file file Umi archivo de sonido oñemohendatava
                                    type string echo or reverb (default: both)
                                    intensity integer 1-5 (default: 3)
                                
                            
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/analyze/
                            Libre
                        
                        Ohesa'ỹijo ñe'ẽnguéra ojuhu hag̃uã clave, BPM ha tiempo rehegua signatura.
                        
                            
                                
                                    file file Umi archivo de sonido oñehesa'ỹijotava
                                
                            
                        
                        
                            Respuesta
{
  "key": "C",
  "scale": "Major",
  "bpm": 120.0,
  "time_signature": "4/4",
  "camelot": "8B",
  "compatible_keys": ["C Major", "G Major", "F Major", "A Minor"]
}
                        
                    
                

                
                
                    
                        
                            POST /v1/audio/convert/
                            Libre
                        
                        Oñemoambue audio formato apytépe.
                        
                            
                                
                                    file file Umi archivo de sonido oñemoambuéva
                                    format string Formato ojejuhutava: mp3, wav, flac, ogg, m4a, aac
                                    bitrate integer Tasa de bits de salida en kbps: 64, 128, 192, 256, 320
                                    sample_rate integer Tasa de muestreo: 22050, 44100, 48000
                                    channels string mono térã stereo
                                
                            
                        
                    
                
            

            
            
                Ñembohasa
                
                    POST /v1/voice-chat/
                
                Oñemoĩ ñe'ẽnguéra térã ñe'ẽnguéra ha ojehupyty peteĩ IA ñembohovái ñe'ẽnguéra rehe.

                Solicitud retepy (multipart/form-data térã JSON)
                
                    
                        
                            Parámetro Type Oñeikotevẽ Descripción
                        
                        
                            
                                audio
                                file
                                No*
                                Audio-pegua jeike (térã audio térã texto Oñeikotevẽ)
                            
                            
                                text
                                string
                                No*
                                Ñe'ẽnguéra rehegua jeike (térã audio térã texto Oñeikotevẽ)
                            
                            
                                voice
                                string
                                No
                                Ñe'ẽ IA ñembohováipe. Por defecto: _Oipe'a
                            
                            
                                tts_model
                                string
                                No
                                Modelo TTS ñembohováipe. Por defecto: ñemohenda
                            
                            
                                system_prompt
                                string
                                No
                                Sistema rehegua prompt oñemohendapyréva IA-pe g̃uarã
                            
                            
                                conversation_id
                                string
                                No
                                Ojepysove peteĩ ñe'ẽjovake oĩmava
                            
                        
                    
                

                Respuesta
                
                    Respuesta JSON
{
  "conversation_id": "conv_abc123",
  "user_text": "What is the capital of France?",
  "ai_text": "The capital of France is Paris.",
  "audio_url": "https://api.tts.ai/v1/audio/tmp/resp_xyz.mp3",
  "credits_used": 3
}
                
            

            
            
                TTS por lotes
                
                    POST /v1/tts/batch/
                
                Oñemoĩ heta ñe'ẽnguéra peteĩteĩ generación TTS paralelo-pe g̃uarã. Oĩ avei opción ohupyty hag̃ua peteĩ webhook callback opaite tembiapo oñemohu'ã rire.

                Parámetro-kuéra
                
                    Parámetro Type Descripción
                    
                        texts array Array of objects: {text, model, voice}. Max 50 items.
                        webhook_url string URL ojeipotáva POST resultado-pe g̃uarã lote oñemohu'ã jave.
                    
                

                Respuesta
                
                    Respuesta JSON
{
  "batch_id": "abc123",
  "total": 3,
  "completed": 0,
  "status": "processing"
}
                
                Oñeha'ã jehaipy ñemboguata GET/v1/tts/batch/result/?batch_id=abc123 rupive
            

            
            
                Ñe'ẽnguéra ñemoinge
                
                    POST /v1/voice-embed/
                
                Oñeha'ã raẽ peteĩ ñe'ẽ ñemoĩngekuaáva audio referencia-gui. Oiporu embed_id ojejuhu va'ekue ñe'ẽ clonación ñeikotevẽ uperireguápe oñemoheñói hag̃ua pya'eterei.

                Parámetro-kuéra
                
                    Parámetro Type Descripción
                    
                        file file Reference audio file (WAV, MP3, FLAC).
                        model string Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.
                    
                

                Respuesta
                
                    Respuesta JSON
{
  "embed_id": "emb_abc123",
  "model": "chatterbox",
  "duration_ms": 450
}
                
            

            
            
                Ko'ã mba'e jehechajey jey
                
                    GET /v1/health/
                
                Ojehecha servidor GPU estado, modelo cargado ha cola tuichakue. Ndaipóri autenticación oñeikotevẽva. Ojehecha caché-pe 30 segundo-pe.

                Respuesta
                
                    Respuesta JSON
{
  "status": "online",
  "latency_ms": 45,
  "queue_size": 3,
  "models_loaded": ["kokoro", "chatterbox", "cosyvoice2"]
}
                
            

            
            
                Lista modelo-kuéra
                
                    GET /v1/models/
                
                Ojevy peteĩ lista opaite modelo oĩvagui ha umi capacidad oguerekóva.

                Respuesta
                
                    Respuesta JSON
{
  "models": [
    {
      "id": "kokoro",
      "name": "Kokoro",
      "type": "tts",
      "tier": "standard",
      "languages": ["en", "ja", "ko", "zh", "fr"],
      "supports_cloning": false,
      "supports_streaming": true,
      "credits_per_1k_chars": 2
    },
    {
      "id": "chatterbox",
      "name": "Chatterbox",
      "type": "tts",
      "tier": "premium",
      "languages": ["en"],
      "supports_cloning": true,
      "supports_streaming": true,
      "credits_per_1k_chars": 4
    }
  ]
}
                
            

            
            
                Ñe'ẽnguéra ñemohenda
                
                    GET /v1/voices/
                
                Ojevy peteĩ ñe'ẽnguéra oguerekóva lista, ikatuha oñembosa'y modelo térã ñe'ẽ rupive.

                Parámetro-kuéra consulta-pegua
                
                    
                        
                            Parámetro Type Descripción
                        
                        
                            
                                model
                                string
                                Filtro ID modelo rupive (techapyrã, ñemohenda)
                            
                            
                                language
                                string
                                Filtro código de lenguaje rupive (techapyrã, ha)
                            
                            
                                gender
                                string
                                Filtro género rupive: macho, kuña, neutral
                            
                        
                    
                

                Respuesta
                
                    Respuesta JSON
{
  "voices": [
    {
      "id": "af_bella",
      "name": "Bella",
      "model": "kokoro",
      "language": "en",
      "gender": "female",
      "preview_url": "https://api.tts.ai/v1/voices/preview/af_bella.mp3"
    }
  ],
  "total": 142
}
                
            

            
            
                Subtítulos (SRT / VTT) new
                
                    GET /v1/speech/subtitles/?uuid=<job_uuid>&format=srt|vtt&download=1
                
                Oñemoheñói subtítulo sincronizado oimeraẽ tembiapo TTS oñemohu'ã rire. Ojejapo alineación Whisper sonido ári ha ome'ẽ SRT térã WebVTT. Resultado oñemohenda caché-pe disco-pe peteĩ llamada mokõiha upe uuid-pe g̃uarã ha'e hag̃ua peteĩ lectura disco-pe.
                Parámetro-kuéra consulta-pegua
                
                    
                        Parámetro Oñeikotevẽ Descripción
                        
                            uuid Ha'e UUID tembiapo rehegua ojejuhuva'ekue /v1/tts/ térã /v1/voice-clone/ rupive.
                            format No srt (por defecto) térã vttOjehecha
                            download No 1 Oñeme'ẽ Contenido-disposición: archivo adjunto Upévare, navegador omoĩve peteĩ ñeñongatu ojehechauka rãngue.
                            language No Peteĩ ñe'ẽjoaju modelo de alineación-pe g̃uarã (ojuhukuaa ojeipe'áramo).
                        
                    
                
                
                    cURL
curl "https://api.tts.ai/v1/speech/subtitles/?uuid=$UUID&format=srt&download=1" -o subtitles.srt
                
            

            
            
                Diccionario de pronunciación new
                
                    GET
                    POST
                    DELETE
                    /api/v1/pronunciations/
                
                Oñe'ẽ motor TTS-pe mba'éichapa oje'e umi ñe'ẽ ojeguerekóva. Umi jeike oñeñongatu va'ekue ojeporukuaa peteĩteĩ TTS ñeporandu ojejapóva. 200 jeike límite peteĩteĩ cuenta-pe.
                Solicitud retepy (POST)
                
                    
                        Parámetro Type Descripción
                        
                            word string Ñe'ẽ ojeiporu va'erã oñemoambue hag̃ua (techapyrã, GIF, Antropología). Ñe'ẽ-rembe'y ojoaju.
                            replacement string Mba'éichapa ojehai modelo-pe g̃uarã (techapyrã, jiff, ann THROP ick).
                            language string Código ISO ojeipotáva. Oĩ vaíramo = ojeporu opaichagua ñe'ẽpe g̃uarã.
                            case_sensitive boolean Oñeha'ãva falso. Ojojogua mayúscula ha minúscula añeteteguaOjehecha
                        
                    
                
                
                    cURL
# Save an entry
curl -X POST https://tts.ai/api/v1/pronunciations/ \
  -H "Authorization: Bearer sk-tts-..." \
  -H "Content-Type: application/json" \
  -d '{"word": "GIF", "replacement": "jiff"}'

# List your entries
curl https://tts.ai/api/v1/pronunciations/ -H "Authorization: Bearer sk-tts-..."

# Delete entry by id
curl -X DELETE "https://tts.ai/api/v1/pronunciations/?id=42" -H "Authorization: Bearer sk-tts-..."
                
                Ikatu avei oheja overrides peteĩteĩ ñeikotevẽ rupive ndojegotevéigui — oike pronunciations Oime jave peteĩ /v1/tts/ llamada peteĩ objeto térã peteĩ matriz-ramo (ehecha parámetro punto final TTS).
            

            
            
                Ñe'ẽryru ñehendu'ỹva new
                Ombovy'a peteĩ solo

Parámetro	Type	Oñeikotevẽ	Descripción
file	file	Ha'e	Umi archivo de sonido (MP3, WAV, FLAC, OGG, M4A, MP4, WebM). 100MB peve.
model	string	No	Modelo STT: `susurro` (por defecto), `susurro-pypukuvéva`, `sensevoice`
language	string	No	Lenguaje reko. `auto` Detección automática-pe g̃uarã (por defecto).
timestamps	boolean	No	Oike avei umi marca de tiempo ñe'ẽ-pegua. Por defecto: `falso`
diarize	boolean	No	Oñemu diagnóstico ñehendurã. Por defecto: `falso`

Parámetro	Type	Oñeikotevẽ	Descripción
reference_audio	file	Ha'e	Ñe'ẽ rehegua audio referencia (10-30 segundo recomendado). Máx. 20MB.
text	string	Ha'e	Ñe'ẽnguéra ojeiporúva ñe'ẽ clonada-pe.
model	string	No	Modelo clon: `mbohapyha` (por defecto), `voz agradable 2`, `gpt-sovits`
format	string	No	Formato de salida: `mp3` (por defecto), `wav`, `flac`
language	string	No	Ñe'ẽ rehegua código ojehupytyséva. Oñeme'ẽ va'erã modelo ojeporavóvape.

file file	Umi archivo de sonido oñemomorãvéva
denoise boolean	Oñemu'ã desruido (por defecto: verdadero)
enhance_clarity boolean	Oñembohetave ñe'ẽnguéra ñemohenda (por defecto: verdadero)
super_resolution boolean	Oñembohetave ñehendurã calidad (por defecto: falso)
strength integer	1-3 (py'ỹinte, medio, imbarete). Por defecto: 2

file file	Umi archivo de sonido ojeipe'atava
model string	`demucs` (por defecto) térã `spleeter`
stems integer	Ta'ãnga mbohapyha: 2, 4, 5 térã 6 (por defecto: 2)
format string	Formato de salida: `wav`, `mp3`, `flac`

file file	Umi archivo de sonido oñemohendatava
type string	`echo` or `reverb` (default: both)
intensity integer	1-5 (default: 3)

file file	Umi archivo de sonido oñemoambuéva
format string	Formato ojejuhutava: `mp3`, `wav`, `flac`, `ogg`, `m4a`, `aac`
bitrate integer	Tasa de bits de salida en kbps: 64, 128, 192, 256, 320
sample_rate integer	Tasa de muestreo: 22050, 44100, 48000
channels string	`mono` térã `stereo`

Parámetro	Type	Oñeikotevẽ	Descripción
audio	file	No*	Audio-pegua jeike (térã `audio` térã `texto` Oñeikotevẽ)
text	string	No*	Ñe'ẽnguéra rehegua jeike (térã `audio` térã `texto` Oñeikotevẽ)
voice	string	No	Ñe'ẽ IA ñembohováipe. Por defecto: `_Oipe'a`
tts_model	string	No	Modelo TTS ñembohováipe. Por defecto: `ñemohenda`
system_prompt	string	No	Sistema rehegua prompt oñemohendapyréva IA-pe g̃uarã
conversation_id	string	No	Ojepysove peteĩ ñe'ẽjovake oĩmava

Parámetro	Type	Descripción
texts	array	Array of objects: `{text, model, voice}`. Max 50 items.
webhook_url	string	URL ojeipotáva POST resultado-pe g̃uarã lote oñemohu'ã jave.

Parámetro	Type	Descripción
file	file	Reference audio file (WAV, MP3, FLAC).
model	string	Cloning model (default: chatterbox). Supported: chatterbox, cosyvoice2, openvoice, gpt-sovits, spark, indextts2, qwen3-tts.

Parámetro	Type	Descripción
model	string	Filtro ID modelo rupive (techapyrã, `ñemohenda`)
language	string	Filtro código de lenguaje rupive (techapyrã, `ha`)
gender	string	Filtro género rupive: `macho`, `kuña`, `neutral`

Parámetro	Oñeikotevẽ	Descripción
uuid	Ha'e	UUID tembiapo rehegua ojejuhuva'ekue /v1/tts/ térã /v1/voice-clone/ rupive.
format	No	`srt` (por defecto) térã `vtt`Ojehecha
download	No	`1` Oñeme'ẽ `Contenido-disposición: archivo adjunto` Upévare, navegador omoĩve peteĩ ñeñongatu ojehechauka rãngue.
language	No	Peteĩ ñe'ẽjoaju modelo de alineación-pe g̃uarã (ojuhukuaa ojeipe'áramo).

Parámetro	Type	Descripción
word	string	Ñe'ẽ ojeiporu va'erã oñemoambue hag̃ua (techapyrã, `GIF`, `Antropología`). Ñe'ẽ-rembe'y ojoaju.
replacement	string	Mba'éichapa ojehai modelo-pe g̃uarã (techapyrã, `jiff`, `ann THROP ick`).
language	string	Código ISO ojeipotáva. Oĩ vaíramo = ojeporu opaichagua ñe'ẽpe g̃uarã.
case_sensitive	boolean	Oñeha'ãva `falso`. Ojojogua mayúscula ha minúscula `añetetegua`Ojehecha