API de texto a voz para desarrolladores
Cree aplicaciones con capacidad de voz con nuestra API REST. Añada texto a voz natural, clonación de voz, voz a texto y procesamiento de audio a sus aplicaciones, chatbots, asistentes de voz y productos SaaS. Formato compatible con OpenAI, más de 20 modelos, integración sencilla.
Inténtalo ahora.
Características de API para desarrolladores
Todo lo que necesita para crear aplicaciones habilitadas para voz
API REST simple
Una solicitud POST para generar voz. Solicitud JSON, respuesta de audio. Funciona con cualquier lenguaje de programación que admite HTTP.
OpenAI-Compatible
Reemplazo desplegable para OpenAI TTS API. Cambie su clave base_url y API — el código existente funciona inmediatamente.
Disponibles más de 24 modelos
Acceda a cada modelo a través de una sola API. Cambie los modelos cambiando un parámetro. Compare calidad, velocidad y costo.
Subsegunda latencia
Kokoro genera audio en menos de 1 segundo. Perfecto para chatbots en tiempo real, asistentes de voz y aplicaciones interactivas.
API de clonación de voz
Clonar cualquier voz de una breve muestra de audio a través de la API. Utilice voces clonadas para todas las generaciones siguientes.
Formatos múltiples
Salida como WAV, MP3, OGG o FLAC. Elija la tasa de muestreo y la profundidad de bits.
Mejores modelos para la integración de desarrolladores
Elija el modelo adecuado para los requisitos de velocidad, calidad y costo de su aplicación
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Lo mejor para: Modelo más rápido — sub-segundo de latencia, ideal para aplicaciones en tiempo real y chatbots
Intente Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Lo mejor para: Transmitiendo TTS con clonación de voz para aplicaciones de asistente de voz
Intente CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Lo mejor para: Conversacional IA con tiempo natural para chatbot y asistente de voz
Intente Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Lo mejor para: Modelo gratuito y exclusivo para CPU para aplicaciones de alto volumen a un costo cero
Intente Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Lo mejor para: Generación de audio con efectos de sonido para aplicaciones creativas y de entretenimiento
Intente BarkCómo integrar la API de TTS
Desde el registro hasta la primera llamada de API en menos de 5 minutos
Obtener su clave de API
Regístrese gratis y genere una clave API desde el panel de control de su cuenta. 15.000 caracteres incluidos.
Haga su primera llamada
Mensaje a /v1/tts con texto, modelo y voz. Obtener bytes de audio atrás. Bajo 5 líneas de código.
Elija su modelo
Pruebe diferentes modelos para su caso de uso. Compare velocidad, calidad y costo por generación.
Buque a la producción
Escala con caracteres pay-a-you-go. No hay límites de tarifas en los planes de pago. Monitoree el uso en su tablero.
Ejemplos de código de inicio rápido
Integre TTS.ai en cualquier idioma con nuestra API REST
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Lo que los desarrolladores construyen con TTS.ai
Patrones y aplicaciones de integración comunes
Chatbots y Asistentes de AI
Agregue la salida de voz a su chatbot o asistente de IA. Pipe las respuestas LLM a través de TTS para interfaces habilitadas para voz. Kokoro ofrece sub-segundo de latencia para conversaciones en tiempo real.
- Respuesta de LLM al conducto del habla
- Subsegundo latencia con Kokoro
- Discurso conversacional con Sésamo CSM
- Transmitiendo salida de audio
Aplicaciones móviles y de voz
Cree aplicaciones móviles con voz, herramientas de accesibilidad, aplicaciones de lectura y plataformas de aprendizaje de idiomas. Nuestra API REST funciona con cualquier framework móvil. Descargue archivos de audio o transmita directamente al cliente.
- React Native, Flutter, Swift, Kotlin
- Aplicaciones de accesibilidad y lectura
- Plataformas de aprendizaje de idiomas
- Generación de contenido de audio
Productos SaaS
Capacidades de voz en marca blanca en su producto SaaS. Añada TTS, STT, clonación de voz y procesamiento de audio como características en su plataforma. Utilice nuestra API como su motor de voz sin administrar la infraestructura GPU.
- Características de voz de marca blanca
- No se necesita infraestructura de la GPU
- Fijación de precios de pago por uso
- Más de 20 modelos para ofrecer a sus usuarios
Pipelines de automatización
Integrar la generación de voz en tuberías CI/CD, automatización de contenido y flujos de trabajo de procesamiento por lotes. Generar miles de archivos de audio a partir de datos de hoja de cálculo, automatizar la producción de podcasts o construir tuberías de localización de contenido.
- Procesamiento por lotes a través de API
- Conductos de localización de contenido
- Integración CI/CD
- Hoja de cálculo para la automatización de audio
Especificaciones API
Construido para aplicaciones de producción
20+
Modelos TTS
100+
Voces
30+
Idiomas
<1s
Latencia (Kokoro)
Preguntas frecuentes
Preguntas comunes sobre la API TTS.ai desarrollador
¿Qué podríamos mejorar? Sus comentarios nos ayudan a solucionar problemas.
¿Listo para construir con Voice AI?
Obtenga su clave de API gratuita y comenzar a construir. 15.000 caracteres en el registro, modelos gratuitos disponibles, documentación completa.