API de síntese de voz para desenvolvedores
Cree aplicacións de voz coa nosa API REST. Engada texto natural a voz, clonación de voz, voz a texto e procesamento de son ás súas aplicacións, chatbots, asistentes de voz e produtos SaaS. Formato compatíbel con OpenAI, máis de 24 modelos, integración sinxela.
Probalo agora
Características da API para desenvolventes
Todo o que precisa para crear aplicacións de voz
API REST sinxela
Un pedido POST para xerar voz. Pedido JSON, resposta de son. Funciona con calquera linguaxe de programación que soporte HTTP.
Compatible con OpenAI
Substitución automática da API TTS de OpenAI. Troque o seu base_ url e a chave da API; o código existente funciona inmediatamente.
Máis de 24 modelos dispoñibles
Acceda a cada modelo a través dunha única API. Troque de modelo cambiando un parámetro. Compare a calidade, velocidade e custo.
Latencia subsegundo
Kokoro xera son en menos dun segundo. Perfecto para chatbots en tempo real, asistentes de voz e aplicacións interactivas.
API de clonación de voz
Clonar calquera voz a partir dunha mostra de son curta mediante a API. Empregar voces clonadas para todas as xeracións seguintes.
Múltiplos formatos
Saída como WAV, MP3, OGG ou FLAC. Escolla a taxa de mostraxe e a profundidade de bits. Soporte de transmisión de son para programas en tempo real.
Mellores modelos para a integración dos desenvolventes
Escolla o modelo axeitado para o seu programa
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Mellor para: O modelo máis rápido — latencia de subsegundos, ideal para aplicacións en tempo real e chatbots
Probar Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Mellor para: Transmisión de TTS con clonación de voz para aplicacións de asistente de voz
Probar CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Mellor para: IA conversacional con tempos naturais para chatbot e voz de asistente
Probar Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Mellor para: Modelo libre, só CPU, para aplicacións de alto volume con custo de crédito cero
Probar Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Mellor para: Xeración de son con efectos sonoros para aplicacións creativas e de entretemento
Probar BarkComo integrar a API de TTS
Desde o rexistro á primeira chamada á API en menos de 5 minutos
Obter a chave da API
Inscríbase de balde e xere unha chave API desde o panel da súa conta. Inclúense 50 créditos.
Faga a súa primeira chamada
POST a /v1/tts con texto, modelo e voz. Obtén os bytes de son. Baixo 5 liñas de código.
Escolla o seu modelo
Probe diferentes modelos para o seu caso de uso. Compare velocidade, calidade e custo por xeración.
Enviar á produción
Escale con créditos de pago por uso. Non hai límites de tarifa nos plans de pago. Vixie o uso no seu panel.
Exemplos de código de inicio rápido
Integre TTS.ai en calquera lingua coa nosa API REST
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
O que os desenvolvedores constrúen con TTS.ai
Padróns de integración comúns e aplicacións
Asistentes e chatbots de IA
Engada saída de voz ao seu chatbot ou asistente de IA. Envíe as respostas LLM a través de TTS para interfaces activadas por voz. Kokoro ofrece unha latencia de menos dun segundo para conversas en tempo real. Sesame CSM xera fala conversacional con tempo natural.
- Resposta de LLM ao conduto de vozName
- Latencia de subsegundos con Kokoro
- Fala conversacional con Sesame CSM
- Saída de son en fluxo
Aplicativos móbiles e de vozName
Cree aplicacións móbiles con voz activada, ferramentas de accesibilidade, aplicacións de lectura e plataformas de aprendizaxe de linguas. A nosa API REST funciona con calquera estrutura móbil. Descargue ficheiros de son ou transmita directamente ao cliente.
- React Native, Flutter, Swift, Kotlin
- Aplicativos de accesibilidade e lectura
- Plataformas de aprendizaxe de linguas
- Xeración de contido de son
Produtos SaaS
Capacidades de voz de marca branca no seu produto SaaS. Engada TTS, STT, clonación de voz e procesamento de son como características na súa plataforma. Use a nosa API como a súa infraestrutura de voz sen xestionar a infraestrutura da GPU.
- Características de voz de marca branca
- Non se precisa infraestrutura de GPU
- Pago por uso
- Máis de 24 modelos para ofrecer aos seus usuarios
Condutos de automatización
Integre a xeración de voz en canalizacións CI/CD, automatización de contidos e fluxos de traballo de procesamento por lotes. Xere miles de ficheiros de son a partir de datos de follas de cálculo, automatice a produción de podcasts ou cree canalizacións de localización de contidos.
- Procesamento por lotes mediante API
- Condutos de localización de contidos
- Integración CI/CD
- Folla de cálculo para automatización de son
Especificacións da API
Construído para aplicacións de produción
24+
Modelos TTS
100+
Vozes
30+
Linguas
<1s
Latencia (Kokoro)
Preguntas frecuentes
Preguntas frecuentes sobre a API de desenvolvemento de TTS.ai
Listo para construír con IA de voz?
Obteña a súa chave API gratuíta e comece a construír. 50 créditos ao rexistrarse, modelos gratuítos dispoñíbeis, documentación completa.