Text a l' API de veu pels desenvolupadors
Construïu aplicacions d' ús de veu amb la nostra API REST. Afegiu un format de text natural a veu, clonant veu, text de veu, i processament d' àudio a les vostres aplicacions, robots de xat, assistents de veu i productes SaS. OpenAI- compatible amb el format, 24+ models, integració senzilla.
Intenta-ho ara
Característiques de l' API pels desenvolupadors
Tot el que necessiteu per construir aplicacions habilitats de veu
API simple REST
Una petició POST per generar el discurs. JSON, la resposta de l' àudio. Funciona amb qualsevol idioma de programació que permeti HTTP.
OpenAI-Compatible
Substitució de llançament per a l' API OpenAI TTS. Canvieu la vostra clau base_url i API funciona immediatament.
Models disponibles 24+
Accés a cada model a través d' una única API. Canvieu models canviant un paràmetre. Compara qualitat, velocitat i cost.
Sub- Latència
Kokoro genera àudio en menys d' un segon. Perfecte per a xatbots de temps real, ajudants de veu i aplicacions interactius.
API de la còpia de veu
Clona qualsevol veu d' una breu mostra d' àudio mitjançant l' API. Useu veus clonades per a totes les generacions subsegüents.
Formats múltiples
Sortida com a WAV, MP3, OGG, o FLAC. Escolliu la freqüència de mostreig i una mica de profunditat. Implementació d' àudio de flux per a aplicacions en temps real.
Els millors models per a la integració dels desenvolupadors
Escolliu el model correcte per a la vostra aplicació
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Millor per a: Model més ràpid que subsegon de retard, ideal per a aplicacions en temps real i robots de xat
Intenta- ho Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Millor per a: TTS de corrent amb clonació de veu per a aplicacions d' assistent de veu
Intenta- ho CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Millor per a: L'AI conversacional amb temps natural per a xatbot i assistent veu
Intenta- ho Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Millor per a: Model lliure, només de CPU per a aplicacions en volum elevat amb cost zero de crèdit
Intenta- ho Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Millor per a: Generació d' àudio amb efectes de so per a aplicacions creatives i d' entretenimentName
Intenta- ho BarkCom gestionar l' API TTS
Des de la signatura a la primera crida API en menys de 5 minuts
Obtén la vostra clau de l' API
Signa' t per a la llibertat i genera una clau API del tauler de comptes. S' inclouen 50 crèdits.
Fes la vostra primera trucada
POST a / v1/ tts amb text, model i veu. Obtenir bytes d' àudio cap enrere. Sota 5 línies de codi.
Escolliu el model
Proveu diferents models per al vostre cas d' ús. Compara la velocitat, la qualitat i el cost per generació.
Nau a producció
Escala amb crèdits de pagament. No hi ha límits de taxa en els plans pagats. Feu un seguiment d' ús al tauler.
Exemples de codi d' inici ràpid
Integra TTS.ai en qualsevol idioma amb la nostra API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Quins desenvolupadors es construeix amb TTS.ai
Dissenys d'integració comuns i aplicacions
& Assistents de xat de la IA
Afegeix sortida de veu al vostre assistent de xat o IA. Conducte LLLM respostes a través de les interfícies d' execució de veu. Kokoro proporciona retard de conversa en temps real. Seasme CSM genera un discurs de conversa amb el temps natural.
- Resposta LLLM a la canonada de veu
- El segon retard amb Kokoro
- Pronunciació conversacional amb Seseame CSM
- S' està corrent la sortida d' àudio
Apps de & veu mòbil
Construïu aplicacions mòbils, eines d' accessibilitat, llegir aplicacions i plataformes d' aprenentatge del llenguatge. La nostra REST API funciona amb qualsevol marc mòbil. Descarrega fitxers d' àudio o flux directament al client.
- React nadiu, Futter, Swift, Kotlin
- Accessibilitat i lectura d' aplicacions
- Eines d' aprenentatge del llenguatge
- Generació del contingut de l' àudio
Productes SaaS
Capacitats de veu blanca en el vostre producte SaaS. Afegiu TTS, TTS, cloneu la veu i el processament d' àudio com a característiques de la plataforma. Useu la nostra API com a dorsal de veu sense gestionar les infraestructures de la GPU.
- Característiques de la veu de l' etiqueta blanca
- No cal infraestructura de la GPU
- fixació de preus d' ús de pagament
- 24+ models per oferir als vostres usuaris
Canonies d' automatització
Integra la generació de veu en canonades de CI/CD, automació de continguts i fluxs de processament de treball per lots. Genera milers de fitxers d' àudio des de dades del full de càlcul, la producció de podcast per a automatitzar, o crear canonades de contingut locals.
- Processat per lots mitjançant l' API
- Suseccions de localització del contingut
- Integració amb CI/CD
- Full de càlcul a l' autocompleció d' àudio
Especificacions de l' API
Es construeix per a aplicacions de produccióName
24+
Models TTS
100+
Voices
30+
Idiomes
<1s
Latència (Kokoro)
Preguntes més freqüents
Preguntes comunes quant a l' API del TTS.ai desenvolupador
Preparat per a construir amb la IA de veu?
Obtingueu la vostra clau API lliure i comenceu a construir. 50 crèdits a signar, models disponibles, documentació global.