Text till tal API för utvecklare
Bygg röstaktiverade program med vårt REST API. Lägg till naturlig text-till-tal, röstkloning, tal-till-text och ljudbehandling till dina appar, chattrobotar, röstassistenter och SaaS-produkter. OpenAI-kompatibelt format, 20+ modeller, enkel integration.
Försök nu
API-funktioner för utvecklare
Allt du behöver för att bygga röstaktiverade applikationer
Enkelt REST- API
En POST begäran om att generera tal. JSON begäran, ljudsvar. Fungerar med alla programmeringsspråk som stöder HTTP.
OpenAI-kompatibel
Drop-in ersättning för OpenAI TTS API. Växla din base_url och API-nyckel – befintlig kod fungerar omedelbart.
24+ tillgängliga modeller
Få tillgång till varje modell genom ett enda API. Byta modeller genom att ändra en parameter. Jämför kvalitet, hastighet och kostnad.
Underandra latensen
Kokoro genererar ljud på under 1 sekund. Perfekt för chattrobotar i realtid, röstassistenter och interaktiva applikationer.
RösthanteringsgränssnittName
Clone någon röst från en kort ljudprov via API. Använd klonade röster för alla efterföljande generationer.
Flera format
Utgång som WAV, MP3, OGG, eller FLAC. Välj samplingshastighet och bitdjup. Strömma ljudstöd för realtidsappar.
Bästa modeller för utvecklarintegration
Välj rätt modell för din applikations hastighet, kvalitet och kostnadskrav
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Bäst för: Snabbaste modell – en andra latency, idealisk för appar och chattrobotar i realtid
Försök Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Bäst för: Strömma TTS med röstkloning för röstassistentprogram
Försök CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Bäst för: Konversationell AI med naturlig timing för chatbot och assisterande röst
Försök Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Bäst för: Gratis, CPU-endast modell för applikationer med hög volym med noll kreditkostnad
Försök Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Bäst för: Ljudgenerering med ljudeffekter för kreativa och underhållningsappar
Försök BarkHur man integrerar TTS API
Från registrering till första API-samtal på under 5 minuter
Hämta din API-nyckel
Registrera dig gratis och skapa en API-nyckel från din konto instrumentpanel. 15 000 tecken ingår.
Gör ditt första besök
POST till /v1/tts med text, modell och röst. Få ljudbyte tillbaka. Under 5 rader kod.
Välj din modell
Testa olika modeller för ditt användningsfall. Jämför hastighet, kvalitet och kostnad per generation.
Fartyg till produktion
Skala med pay-as-you-go tecken. Inga hastighetsbegränsningar för betalda planer. Övervaka användning i din instrumentpanel.
Exempel på snabbstartskod
Integrera TTS.ai på alla språk med vårt REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Vad utvecklare bygger med TTS.ai
Gemensamma integrationsmönster och tillämpningar
AI Chatbots och assistenter
Lägg till röstutmatning till din chatbot eller AI-assistent. Rör LLM-svar via TTS för röstaktiverade gränssnitt. Kokoro levererar latens under andra tiden för realtidssamtal. Sesam CSM genererar konversationstal med naturlig timing.
- LLM svar på tal pipeline
- Underandra latensen med Kokoro
- Konversationstal med Sesam CSM
- Strömmande ljudutmatning
Mobila och röstappar
Bygga röstaktiverade mobilappar, tillgänglighetsverktyg, läsa appar och språkutbildningsplattformar. Vårt REST API fungerar med alla mobila ramar. Ladda ner ljudfiler eller strömma direkt till klienten.
- Reagera infödda, fladdra, Swift, Kotlin
- Tillgänglighets- och läsappar
- Plattformar för språkinlärning
- Generering av ljudinnehåll
SaaS-produkter
White-label röstfunktioner i din SaaS-produkt. Lägg till TTS, STT, röstkloning och ljudbehandling som funktioner i din plattform. Använd vårt API som ditt röstbackend utan att hantera GPU-infrastruktur.
- Vitmärkta röstfunktioner
- Ingen GPU-infrastruktur behövs
- Prissättning per användning
- 20+ modeller för att erbjuda dina användare
Automationsrörledningar
Integrera röstgenerering till CI/CD-pipelines, innehållsautomation och arbetsflöden för batchbearbetning. Generera tusentals ljudfiler från kalkylbladsdata, automatisera produktion av podcast eller bygga innehållslokaliseringspipelines.
- Partihantering via API
- Rörledningar för innehållslokalisering
- Integrering av KI/CD
- Kalkylblad till ljudautomation
API-specifikationer
Byggt för produktionstillämpningar
20+
TTS-modeller
100+
Röster
30+
Språk
<1s
Latency (Kokoro)
Vanliga frågor
Vanliga frågor om TTS.ai-utvecklarens API
Vad kan vi förbättra? Din feedback hjälper oss att lösa problem.
Redo att bygga med röst AI?
Få din kostnadsfria API-nyckel och börja bygga. 15 hp på registrering, gratis modeller tillgängliga, omfattande dokumentation.