Texti í tal API fyrir forritara
Bættu náttúrulegum texta-til-tal, raddklónun, tal-til-texta og hljóðvinnslu við forritin þín, spjallrásir, raddaðstoðarmenn og SaaS vörur. OpenAI-samhæft snið, 20+ módel, einföld samþætting.
Prófaðu núna
API Lögun fyrir forritara
Allt sem þú þarft til að byggja upp raddvirk forrit
Einföld REST API
Ein POST beiðni til að búa til tal. JSON beiðni, hljóð svar. Virkar með hvaða forritunarmál sem styður HTTP.
OpenAI- samhæft
Skipta um OpenAI TTS API. Skipta base_url og API lykill - núverandi kóða virkar strax.
24+ gerðir í boði
Fáðu aðgang að öllum líkanum í gegnum eitt API. Skiptu um módel með því að breyta einni breytu. Berðu saman gæði, hraða og kostnað.
Undir- sekúnda leynd
Kokoro býr til hljóð á undir 1 sekúndu.Perfect fyrir rauntíma chatbots, radd aðstoðarmenn og gagnvirk forrit.
Voice Cloning API
Klóna hvaða rödd sem er úr stuttu hljóðsýni í gegnum API. Notaðu klónaðar raddir fyrir allar síðari kynslóðir.
Mörg snið
Output sem WAV, MP3, OGG, eða FLAC. Veldu sýnishorn hlutfall og bita dýpt. Streaming hljóð stuðning fyrir rauntíma apps.
Bestu módel fyrir Developer Integration
Veldu rétta gerð fyrir hraða, gæði og kostnaðarkröfur forritsins
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Best fyrir: Hraðasta líkanið - undir sekúndu leynd, tilvalið fyrir rauntímaforrit og spjallforrit
Reyndu Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Best fyrir: Straumspilun TTS með raddklónun fyrir raddaðstoðarforrit
Reyndu CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Best fyrir: Samtals AI með náttúrulegum tímasetningu fyrir chatbot og aðstoðarmaður rödd
Reyndu Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Best fyrir: Free, CPU-aðeins líkan fyrir mikið magn forrit með núll lánsfé kostnaður
Reyndu Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Best fyrir: Hljóð kynslóð með hljóð áhrif fyrir skapandi og skemmtun forrit
Reyndu BarkHvernig á að samþætta TTS API
Frá skráningu til fyrsta API símtals á innan við 5 mínútum
Fáðu API lykilinn þinn
Skráðu þig ókeypis og búðu til API lykil frá reikningsborðinu þínu. 15.000 stafir innifaldir.
Fyrsta símtalið þitt
POST til /v1/tts með texta, líkan, og rödd. Fá hljóð bæti aftur. Undir 5 línur af kóða.
Veldu líkanið þitt
Prófaðu mismunandi gerðir fyrir notkunartilfellið þitt. Berðu saman hraða, gæði og kostnað á kynslóð.
Skip til framleiðslu
Scale með borga-eins og-þú-far stafi. Engin takmörk á greiddum áætlunum. Fylgjast með notkun í mælaborðinu þínu.
Quick Start Code Dæmi
Samþætta TTS.ai á hvaða tungumáli sem er með REST API okkar
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Hvað verktaki byggja með TTS.ai
Algengar samþættingarmynstur og forrit
AI Chatbots og aðstoðarmenn
Bættu raddbúnaði við spjallþráðinn þinn eða AI aðstoðarmann. Pípa LLM svör í gegnum TTS fyrir raddvirkar tengi. Kokoro skilar undir sekúndu leynd fyrir rauntíma samtöl. Sesame CSM býr til samtalsræðu með náttúrulegum tímasetningu.
- LLM svar við ræðu leiðslum
- Sub-sekúndna leynd með Kokoro
- Samtals ræða með Sesame CSM
- Straumspilun hljóðúttaks
Mobile & Voice forrit
Búðu til raddvirk farsímaforrit, aðgengisverkfæri, lesforrit og tungumálanám. REST API okkar virkar með hvaða farsímaramma sem er.Sækja hljóðskrár eða streyma beint til viðskiptavinarins.
- React Native, Flutter, Swift og Kotlin
- Aðgengi og lestur apps
- Tungumálanám vettvangur
- Hljóðefnis kynslóð
SaaS vörur
White-label rödd getu í SaaS vörunni þinni. Bæta TTS, STT, rödd klónun, og hljóð vinnslu sem eiginleika í vettvang þinn.Nota API okkar sem rödd bakenda án þess að stjórna GPU innviði.
- White-label rödd lögun
- Engin GPU innviði þarf
- Verðlagning á notkun
- 20+ módel til að bjóða notendum þínum
Automation PipelinesComment
Samþættu talsköpun í CI/CD-leiðslur, sjálfvirkni í efni og vinnsluferli fyrir hópa.Búa til þúsundir hljóðskráa úr töflureiknagögn, gera sjálfvirka podcast-framleiðslu eða byggja upp leiðslur fyrir staðfærslu efnisins.
- Hópur vinnsla í gegnum API
- Content localization pipelines
- CI / CD samþætting
- Töflureikni til hljóð sjálfvirkni
API forskriftir
Byggð fyrir framleiðsluforrit
20+
TTS módel
100+
Raddir
30+
Tungumál
<1s
Leynd (Kokoro)
Algengar spurningar (FAQ)
Algengar spurningar um TTS.ai Developer API
Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.
Tilbúinn til að byggja með Voice AI?
Fáðu ókeypis API lykilinn þinn og byrjaðu að byggja.15 einingar við skráningu, ókeypis módel í boði, alhliða skjöl.