Tekstas kalbai API programuotojams
Sukurkite balso programas su mūsų REST API. Pridėti natūralų tekstą-į-speech, balso klonavimą, kalbėjimo-teksto ir garso apdorojimą į programas, pokalbių robotus, balso asistentus ir SaaS produktus. OpenAI suderinamas formatas, 20+ modeliai, paprasta integracija.
Pabandykite dabar
API ypatybės programuotojams
Viskas, ką jums reikia sukurti balso suaktyvintas programas
Paprasta REST API
Vienas post prašymas generuoti kalbą. JSON prašymas, garso atsakymas. Veikia su bet kuria programavimo kalba, kuri palaiko HTTP.
Su atviru dangčiu suderinama
Įleidžiamasis OpenAI TTS API pakeitimas. Perjunkite savo bazę_url ir API raktą – esamas kodas veikia iš karto.
Yra 24+ modelių
Priėjimas prie kiekvieno modelio per vieną API. Perjungti modelius keičiant vieną parametrą. Palyginti kokybę, greitį ir kainą.
Poantrinė užklausa
Kokoro generuoja garso per 1 sekundę. Puikiai tinka realiojo laiko pokalbių robotai, balso asistentai, ir interaktyvių programų.
Balso klonavimas API
Klonuoti bet kokį balsą iš trumpo garso mėginio per API. Naudokite klonuotus balsus visoms kitoms kartoms.
Keli formatai
Išvestis kaip WAV, MP3, OGG, arba FLAC. Pasirinkite imties greitis ir bitų gylis. Srautinis garso palaikymas realiu laiku apps.
Geriausi modeliai programuotojo integracijos
Pasirinkite tinkamą modelį programos greičiui, kokybei ir sąnaudų reikalavimams
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Geriausias už: Greičiausias modelis — antras latentinis, idealus realiojo laiko programėlėms ir pokalbių robotams
Bandyti Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Geriausias už: TTS srautinis su balso klonavimu balso pagalbinėms programoms
Bandyti CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Geriausias už: Pokalbis AI su natūraliu laiku Chatbot ir padėjėjas balso
Bandyti Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Geriausias už: Nemokamas tik procesoriaus modelis didelės apimties prietaikoms, kurių kredito kaina nulinė
Bandyti Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Geriausias už: Garso generavimas su garso efektais kūrybos ir pramogų programoms
Bandyti BarkKaip integruoti TTS API
Nuo prisijungimo iki pirmojo API skambučio po 5 minučių
Gauti API raktą
Užsiregistruoti nemokamai ir generuoti API raktą iš savo paskyros prietaisų skydelio. 15.000 simbolių įtraukti.
Pirmą kartą skambink
Point /v1/tts su tekstu, modeliu ir balsu. Gaukite garso baitus atgal. Po 5 eilučių kodą.
Pasirinkite modelį
Bandykite skirtingus modelius savo naudojimo atveju. Palyginkite greitį, kokybę ir sąnaudas vienai kartai.
Laivas į gamybą
Mastelis su pay- as- you- go simboliais. Nėra tarifų apribojimų mokamiems planams. Stebėti naudojimą prietaisų skydelyje.
Greito pradžios kodo pavyzdžiai
Integruoti TTS.ai bet kuria kalba su mūsų REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Ką kūrėjai sukūrė su TTS.ai
Bendri integracijos modeliai ir taikomosios programos
AI pokalbių robotai ir pagalbininkai
Pridėti balso išvestį į savo pokalbių bot ar AI asistentas. Pipe LLM atsakymai per TTS balso suaktyvinamų sąsajų. Kokoro pristato sub-sekundę latentiškumą realiu laiku pokalbių. Sesame CSM generuoja pokalbių kalbą su natūraliu laiku.
- LLM atsakas į kalbos vamzdį
- Antroji užlaikymas su Kokoro
- Pokalbis su Sezamo CSM
- Srautinis garso išvestis
Mobilios ir balso programėlės
REST API veikia su bet kokia mobiliąja sistema. Parsisiųskite garso failus ar srautą tiesiai klientui.
- Reakcija Native, Flutter, Swift, Kotlin
- Prieinamumo ir skaitymo programos
- Kalbų mokymosi platformos
- Garso turinio generavimas
SaaS produktai
Įdėkite TTS, STT, balso klonavimo ir garso apdorojimo funkcijas kaip savo platformos funkcijas. Naudokite mūsų API kaip savo balso programinę sąsają nevaldydami GPU infrastruktūros.
- Balto ženklo balso funkcijos
- GPU infrastruktūros nereikia
- Mokėjimo už naudojimą kainodara
- 20+ modeliai pasiūlyti vartotojams
Automatizavimo vamzdynai.
Įtraukti balso generavimą į CI/CD vamzdynus, turinio automatizavimo ir partijos apdorojimo darbų srautus. Generuokite tūkstančius garso failų iš skaičiuoklės duomenų, automatizuoti podcast gamybos, arba sukurti turinio lokalizavimo vamzdynai.
- Partijos apdorojimas per API
- Turinio lokalizavimo vamzdynai
- CI/CD integravimas
- Skaitlentė garso automatizavimui
API specifikacijos
Skirti naudoti gamyboje
20+
TTS modeliai
100+
Balsai
30+
Kalbos
<1s
Latencija (Kokoro)
Dažnai užduodami klausimai
Dažni klausimai apie TTS.ai kūrėjas API
Ką mes galėtume pagerinti? Jūsų atsiliepimai padeda mums išspręsti problemas.
Pasiruošę kurti su Balso AI?
Gaukite nemokamą API raktą ir pradėkite statyti. 15 kreditų užsiregistravus, laisvi modeliai prieinami, išsami dokumentacija.