Besedilo v govor API za razvijalce
Zgradite aplikacije, ki omogočajo glas z našim REST API. Dodajte naravno besedilo-to-speech, glasovno kloniranje, govor-to-text, in zvočno obdelavo v vaše aplikacije, chatbote, glasovne asistente, in SaaS izdelki. OpenAI-kompatibilen format, 20+ modelov, preprosta integracija.
Poskusi zdaj
Značilnosti API za razvijalce
Vse, kar potrebujete za gradnjo aplikacij, ki omogočajo glas
Enostavno REST API
Eden zahtevek POST za ustvarjanje govora. Zahtevek JSON, zvočni odziv. Deluje z vsakim programskim jezikom, ki podpira HTTP.
Compatible OpenAI
Drop-in zamenjava za OpenAI TTS API. Preklopite base_url in API ključ – obstoječa koda deluje takoj.
24+ Razpoložljivi modeli
Dostop do vsakega modela skozi en sam API. Preklopite modele s spremembo enega parametra. Primerjajte kakovost, hitrost in stroške.
Poddruga latencija
Kokoro ustvarja zvok v manj kot 1 sekundi. Popoln za realno-time chatbots, glasovne pomočnike in interaktivne aplikacije.
API za kloniranje glasu
Kloniraj glas iz kratkega zvočnega vzorca preko API. Uporabi klonirane glasove za vse naslednje generacije.
Več formatov
Izhod kot WAV, MP3, OGG ali FLAC. Izberite hitrost vzorca in globino bita. Streaming audio podpora za aplikacije v realnem času.
Najboljši modeli za vključevanje razvijalca
Izberite pravi model za zahteve glede hitrosti, kakovosti in stroškov vaše aplikacije
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Najboljše za: Najhitrejši model – subsekundna latency, idealen za aplikacije v realnem času in klepetanje
Poskusi. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Najboljše za: Streaming TTS z kloniranjem glasu za prijave glasovnega pomočnika
Poskusi. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Najboljše za: Pogovorni AI z naravnim časovnim razporedom za chatbot in pomočnik glasu
Poskusi. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Najboljše za: Brezplačen model za aplikacije z visokim obsegom brez kreditnih stroškov
Poskusi. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Najboljše za: Generacija zvoka z zvočnimi učinki za ustvarjalne in zabavne aplikacije
Poskusi. BarkKako vključiti API TTS
Od prijave do prvega klica API v manj kot 5 minutah
Vzemi svoj ključ API
Vpišite se brezplačno in ustvarite API ključ iz vašega računa plošče. Vključenih 15.000 znakov.
Prvič se oglasi
POST do /v1/tts z besedilom, modelom in glasom. Dobite zvočne bajte nazaj. Pod 5 vrsticami kode.
Izberite svoj model
Preizkusite različne modele za vaš primer uporabe. Primerjajte hitrost, kakovost in stroške na generacijo.
Ladja za proizvodnjo
Skaliraj s play-as-yo-go znaki. Ni mejnih stopenj plačanih načrtov. Spremljaj uporabo v pultu.
Primeri hitre kode
Vključite TTS.ai v kateri koli jezik z našim REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Kaj razvijalci gradijo z TTS.ai
Skupni vzorci vključevanja in aplikacije
AI Chatbots in pomočniki
Dodajte glasovni izhod vašemu chatbotu ali asistentu AI. Cevi LLM odzivov prek TTS za vmesnike, ki so omogočeni z glasom. Kokoro zagotavlja subsekundno latenco za pogovore v realnem času. Sezam CSM ustvarja pogovorni govor z naravnim časom.
- Odziv LLM na govorni cev
- Podsekundna latencija z Kokorom
- Pogovorni govor s Sezamom CSM
- Pretok zvočnega izhoda
Mobilni & Glasovni programi
Zgradite mobilne aplikacije, orodja za dostopnost, branje aplikacij in platforme za učenje jezikov. Naš REST API deluje z vsakim mobilnim okvirom. Prenesi zvočne datoteke ali stream neposredno na stranko.
- Reaktiviraj nadomestne, treptajoče, Swift, Kotlin
- Dostopnost in branje aplikacij
- platforme za učenje jezikov
- Generacija zvočnih vsebin
Izdelki SaaS
Zmožnosti bele označbe v vašem SaaS proizvodu. Dodajte TTS, STT, kloniranje glasu in zvočno obdelavo kot funkcije v vaši platformi. Uporabite naš API kot glasovni vmesnik, ne da bi upravljali GPU infrastrukturo.
- Glasovne funkcije, označene z belim znakom
- Infrastruktura GPU ni potrebna
- Cene za plačilo za vsako uporabo
- 20+ modelov, ki bodo svojim uporabnikom ponudili
Cevi za avtomatizacijo
Vključite ustvarjanje glasov v CI/CD cevovode, avtomatizacijo vsebine in obdelavo serij. Ustvarite tisoče zvočnih datotek iz podatkov tabele, avtomatsko proizvodnjo podcast ali gradnjo lokalizacijskih cevovodov vsebine.
- Serija obdelava prek API
- Cevovodi za lokalizacijo vsebine
- Vključevanje CI/CD
- Tabela za avtomatizacijo zvoka
Specifikacije API
Zgrajena za proizvodne aplikacije
20+
Modeli TTS
100+
Glasovi
30+
Jeziki
<1s
Latency (Kokoro)
Pogosta vprašanja
Skupna vprašanja o TTS.ai razvijalca API
Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.
Pripravljeni na gradnjo z AI?
Dobite brezplačni API ključ in začnite zgradbo. 15 kreditov na prijavo, brezplačni modeli na voljo, izčrpna dokumentacija.