Szöveg a fejlesztőknek szóló API beszédéhez
Build voice-enabled applications with our REST API. Add natural text-to-speech, voice cloning, speak-to-text, and audio processing to your apps, chatbots, voice assistants, and SaaS products. OpenAI-kompatibilis formátum, 20+ modellek, egyszerű integráció.
Próbáld ki most.
API jellemzők a fejlesztők számára
Minden, amire szükséged van, hogy hangalapú alkalmazásokat építs.
Simple REST API
Egy POST kérés a beszéd generálására. JSON kérés, audio válasz. Működik bármilyen programozási nyelven, amely támogatja a HTTP-t.
OpenAI-kompatibilis
Az OpenAI TTS API-hoz való drop-in csere. Azonnal működik a base_url és az API kulcs.
24+ Modellek elérhető
Hozzáférés minden modell egyetlen API. Switch modellek megváltoztatásával egy paraméter. Összehasonlít minőség, sebesség, és a költség.
Másodlagos olvashatóság
Kokoro 1 másodperc alatt ad hangot. Tökéletes valós idejű chatbotokhoz, hang asszisztensekhez és interaktív alkalmazásokhoz.
Hang klónozó API
Klón bármilyen hang egy rövid audio minta keresztül az API. Használjon klónozott hangok minden későbbi generációk.
Több formátum
Kimenet WAV, MP3, OGG, vagy FLAC. Válassza ki a minta sebességét és bit mélység. Streaming audio támogatás valós idejű alkalmazások.
A fejlesztői integráció legjobb modelljei
Válassza ki a megfelelő modellt az alkalmazás sebességére, minőségére és költségigényeire
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Legjobb: Leggyorsabb modell a másodperc alatti késéshez, ideális valós idejű alkalmazásokhoz és chatbotokhoz
Próbáld meg. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Legjobb: Streaming TTS hang klónozása hang asszisztens alkalmazások
Próbáld meg. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Legjobb: Beszélgetési MI természetes időzítés chatbot és asszisztens hang
Próbáld meg. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Legjobb: Ingyenes, csak CPU-modell nagy volumenű, nulla hitelköltséggel rendelkező alkalmazásokhoz
Próbáld meg. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Legjobb: Audio generáció hanghatással a kreatív és szórakoztató alkalmazásokra
Próbáld meg. BarkHogyan integráljuk a TTS API-t?
A regisztrációtól az első API hívásig 5 perc alatt
Szerezd meg az API kulcsodat
Regisztráljon ingyen, és hozzon létre egy API kulcsot a fiókja műszerfaláról. 15 000 karaktert tartalmaz.
Hívd fel elsőnek!
Post to /v1/tts with text, model, and voice. Get audio bájtok vissza. 5 sor alatt kód.
Válassza ki a modellt
Teszt különböző modellek használata esetén. Hasonlítsa össze a sebességet, a minőséget és a költségeket generációnként.
Hajó a gyártásba
Skála a fizetős-a-you-go karakterek. Nincs díjkorlát fizetett tervek. Monitor használat a műszerfalon.
Gyors indítási kód példák
A TTS.ai nyelv integrálása bármely nyelven a REST API-val
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Mit építenek a fejlesztők TTS.ai-rel?
Közös integrációs minták és alkalmazások
AI Chatbots & Assistants
Add hang kimenetet a chatbot vagy MI asszisztens. Cső LLM válaszok TTS hang-kompatibilis interfészek. Kokoro biztosítja a másodperc alatti késés valós idejű beszélgetések. Szezám CSM generál beszélgetési beszéd természetes időzítéssel.
- LLM válasz a beszédvezetékre
- Másodperces késés Kokoro-val
- Beszélgetés a Szezám CSM-mel
- Az audió kimenetének streamingje
Mobil hangalkalmazások
Build voice-kompatibilis mobil alkalmazások, akadálymentesítő eszközök, olvasási alkalmazások, és nyelvtanulási platformok. REST API működik bármilyen mobil keret. Töltse le audio fájlokat vagy stream közvetlenül az ügyfélnek.
- React Native, Reflektor, Swift, Kotlin
- Hozzáférhetőségi és olvasási alkalmazások
- Nyelvtanulási platformok
- Audio tartalom létrehozása
SaaS termékek
White-label hangképesség a SaaS termék. Add TTS, STT, hang klónozás, és audio feldolgozás funkciókként a platform. Használja API, mint a hang backend kezelése nélkül GPU infrastruktúra.
- White-label hangjellemzők
- Nincs szükség GPU infrastruktúrára
- Fizetési díj/használati díj
- 20+ modellek a felhasználók számára
Automatizálási csővezetékek
A hangtermelés integrálása a CI/CD vezetékekbe, tartalomautomatizálás és gyártási munkafolyamatokba. Több ezer hangfájl generálása táblázatos adatokból, podcast-gyártás automatizálása vagy tartalomlokalizációs csővezetékek építése.
- A tétel feldolgozása API-n keresztül
- Tartalomlokalizációs csővezetékek
- CI/CD integráció
- Spreadsheet audio automatizáláshoz
API specifikációk
Termelési alkalmazásokhoz épített
20+
TTS-modellek
100+
Hangok
30+
Nyelvek
<1s
Latency (Kokoro)
Gyakran ismételt kérdések
Gyakori kérdések a TTS.ai fejlesztő API-jával kapcsolatban
Mit lehetne javítani? A visszajelzés segít megoldani a problémákat.
Készen állsz, hogy felépítsd a hang MI-t?
Szerezd meg az ingyenes API kulcsot és kezdj el építeni. 15.000 karakter a regisztráción, ingyenes modellek állnak rendelkezésre, átfogó dokumentáció.