Tekst-al-vorta API por programistojName
Konstruu voĉajn aplikaĵojn per nia REST API. Aldonu naturan tekst-al-parolon, voĉan klonadon, voĉon-al-tekston, kaj aŭdan prilaboradon al viaj aplikaĵoj, babilrobotoj, voĉaj asistantoj, kaj SaaS-produktoj. OpenAI-kompatibla formato, pli ol 24 modeloj, simpla integriĝo.
Provu nun
API- ebloj por programistoj
Ĉio, kion vi bezonas por konstrui voĉajn aplikaĵojnName
Simpla REST API
Unu POST-peto por generi parolon. JSON-peto, aŭda respondo. Laboras kun iu ajn programlingvo, kiu subtenas HTTP.
OpenAI- kongrua
Enŝovita anstataŭaĵo por OpenAI TTS API. Ŝanĝu vian base_url kaj API ŝlosilon - ekzistanta kodo funkcias tuj.
24+ disponeblaj modeloj
Aliri ĉiun modelon tra ununura API. Ŝanĝi modelojn per ŝanĝo de unu parametro. Komparu kvaliton, rapidecon kaj koston.
Subsekunda prokrasto
Kokoro generas sonon en malpli ol 1 sekundo. Perfekta por realtempaj babilrobotoj, voĉaj asistantoj, kaj interagaj aplikaĵoj.
API por voĉklonado
Kloni iun ajn voĉon el mallonga sona specimeno per la API. Uzi klonitajn voĉojn por ĉiuj postaj generacioj.
Pluraj formatoj
Eligo kiel WAV, MP3, OGG, aŭ FLAC. Elektu specimenadon kaj bitprofundecon. Subteno por fluanta sono por realtempaj aplikaĵoj.
Plej bonaj modeloj por integriĝo de programistoj
Elektu la ĝustan modelon por via aplikaĵo
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Plej bona por: Plej rapida modelo — sub-sekunda latenteco, ideala por realtempaj aplikaĵoj kaj babilrobotoj
Provu Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Plej bona por: Fluigo de TTS kun voĉ-klonado por voĉ-asistentaj aplikaĵoj
Provu CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Plej bona por: Konversacia AI kun natura tempomezuro por babilroboto kaj asistanta voĉo
Provu Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Plej bona por: Libera, nur CPU-modelo por altvolumaj aplikaĵoj kun nulaj kreditkostoj
Provu Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Plej bona por: Songenerado kun sonaj efektoj por kreivaj kaj distraj aplikaĵoj
Provu BarkKiel integri la TTS API
De aliĝo al la unua API-voko en malpli ol 5 minutoj
Elŝuti vian API- ŝlosilon
Registriĝu senpage kaj kreu API-ŝlosilon el via konto-kontrolpanelo. 50 kreditoj inkluditaj.
@ info: status
POST al /v1/tts kun teksto, modelo, kaj voĉo. Ricevu sonajn bajtojn. Sub 5 linioj de kodo.
Elektu vian modelon
Testu diversajn modelojn por via uzokazo. Komparu rapidecon, kvaliton kaj koston por ĉiu generacio.
Sendi al Produktado
Skali per pagendaj kreditoj. Neniu tarifa limigo sur pagitaj planoj. Kontrolu uzadon en via stirtabulo.
Rapidstartaj kodoekzemploj
Integri TTS.ai en iu ajn lingvo kun nia REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Kion programistoj konstruas per TTS.ai
Komunaj integraj ŝablonoj kaj aplikaĵoj
AI- babilejoj kaj helpantojName
Aldonu voĉan eligon al via babilroboto aŭ AI-helpanto. Fluigu LLM-respondojn tra TTS por voĉaj interfacoj. Kokoro liveras sub-sekundan latencon por realtempaj konversacioj. Sesame CSM generas konversacian paroladon kun natura tempo.
- LLM-respondo al parolkondukilo
- Subsekunda prokrasto kun Kokoro
- Konversacia parolado kun Sesame CSM
- Fluanta aŭda eligo
Poŝtelefonaj kaj voĉaj aplikaĵojName
Konstruu voĉajn poŝtelefonajn aplikaĵojn, alireblecajn ilojn, legaparatojn kaj platformojn por lingvolernado. Nia REST API funkcias kun iu ajn poŝtelefona kadro. Elŝutu sonajn dosierojn aŭ fluigu rekte al la kliento.
- React Native, Flutter, Swift, Kotlin
- Alireblecaj kaj legadaj aplikaĵoj
- Lingvolernaj platformoj
- Generado de aŭda enhavo
SaaS- produktoj
Blank-etikedaj voĉaj kapabloj en via SaaS-produkto. Aldonu TTS, STT, voĉan klonadon, kaj aŭdan prilaboradon kiel funkciojn en via platformo. Uzu nian API kiel voĉan internon sen administri GPU-infrastrukturon.
- Blank-etikedaj voĉaj ecoj
- Ne necesas GPU-infrastrukturo
- Pago laŭ uzado
- 24+ modeloj por proponi al viaj uzantoj
Aŭtomataj kanaloj
Integri voĉan generadon en CI/CD-kanalojn, enhavo-aŭtomatigon, kaj batprocesajn laborfluojn. Generi milojn da sondosieroj el kalkultabelaj datumoj, aŭtomatigi podkastan produktadon, aŭ konstrui enhavo-lokigajn kanalojn.
- Bataj prilaboradoj per API
- Konektiloj por lokalizado de enhavo
- CI/CD-integriĝo
- Tabelkalkulilo por aŭda aŭtomatigo
API Specifoj
Konstruita por produktado de aplikaĵoj
24+
TTS- modeloj
100+
Voĉoj
30+
Lingvoj
<1s
Latenco (Kokoro)
Oftaj demandoj
Komunaj demandoj pri la TTS.ai programisto API
Ĉu vi pretas konstrui per voĉa AI?
Prenu vian senpagan API-ŝlosilon kaj komencu konstrui. 50 kreditoj je aliĝo, disponeblaj senpagaj modeloj, ampleksa dokumentaro.