Test għal Diskussjoni API għall-Iżviluppaturi
Jibnu applikazzjonijiet vuċi-abilitati mal-REST API tagħna.Żid naturali test-to-diskors, klonazzjoni vuċi, diskors-to-test, u l-ipproċessar awdjo għall-apps tiegħek, chatbots, vuċi assistenti, u prodotti SaaS.OpenAI-format kompatibbli, 20 + mudelli, integrazzjoni sempliċi.
Ipprovaha issa
Karatteristiċi API għall-Iżviluppaturi
Dak kollu li għandek bżonn biex tibni applikazzjonijiet bil-vuċi
Sempliċi REST API
Wieħed talba POST biex jiġġeneraw diskors. talba JSON, tweġiba awdjo. xogħlijiet bi kwalunkwe lingwa ta ’programmar li jappoġġja HTTP.
Kompatibbli ma’ OpenAI
Drop-in sostituzzjoni għall OpenAI TTS API. Swiċċ tiegħek base_url u l-API ewlenija — kodiċi eżistenti xogħlijiet immedjatament.
24+ mudelli disponibbli
Aċċess kull mudell permezz ta' API waħda.Bidla mudelli billi tibdel parametru wieħed. Qabbel il-kwalità, il-veloċità, u l-ispiża.
Latenza Sub-Tieni
Kokoro jiġġenera awdjo f'inqas minn sekonda 1.Perfetta għal chatbots f'ħin reali, assistenti tal-vuċi, u applikazzjonijiet interattivi.
API għall-ikklonjar tal-vuċi
Ikklonja kwalunkwe vuċi minn kampjun awdjo qasir permezz tal-API.Uża vuċijiet ikklonjati għall-ġenerazzjonijiet sussegwenti kollha.
Formati multipli
Output bħala WAV, MP3, OGG, jew FLAC. Agħżel ir-rata tal-kampjun u l-fond bit. Streaming awdjo appoġġ għall-applikazzjonijiet fil-ħin reali.
Mudelli aħjar għall-Integrazzjoni Developer
Agħżel il-mudell it-tajjeb għall-veloċità tal-applikazzjoni tiegħek, il-kwalità, u l-ħtiġijiet tal-ispiża
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
L-aħjar għal: Mudell aktar mgħaġġel - latency sub-sekonda, ideali għal applikazzjonijiet f'ħin reali u chatbots
Ipprova Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
L-aħjar għal: Streaming TTS bl-ikklonjar tal-vuċi għall-applikazzjonijiet tal-assistent tal-vuċi
Ipprova CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
L-aħjar għal: AI konversazzjonali b'ħin naturali għal chatbot u vuċi assistent
Ipprova Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
L-aħjar għal: Mudell b'xejn, CPU biss għal applikazzjonijiet b'volum għoli bi spiża ta' kreditu żero
Ipprova Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
L-aħjar għal: Ġenerazzjoni tal-awdjo b'effetti tal-ħoss għal applikazzjonijiet kreattivi u ta' divertiment
Ipprova BarkKif Tintegra l-API TTS
Minn reġistrazzjoni għall-ewwel sejħa API f'inqas minn 5 minuti
Ikseb il-Klassifikazzjoni tal-API Tiegħek
Irreġistra b'xejn u iġġenera ċavetta API mid-dashboard tal-kont tiegħek. 15,000 karattru inklużi.
Agħmel l-ewwel sejħa tiegħek
POST għal / v1 / tts bit-test, mudell, u vuċi. Get bytes awdjo lura. Taħt 5 linji tal-kodiċi.
Agħżel Mudell tiegħek
Ittestja mudelli differenti għall-każ tal-użu tiegħek. Qabbel il-veloċità, il-kwalità u l-ispiża għal kull ġenerazzjoni.
Vapur għall-Produzzjoni
Skala b'karattri pay-as-you-go. L-ebda limiti tar-rata fuq pjanijiet imħallsa.
Quick Bidu Kodiċi Eżempji
Integra TTS.ai fi kwalunkwe lingwa mal-REST API tagħna
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
X'inhuma l-Iżviluppaturi Jibnu b'TTS.ai
Mudelli u applikazzjonijiet komuni ta’ integrazzjoni
AI Chatbots & Assistenti
Żid output tal-vuċi għall-chatbot jew l-assistent AI tiegħek. It-tweġibiet tal-pajpijiet LLM permezz tat-TTS għal interfaċċi b'vuċi attivata. Kokoro jagħti latency sub-sekonda għal konversazzjonijiet f'ħin reali.
- Rispons tal-LLM għall-pipeline tad-diskors
- Latenza sub-sekondarja ma' Kokoro
- Diskors ta’ konverżazzjoni ma’ Sesame CSM
- Streaming output awdjo
Applikazzjonijiet mobbli u bil-vuċi
Ibni applikazzjonijiet mobbli bil-vuċi, għodod ta' aċċessibbiltà, applikazzjonijiet tal-qari, u pjattaformi għat-tagħlim tal-lingwi. Ir-REST API tagħna taħdem ma' kwalunkwe qafas mobbli.
- Reaġixxi Nattiv, Flutter, Swift, Kotlin
- Applikazzjonijiet tal-aċċessibbiltà u tal-qari
- Pjattaformi għat-tagħlim tal-lingwi
- Ġenerazzjoni tal-kontenut awdjo
Prodotti SaaS
Kapaċitajiet vuċi white-label fil-prodott SaaS tiegħek.Żid TTS, STT, klonazzjoni vuċi, u l-ipproċessar awdjo bħala karatteristiċi fil-pjattaforma tiegħek.Uża API tagħna bħala backend vuċi tiegħek mingħajr ma jimmaniġġjaw l-infrastruttura GPU.
- Karatteristiċi tal-vuċi tal-white label
- Ebda infrastruttura GPU meħtieġa
- Prezzijiet ta’ ħlas skont l-użu
- 20+ mudelli li joffru lill-utenti tiegħek
Pipelines tal-Awtomazzjoni
Integra l-ġenerazzjoni tal-vuċi fil-pipelines CI / CD, awtomatizzazzjoni tal-kontenut, u l-flussi tax-xogħol tal-ipproċessar tal-lott.Iġġenera eluf ta' fajls awdjo minn data spreadsheet, awtomatizza l-produzzjoni tal-podcast, jew ibni pipelines lokalizzazzjoni kontenut.
- Ipproċessar tal-lott permezz tal-API
- Pipelines tal-lokalizzazzjoni tal-kontenut
- Integrazzjoni tas-CI/CD
- Spreadsheet għall-awtomazzjoni awdjo
Speċifikazzjonijiet API
Mibnija għall-applikazzjonijiet tal-produzzjoni
20+
Mudelli TTS
100+
Il-Voti
30+
Lingwi
<1s
Latenza (Kokoro)
Mistoqsijiet Frekwenti (FAQ)
Mistoqsijiet komuni dwar l-TTS.ai żviluppatur API
X'nistgħu ntejbu? Il-feedback tiegħek jgħinna nsolvu l-problemi.
Lest biex tibni bil-vuċi AI?
Ikseb ċavetta API b'xejn tiegħek u tibda tibni.15-il kreditu fuq is-sinjal, mudelli b'xejn disponibbli, dokumentazzjoni komprensiva.