API e Tekstit në Fjalë për zhvilluesit
Ndërto aplikacione të aktivizuara me zë me API-në tonë REST. Shto tekst natyror në fjalë, klonim zëri, fjalë në tekst dhe përpunim audio në aplikacionet, chatbot-ët, asistentët e zërit dhe produktet SaaS. Format i përshtatshëm me OpenAI, më shumë se 20 modele, integrim i thjeshtë.
Provoje tani
Funksionet e API për zhvilluesit
Gjithçka që të duhet për të ndërtuar aplikacione me zë
API e thjeshtë REST
Një kërkesë POST për të gjeneruar fjalimin. Kërkesë JSON, përgjigje audio. Punon me çdo gjuhë programimi që suporton HTTP.
OpenAI-Compatible
Zëvendësues për API OpenAI TTS. Ndrysho base_url dhe kyçin e API - kodi ekzistues punon menjëherë.
Modele në dispozicion
Hyr në çdo model nëpërmjet një API të vetme. Ndrysho modele duke ndryshuar një parametr. Krahaso cilësinë, shpejtësinë dhe koston.
Sub-Second Latency
Kokoro gjeneron audion në më pak se 1 sekond. Perfekt për chatbots në kohë reale, asistentët e zërit dhe aplikacionet interaktive.
API e klonimit të zërit
Klono çdo zë nga një shembull i shkurtër audio nëpërmjet API. Përdor zërat e klonuar për të gjitha brezat e ardhshëm.
Formate të shumta
Shfaq si WAV, MP3, OGG, ose FLAC. Zgjidh shkallën e shembullit dhe thellësinë e bit. Suport për streaming audio për aplikativët në kohë reale.
Modelet më të mira për integrimin e zhvilluesve
Zgjidh modelin e duhur për shpejtësinë, cilësinë dhe kërkesat e kostos së aplikimit tënd
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Më i miri për: Modeli më i shpejtë — vonesë nën sekonda, ideal për aplikacionet në kohë reale dhe chatbots
Provo Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Më i miri për: Shfaq TTS me klonim zëri për aplikacionet e ndihmësve të zërit
Provo CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Më i miri për: AI biseduese me kohë natyrore për chatbot dhe zërin e asistentit
Provo Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Më i miri për: Model i lirë, vetëm CPU për aplikacione me volum të lartë me koston zero të kreditit
Provo Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Më i miri për: Gjeneratori i audios me efekte zëri për aplikacionet krijuese dhe argëtuese
Provo BarkSi të integrosh API-në e TTS
Nga regjistrimi tek thirrjet e para të API-së në më pak se 5 minuta
Merr çelësin tuaj API
Regjistrohu falas dhe gjenero një çelës API nga paneli i llogarisë tënde. 15,000 karaktere të përfshira.
Telefonata e parë
POST në /v1/tts me tekst, model dhe zë. Kthej byte audio. Në 5 rreshta kodi.
Zgjidh modelin tënd
Testo modele të ndryshme për përdorimin tënd. Krahaso shpejtësinë, cilësinë dhe koston për gjeneratë.
Shko tek prodhimi
Shkalla me karakterë të paguara sipas përdorimit. Pa kufizime në tarifat e paguara. Monitoro përdorimin në panelin tënd.
Shembuj të Kodit të Fillimit të Shpejtë
Integro TTS.ai në çdo gjuhë me API-në tonë REST
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Çfarë ndërtojnë zhvilluesit me TTS.ai
Modele dhe aplikime të përbashkëta të integrimit
AI Chatbots & Asistentë
Shto daljen e zërit tek chatbot apo asistenti i AI. Përgjigjet e LLM-it nëpërmjet TTS për ndërfaqet e aktivizuara me zë. Kokoro ofron kohëzgjatje nën një sekond për biseda në kohë reale. Sesame CSM gjeneron biseda me kohëzgjatje natyrale.
- Përgjigja LLM tek pipeline e fjalimit
- Kokoro
- Fjalimi i bisedës me Sesame CSM
- Shtimi i audios
Aplikacionet e zërit dhe të lëvizshëm
Ndërto aplikacione të aktivizuara me zë për mobile, instrumente të açesibilitetit, aplikacione leximi dhe platforma të mësimit të gjuhës. API jonë REST punon me çdo platformë mobile. Shkarko file audio ose transmeto drejtpërsëdrejti tek klienti.
- React Native, Flutter, Swift, Kotlin
- Aplikativë të açesibilitetit dhe leximit
- Platforma për mësimin e gjuhës
- Gjenerati audio
Produktët SaaS
Mundësitë e zërit të etiketës së bardhë në produktin tuaj SaaS. Shto TTS, STT, klonimin e zërit dhe përpunimin e audios si funksione në platformën tuaj. Përdor API tonë si backend të zërit pa menaxhuar infrastrukturën e GPU.
- Funksionet e zërit
- Nuk duhet infrastrukturë GPU
- Pagu për përdorim
- 20+ modele për t'u ofruar përdoruesve tuaj
Automatizimi i Pipeline
Integro gjenerimin e zërit në CI/CD pipelines, automatizimin e përmbajtjes dhe procesimin e grupeve të punës. Gjeneroni mijëra skedarë audio nga të dhënat e tabelave, automatizoni prodhimin e podcast-eve ose ndërtoni pipelines e lokalizimit të përmbajtjes.
- Përpunimi i grupeve nëpërmjet API
- Përmbajtja e lokalizimit
- Integrimi CI/CD
- Tabela e llogarive për automatikimin e audios
Specifikimet e API
E ndërtuar për aplikacionet e prodhimit
20+
Modelet TTS
100+
Zërat
30+
Gjuhë
<1s
Kokoro
Pyetje të shpeshta
Pyetje të zakonshme rreth API të zhvilluesit TTS.ai
Çfarë mund të përmirësojmë? Feedback-i juaj na ndihmon të zgjidhim problemet.
Gati për të ndërtuar me AI të zërit?
Merr çelësin tënd të API-së dhe fillo ndërtimin. 15 kredite në regjistrim, modele të lira në dispozicion, dokumentacion tërësor.