डेव्हलपर करीता पाठ्य ते वक्तव्य APIName
आमच्या REST API द्वारे आवाज सक्षम अनुप्रयोग तयार करा. आपल्या अनुप्रयोगांना, चॅटबॉट्स, आवाज सहाय्यक आणि SaaS उत्पादनांना नैसर्गिक पाठ-वाक्, आवाज क्लोनिंग, भाषण-वाक् आणि ऑडिओ प्रोसेसिंग जोडा. OpenAI-सुसंगत स्वरूप, 20+ मॉडेल, सोपे एकीकरण.
आता प्रयत्न करा
डेव्हलपर करीता API वैशिष्ट्ये
आवाज समर्थित अनुप्रयोग बनविण्याकरीता तुम्हाला आवश्यक असलेले सर्वName
सोपे REST APIName
भाषण निर्माण करण्याकरीता एक POST विनंती. JSON विनंती, ऑडिओ प्रतिसाद. HTTP समर्थीत कोणत्याही प्रोग्रामिंग भाषासह कार्य करते.
OpenAI- सुसंगत
OpenAI TTS API करीता ड्रॉप-इन प्रतिस्थापन. तुमचे base_url व API कि बदलवा - अस्तित्वातील कोड त्वरित कार्य करते.
२४+ मॉडेल उपलब्ध
प्रत्येक मॉडेल एकमेव API द्वारे वापरा. एक पैरामीटर बदलून मॉडेल बदलवा. गुणवत्ता, वेग आणि किंमत तुलना करा.
उप- सेकंद लाटेन्सी
कोकोरो १ सेकंदात ऑडिओ तयार करतो. वास्तविक वेळचे चॅटबॉट, आवाज सहाय्यक व परस्पर क्रिया अनुप्रयोग करीता उत्तम.
आवाज क्लोनिंग API
API द्वारे लहान ऑडिओ नमूने पासून आवाज क्लोन करा. सर्व पुढील पिढ्यांसाठी क्लोन आवाज वापरा.
अनेक स्वरूप
WAV, MP3, OGG, किंवा FLAC प्रमाणे आऊटपुट. सॅम्पल दर व बिट खोली निवडा. वास्तविक वेळ अनुप्रयोग करीता स्ट्रीमिंग ऑडिओ समर्थन.
डेव्हलपर एकीकरण करीता सर्वोत्तम मॉडेल
तुमच्या अनुप्रयोगाच्या वेग, गुणवत्ता व खर्च आवश्यकता करीता योग्य मॉडेल निवडा
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
सर्वोत्तम: सर्वात जलद मॉडेल - उप-सेकंद लाटेन्सी, वास्तविक वेळ अनुप्रयोग आणि चॅटबॉट्ससाठी आदर्श
प्रयत्न करा Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
सर्वोत्तम: आवाज सहाय्यक अनुप्रयोग करीता आवाज क्लोनिंगसह TTS स्ट्रीमिंग
प्रयत्न करा CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
सर्वोत्तम: चॅटबॉट व सहाय्यक आवाज करीता नैसर्गिक वेळेसह संवादात्मक AI
प्रयत्न करा Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
सर्वोत्तम: शून्य क्रेडिट खर्चासह मोठ्या प्रमाणातील अनुप्रयोगांसाठी मोफत, फक्त CPU मॉडेल
प्रयत्न करा Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
सर्वोत्तम: क्रिएटिव्ह व मनोरंजन अनुप्रयोग करीता ध्वनी प्रभाव सह ऑडिओ जनरेटरName
प्रयत्न करा BarkTTS API कसे एकत्रित करावे
नोंदणीपासून पहिल्या API कॉलपर्यंत5मिनिटांच्या आत
तुमची API किल्ली प्राप्त करा
मोफत नोंदणी करा आणि आपल्या खात्यापासून API कि तयार करा. 15,000 अक्षरे समाविष्ट आहेत.
तुमचा पहिला कॉल करा
पाठ्य, मॉडेल व आवाजासह /v1/tts ला POST करा. ऑडिओ बायट्स परत मिळवा. कोडच्या ५ ओळींखाली.
तुमचे मॉडेल निवडा
तुमच्या वापरासाठी वेगवेगळ्या मॉडेल्स चाचणी करा. वेग, गुणवत्ता आणि दर पीढीचा खर्च तुलना करा.
उत्पादन करीता पाठवा
याचा वापर शस्त्रक्रिया करताना होतो.
त्वरित प्रारंभ कोड उदाहरण
TTS.ai आपल्या REST API सोबत कोणत्याही भाषेत एकत्रित करा
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
डेव्हलपर TTS.ai सोबत काय बनवितात
सामान्य एकीकरण पैलू आणि अनुप्रयोग
AI चॅटबॉट्स व सहायकName
तुमच्या चॅटबॉट किंवा AI सहाय्यकाला आवाज आऊटपुट जोडा. आवाज-सक्षम इंटरफेससाठी TTS द्वारे LLM प्रतिसाद पाइप करा. कोकोरो वास्तविक वेळ संवादांसाठी उप-सेकंद लॅटेन्सी पुरवते. सेसामे CSM नैसर्गिक वेळेसह संवादात्मक भाषण निर्माण करते.
- भाषण पाईपलाईन करीता LLM प्रतिसादName
- कोकोरो सह उप- सेकंद लाटेन्सी
- विकिमीडिया कॉमन्सवर सीएसएम संबंधित संचिका आहेत
- ऑडिओ आऊटपुट स्ट्रीमिंग
मोबाइल व आवाज अनुप्रयोगName
आवाज-समर्थित मोबाईल ऍप्लिकेशन्स, सुलभ साधने, वाचन ऍप्लिकेशन्स आणि भाषा शिकण्याच्या प्लॅटफॉर्म तयार करा. आमचे REST API कोणत्याही मोबाईल फ्रेमवर्कसह काम करते. ऑडिओ फाइल्स डाउनलोड करा किंवा थेट क्लायंटला स्ट्रीम करा.
- React नेटिव, फ्लॅटर, Swift, KotlinName
- प्रवेशीयता व वाचन अनुप्रयोगName
- भाषा शिकण्याची साधनेName
- ऑडिओ अनुक्रमनिर्मिती
SaaS उत्पादने
आपल्या SaaS उत्पादनात व्हाइट-लेबल आवाज क्षमता. TTS, STT, आवाज क्लोनिंग आणि ऑडिओ प्रोसेसिंग आपल्या प्लॅटफॉर्ममध्ये वैशिष्ट्ये म्हणून जोडा. GPU पायाभूत सुविधा व्यवस्थापन न करता आपल्या आवाज बॅकएंड म्हणून आमचे API वापरा.
- व्हाइट- लेबल आवाज वैशिष्ट्ये
- GPU पायाभूत सुविधाची गरज नाही
- वापरानुसार दर निश्चिती
- आपल्या वापरकर्त्यांना ऑफर करण्यासाठी 20+ मॉडेल्स
स्वचालन पाईपलाईन
CI/CD पाईपलाईन, सामग्री स्वचालन आणि बॅच प्रोसेसिंग वर्कफ्लोमध्ये आवाज निर्मिती एकत्र करा. स्प्रेडशीट डेटापासून हजारो ऑडिओ फाइल तयार करा, पॉडकास्ट उत्पादन स्वचालन करा किंवा सामग्री स्थानिकीकरण पाईपलाईन तयार करा.
- API द्वारे बॅच प्रक्रिया
- विषयवस्तु स्थानिकीकरण पाईपलाईन
- CI/CD एकीकरण
- ऑडिओ स्वचालन करीता स्प्रेडशीटName
API वर्णन
उत्पादन अनुप्रयोग करीता बनविले गेले
20+
TTS नमूने
100+
आवाज
30+
भाषाName
<1s
लाटेन्सी (कोकोरो)
वारंवार विचारले जाणारे प्रश्न
TTS.ai डेव्हलपर API विषयी सामान्य प्रश्न
आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.
यासाठी ॲपलने आय.
आपल्या मोफत API किल्ली मिळवा आणि बांधकाम सुरू करा. नोंदणीवर 15 क्रेडिट, मोफत मॉडेल उपलब्ध, व्यापक दस्तऐवजीकरण.