विकासकर्ता के लिए पाठ
हमारे RESTB के साथ आवाज अनुप्रयोगों को निर्माण करें. स्वाभाविक पाठ से वार्ता, आवाज-से- वार्ता, आवाज- वार्ता, पाठ- से- वार्ता, और आपके एएसबोर्ग, आवाज्स, और coboths को ऑडियो प्रक्रिया जोड़ें.IACon प्रारूप, 20+2 सरलीकरण.
अब इसे कोशिश करें
डेवलपर के लिए एपीआई फीचर
सभी आप ध्वनि- पढ़े अनुप्रयोगों को बनाने की जरूरत है
सरल रिटाएटी एपीआई
भाषा बनाने के लिए एक पिय निवेदन. JSON निवेदन, ऑडियो प्रतिक्रिया. किसी भी प्रोग्रामिंग भाषा के साथ काम करता है जो एचटीटीपी समर्थन करता है.
चाप- टेक- बिन्दु खोलें
ओपन- इनबॉक्स टीएओ को खोलने के लिए ड्रॉपमेंट. आपके बेस_ कर्ट तथा एपीआई कुंजी को स्विच करें — मौज़ूदा कोड तुरंत काम करता है.
24+ मॉडल उपलब्ध
एकल एपीआई के माध्यम से हर मॉडल पहुंचें. किसी पैरामीटर को बदलने के द्वारा मॉडलों को स्विच करें. गुणवत्ता, गति, और लागत की तुलना करें.
उप- प्रतिशत के बीच में
कोकोरो 1 सेकंड में ऑडियो बनाता है. वास्तविक समय गपशप, आवाज सहायक, तथा इंटरएक्टिव अनुप्रयोगों के लिए बिल्कुल सही.
आवाज कोलोन एपीआई
एपीआई के माध्यम से एक छोटे से ऑडियो नमूना से किसी भी आवाज का प्रयोग करें. बाद के सभी पीढ़ियों के लिए क्लोन ध्वनि इस्तेमाल करें.
बहु फ़ॉर्मेट
WAV, एमपी3, या FLAC के रूप में आउटपुट चुनें. पैटर्न दर और बिट गहराई चुनें. वर्तमान समय ऐक्स ए.
डेवलपर के लिए सर्वोत्तम मॉडल
अपने अनुप्रयोग की गति, विशेषता, और लागत के लिए दायाँ मॉडल चुनें
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
के लिए उत्तम: अत्यंत तेज मॉडल — उप- आंतरिक, वास्तविक समय ऐक्सीडेंटर तथा गपशप- बमों के लिए आदर्श
कोशिश करें Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
के लिए उत्तम: आवाज सहायक अनुप्रयोग के लिए आवाज चालचलन के साथ टीएसएसटी स्ट्रीम किया जा रहा है
कोशिश करें CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
के लिए उत्तम: गपशप और सहायक आवाज के लिए स्वाभाविक समय के साथ वार्तालाप एआई
कोशिश करें Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
के लिए उत्तम: उच्च-वो अनुप्रयोग के लिए मुक्त, शून्य लागत पर सीपीयू- सिर्फ एक मॉडल
कोशिश करें Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
के लिए उत्तम: सृजनात्मक और मनोरंजन एस्ट्रेशन के लिए ध्वनि पीढ़ी
कोशिश करें Barkटीटी API को कैसे एकीकृत करें
साइन अप से पहले API को 5 मिनट में कॉल करें
अपना एपीआई कुंजी प्राप्त करें
15,000 अक्षरों में यह भी शामिल है ।
अपना पहला कॉल बनाएँ
पाठ, मॉडल, तथा आवाज के साथ /v1/ tuts. ऑडियो बाइट्स वापस प्राप्त करें. कोड की 5 लाइनों के तहत.
अपना मॉडल चुनें
केस के लिए भिन्न मॉडलों की जाँच करें. तुलना गति, गुणवत्ता, और कीमत प्रति पीढ़ी की तुलना करें.
उत्पादों के लिए जहाज
भुगतान के साथ स्केल करें. भुगतान योजनाओं पर कोई दर सीमा नहीं. अपनेबोर्ड में उपयोग को मॉनीटर करें.
क्विक प्रारंभ कोड उदाहरण
हमारे see API के साथ किसी भी भाषा में TTS.ai000000 का विस्तार
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
What Developers Build with TTS.ai
सामान्यीकरण घटक व अनुप्रयोग
एआई चैटस व सहायक
अपने चैटबोट या एआईएसएस सहायक में आवाज आउटपुट जोड़ें. tALM एम एम डीएसईएस द्वारा ध्वनि-एसएएम जवाब वास्तव में समय की बातचीत के लिए ज्यादा देर तक गणना करता है. सीएस एसएसएसएसई एक स्वाभाविक समय के साथ बातचीत शुरू करता है.
- बातचीत शुरू करने के लिएLMM प्रतिक्रिया
- कोकोरो के साथ उप- सेकेंड
- सेमीएम के साथ वार्तालाप
- ऑडियो आउटपुट स्ट्रीमिंग
मोबाइल व आवाज अनुप्रयोग
भाषा सक्षम करें या सीधे सेल पाँप, पहुँच औज़ारों, ऐप और भाषा सीखने के साधन बनाएं. हमारी रिस्टिटरिट किसी भी मोबाइल फ्रेमवर्क के साथ काम करता है. ऑडियो फ़ाइलें डाउनलोड करें या सीधे क्लाएंट पर ले जाएँ.
- नेटिव, फ्लॉटर, तेज़ी से, कोटलिन
- पहुँच तथा एएसडी पढ़ने
- भाषा सीखने का मंच
- ऑडियो सामग्री बनानाName
सा. यु. पू.
व्हाइट- IncS उत्पादन में आवाज सक्षम करता है. tTS, SAS, आवाज, और ऑडियो प्रक्रिया को अपने मंच में विशेषता के रूप में जोड़ें. हमारे आवाज बैकएण्ड का प्रयोग करें बिना GPULONACKICK के प्रबंधन के.
- सफेद- प्रविष्ट आवाज विशेषताएँ
- यु. पू.
- कौशल का प्रयोग करें
- अपने उपयोक्ताओं को प्रस्तुत करने के लिए 20+ मॉडल
स्वचालित प्राप्त करने में पाइप्सलाइन्स
CI/CDs में ध्वनि बनाना, सामग्री फार्मेट करना, और बैच प्रक्रिया कार्य फ्लो करता है. स्प्रेडशीट डाटा से हज़ारों ऑडियो फ़ाइलें बनाएँ, स्वचालित स्कैन किए जा रहे हैं या स्थानीयकरण के निर्माण के लिए सामग्री बनाता है.
- एपीआई के द्वारा बैच प्रक्रिया
- स्थानीयकरण सामग्री
- सीआई/सीडी एकीकरण
- ऑडियोमैप में स्प्रेडशीट
एपीआई विशेषताएँ
उत्पादन अनुप्रयोगों के लिए बनाया गया
20+
डीटीएस मॉडल
100+
स्थिति
30+
भाषाएँ
<1s
लेटेक्स (केस्को)
बार बार पूछे जाने वाले प्रश्न
TTS.ai डेवलपर API के बारे में आम सवाल
क्या हम सुधार कर सकते हैं?
आवाज एआई के साथ बनाने के लिए तैयार है?
अपनी मुफ्त एपीआई कुंजी प्राप्त करें और निर्माण शुरू करें. साइन अप, मुक्त मॉडलों पर 50 श्रेय उपलब्ध, विस्तृत दस्तावेज.