बग/ विशेषता निवेदन रिपोर्ट करें

विकासकर्ता के लिए पाठ

हमारे RESTB के साथ आवाज अनुप्रयोगों को निर्माण करें. स्वाभाविक पाठ से वार्ता, आवाज-से- वार्ता, आवाज- वार्ता, पाठ- से- वार्ता, और आपके एएसबोर्ग, आवाज्स, और coboths को ऑडियो प्रक्रिया जोड़ें.IACon प्रारूप, 20+2 सरलीकरण.

रिले API बात-चीत आवाज एगल्स सा. यु. पू. स्वचालित सुधार

पूर्ण टीटीएस संपादक एपीआई डॉकs

अब इसे कोशिश करें

0/500

कोकोरो, पाइपर, VIFS, मेरोट के साथ मुक्त

आपका उत्पन्न ऑडियो यहाँ प्रकट होगा

पूरा टीएस संपादक खोलें

डेवलपर के लिए एपीआई फीचर

सभी आप ध्वनि- पढ़े अनुप्रयोगों को बनाने की जरूरत है

सरल रिटाएटी एपीआई

भाषा बनाने के लिए एक पिय निवेदन. JSON निवेदन, ऑडियो प्रतिक्रिया. किसी भी प्रोग्रामिंग भाषा के साथ काम करता है जो एचटीटीपी समर्थन करता है.

चाप- टेक- बिन्दु खोलें

ओपन- इनबॉक्स टीएओ को खोलने के लिए ड्रॉपमेंट. आपके बेस_ कर्ट तथा एपीआई कुंजी को स्विच करें — मौज़ूदा कोड तुरंत काम करता है.

24+ मॉडल उपलब्ध

एकल एपीआई के माध्यम से हर मॉडल पहुंचें. किसी पैरामीटर को बदलने के द्वारा मॉडलों को स्विच करें. गुणवत्ता, गति, और लागत की तुलना करें.

उप- प्रतिशत के बीच में

कोकोरो 1 सेकंड में ऑडियो बनाता है. वास्तविक समय गपशप, आवाज सहायक, तथा इंटरएक्टिव अनुप्रयोगों के लिए बिल्कुल सही.

आवाज कोलोन एपीआई

एपीआई के माध्यम से एक छोटे से ऑडियो नमूना से किसी भी आवाज का प्रयोग करें. बाद के सभी पीढ़ियों के लिए क्लोन ध्वनि इस्तेमाल करें.

बहु फ़ॉर्मेट

WAV, एमपी3, या FLAC के रूप में आउटपुट चुनें. पैटर्न दर और बिट गहराई चुनें. वर्तमान समय ऐक्स ए.

डेवलपर के लिए सर्वोत्तम मॉडल

अपने अनुप्रयोग की गति, विशेषता, और लागत के लिए दायाँ मॉडल चुनें

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

फास्ट 5/5

के लिए उत्तम: अत्यंत तेज मॉडल — उप- आंतरिक, वास्तविक समय ऐक्सीडेंटर तथा गपशप- बमों के लिए आदर्श

कोशिश करें Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

मध्यम 5/5 आवाज कोलोन

के लिए उत्तम: आवाज सहायक अनुप्रयोग के लिए आवाज चालचलन के साथ टीएसएसटी स्ट्रीम किया जा रहा है

कोशिश करें CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

धीमा 5/5

के लिए उत्तम: गपशप और सहायक आवाज के लिए स्वाभाविक समय के साथ वार्तालाप एआई

कोशिश करें Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

फास्ट 3/5

के लिए उत्तम: उच्च-वो अनुप्रयोग के लिए मुक्त, शून्य लागत पर सीपीयू- सिर्फ एक मॉडल

कोशिश करें Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

धीमा 4/5

के लिए उत्तम: सृजनात्मक और मनोरंजन एस्ट्रेशन के लिए ध्वनि पीढ़ी

कोशिश करें Bark

टीटी API को कैसे एकीकृत करें

साइन अप से पहले API को 5 मिनट में कॉल करें

अपना एपीआई कुंजी प्राप्त करें

15,000 अक्षरों में यह भी शामिल है ।

अपना पहला कॉल बनाएँ

पाठ, मॉडल, तथा आवाज के साथ /v1/ tuts. ऑडियो बाइट्स वापस प्राप्त करें. कोड की 5 लाइनों के तहत.

अपना मॉडल चुनें

केस के लिए भिन्न मॉडलों की जाँच करें. तुलना गति, गुणवत्ता, और कीमत प्रति पीढ़ी की तुलना करें.

उत्पादों के लिए जहाज

भुगतान के साथ स्केल करें. भुगतान योजनाओं पर कोई दर सीमा नहीं. अपनेबोर्ड में उपयोग को मॉनीटर करें.

क्विक प्रारंभ कोड उदाहरण

हमारे see API के साथ किसी भी भाषा में TTS.ai00 का विस्तार

Python लोकप्रिय

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL यूनिवर्सल

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

कृत्रिम फ़ॉर्मेट खोलें ड्रॉप- इन

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

अपना फ्री एपीआई कुंजी प्राप्त करें

What Developers Build with TTS.ai

सामान्यीकरण घटक व अनुप्रयोग

एआई चैटस व सहायक

अपने चैटबोट या एआईएसएस सहायक में आवाज आउटपुट जोड़ें. tALM एम एम डीएसईएस द्वारा ध्वनि-एसएएम जवाब वास्तव में समय की बातचीत के लिए ज्यादा देर तक गणना करता है. सीएस एसई एक स्वाभाविक समय के साथ बातचीत शुरू करता है.

बातचीत शुरू करने के लिएLMM प्रतिक्रिया
कोकोरो के साथ उप- सेकेंड
सेमीएम के साथ वार्तालाप
ऑडियो आउटपुट स्ट्रीमिंग

मोबाइल व आवाज अनुप्रयोग

भाषा सक्षम करें या सीधे सेल पाँप, पहुँच औज़ारों, ऐप और भाषा सीखने के साधन बनाएं. हमारी रिस्टिटरिट किसी भी मोबाइल फ्रेमवर्क के साथ काम करता है. ऑडियो फ़ाइलें डाउनलोड करें या सीधे क्लाएंट पर ले जाएँ.

नेटिव, फ्लॉटर, तेज़ी से, कोटलिन
पहुँच तथा एएसडी पढ़ने
भाषा सीखने का मंच
ऑडियो सामग्री बनानाName

सा. यु. पू.

व्हाइट- IncS उत्पादन में आवाज सक्षम करता है. tTS, SAS, आवाज, और ऑडियो प्रक्रिया को अपने मंच में विशेषता के रूप में जोड़ें. हमारे आवाज बैकएण्ड का प्रयोग करें बिना GPULONACKICK के प्रबंधन के.

सफेद- प्रविष्ट आवाज विशेषताएँ
यु. पू.
कौशल का प्रयोग करें
अपने उपयोक्ताओं को प्रस्तुत करने के लिए 20+ मॉडल

स्वचालित प्राप्त करने में पाइप्सलाइन्स

CI/CDs में ध्वनि बनाना, सामग्री फार्मेट करना, और बैच प्रक्रिया कार्य फ्लो करता है. स्प्रेडशीट डाटा से हज़ारों ऑडियो फ़ाइलें बनाएँ, स्वचालित स्कैन किए जा रहे हैं या स्थानीयकरण के निर्माण के लिए सामग्री बनाता है.

एपीआई के द्वारा बैच प्रक्रिया
स्थानीयकरण सामग्री
सीआई/सीडी एकीकरण
ऑडियोमैप में स्प्रेडशीट

पूरा एपीआई प्रलेखन देखें

एपीआई विशेषताएँ

उत्पादन अनुप्रयोगों के लिए बनाया गया

20+

डीटीएस मॉडल

100+

स्थिति

30+

भाषाएँ

<1s

लेटेक्स (केस्को)

मुफ्त पर हस्ताक्षर करना — 15,000 अक्षर

बार बार पूछे जाने वाले प्रश्न

TTS.ai डेवलपर API के बारे में आम सवाल

Yes. Our API follows the OpenAI audio speech format. If you are using the OpenAI Python or JavaScript client library, you can switch to TTS.ai by changing the base_url and api_key parameters. Your existing code works without modification.

Caskooo आम वाक्यों के लिए 1 सेकेंड में ऑडियो बनाता है. Case Baseiest 2 भी कम समझ में लाने के लिए आउटपुट को समर्थन करता है. चैटters और आवाज सहायकों के लिए, कुल दौर समय आम तौर पर पाठ लंबाई और मॉडल चयन पर निर्भर करता है.

फ्री मॉडल (केरो, पाइपो, VIS, VIS) पूरी तरह से मुक्त हैं. मानक मॉडल पाठ के प्रति 2x अक्षर का प्रयोग करते हैं प्रति 1K के लिए 4x अक्षरों का प्रयोग करते हैं. कृपया 1 के साथ 1 के अक्षर दर्ज करें. योजना $9/17/720 के अक्षरों के लिए शुरू होती है.

हाँ. एक संदर्भ ऑडियो नमूना अपलोड करें (5-30 सेकण्ड) आवाज अंत-0 पर, तब क्लोन आवाज आईडी का प्रयोग करे बाद में टीएस निवेदनों में. मॉडल जो समर्थन करता है वह 2 चैट- बाक्स, फ़ीटीडी भाषण, और जी.

फ्रीज के पास मूल दर है (3 घंटे की निवेदन बिना खाता के). Pidid योजनाओं में उदार दर उत्पादन अनुप्रयोगों के लिए उपयुक्त है. उत्पादन अनुप्रयोगों के लिए हमें उत्पादन स्तर-leveling के लिए संपर्क करें.

WAV (अंग्रेड, उच्च गुणवत्ता, उत्तम क्वालिटी), एमपी3 (अंग्रेड, छोटी फ़ाइलें, ओविड, ओविड, और FLAC (स्फीतिहीन संपीडन). अपने अनुरोध में फ़ॉर्मेट निर्धारित करें. डिफ़ॉल्ट WAV मॉडल दर पर.

हाँ. हमारे TTSSTH मॉडल और एक पूर्ण आवाज सहायक बनाने के लिए एक टीआईएम के साथ जोड़. कोकोरो वास्तव में बातचीत के लिए उप-समय फिट आदर्श प्रदान करता है. कोईईई 2 स्ट्रीमिंग आउटपुट को कम से कम पाया प्रतिक्रिया के लिए समर्थन करता है.

कोंसा 2 और कोकोरो ऑडियो आउटपुट स्ट्रीमिंग का समर्थन करता है जहाँ ऑडियो बार निकाले जाते हैं. यह वास्तविक समय को कम करता है ध्वनि सहायक तथा इंटरनेशनल अनुप्रयोगों की तरह.

MHERT HTTP स्थिति कोड बताता है. 5xx त्रुटियाँ और दर सीमा प्रतिक्रिया के लिए पीछे समाप्त करें. मिशन महत्वपूर्ण अनुप्रयोगों के लिए एक कतार जोड़ें, तर्क के साथ एक कतार जोड़ें. हमारे API का अधिकतम समय है लेकिन तेज त्रुटि नियंत्रण हमेशा सिफ़ारिश की जाती है.

हाँ. /v1 और /v1/Myls अंत बिन्दुओं की वापसी सभी उपलब्ध आवाजों और मॉडलों (संत्र समर्थन, गुणवत्ता, दरें, दरें, रेटिंग, और टैगर के साथ. इन प्रभावशाली मॉडल चयनक को बनाने के लिए इस्तेमाल करें अपने अनुप्रयोग में चयन करें.

फ्री मॉडल (केरो, पाइपो, VIFS, VIS) एक प्रभावी संग्रह के रूप में सेवा करते हैं जब से वे शून्य का श्रेय ख़र्च करते हैं. मुक्त मॉडल के साथ अपने संयोजन की जाँच करें, फिर मॉडल पैरामीटर बदलने के द्वारा उत्पादन में स्विच करें. कोई अलग जाँच वातावरण की ज़रूरत नहीं है.

हमारे अधिकांश मॉडल खुले स्रोत हैं और खुद पर निर्भर किया जा सकता है. लेकिन, स्व-किंग महत्वपूर्ण Guguck संसाधन (हम 4xevseee Tivaae P40 के साथ 4xeeeaxe Piaxeaxad कुल कुल का उपयोग करते हैं. NPERGERARGGERGERARAGERT कुल के बिना एक उत्पादन विकल्प प्रदान करता है.

5.0/5 (1)

आवाज एआई के साथ बनाने के लिए तैयार है?

अपनी मुफ्त एपीआई कुंजी प्राप्त करें और निर्माण शुरू करें. साइन अप, मुक्त मॉडलों पर 50 श्रेय उपलब्ध, विस्तृत दस्तावेज.

मुक्त पर हस्ताक्षर करें विन्यास (S)

विकासकर्ता के लिए पाठ

अब इसे कोशिश करें

अपने दोस्तों को बताइए!

डेवलपर के लिए एपीआई फीचर

सरल रिटाएटी एपीआई

चाप- टेक- बिन्दु खोलें

24+ मॉडल उपलब्ध

उप- प्रतिशत के बीच में

आवाज कोलोन एपीआई

बहु फ़ॉर्मेट

डेवलपर के लिए सर्वोत्तम मॉडल

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

टीटी API को कैसे एकीकृत करें

अपना एपीआई कुंजी प्राप्त करें

अपना पहला कॉल बनाएँ

अपना मॉडल चुनें

उत्पादों के लिए जहाज

क्विक प्रारंभ कोड उदाहरण

What Developers Build with TTS.ai

एआई चैटस व सहायक

मोबाइल व आवाज अनुप्रयोग

सा. यु. पू.

स्वचालित प्राप्त करने में पाइप्सलाइन्स

एपीआई विशेषताएँ

बार बार पूछे जाने वाले प्रश्न

क्या HIAS TTS प्रारूप के साथ एपीआई संगत है?

असली समय अनुप्रयोग के लिए देर से क्या है?

आखिर किस तरह काम करता है?

क्या मैं एपीआई के माध्यम से आवाज बराबर इस्तेमाल कर सकते हैं?

क्या दर सीमा है?

एपीआई में क्या लिखा है?

क्या मैं न किसी आवाज सहायक या गपशपबो बनाने के लिए एपीआई इस्तेमाल कर सकता हूँ?

क्या कोई जालक या धारा एपीआई है?

मैं उत्पादन में त्रुटियाँ और पुनर्वास कैसे संभालता हूँ?

क्या मैं ध्वनि और मॉडल प्रोग्रामों की सूची अच्छी तरह दे सकता हूँ?

क्या ऐसे माहौल में मेल - जोल या परीक्षा का माहौल है?

क्या मैं खुद को-हो सकता हूं.. एपीआई का उपयोग करने के बजाय मॉडल?

आवाज एआई के साथ बनाने के लिए तैयार है?