विकासकर्ता के लिए पाठ

हमारे RESTB के साथ आवाज अनुप्रयोगों को निर्माण करें. स्वाभाविक पाठ से वार्ता, आवाज-से- वार्ता, आवाज- वार्ता, पाठ- से- वार्ता, और आपके एएसबोर्ग, आवाज्स, और coboths को ऑडियो प्रक्रिया जोड़ें.IACon प्रारूप, 20+2 सरलीकरण.

रिले API बात-चीत आवाज एगल्स सा. यु. पू. स्वचालित सुधार

अब इसे कोशिश करें

कोकोरो, पाइपर, VIFS, मेरोट के साथ मुक्त
आपका उत्पन्न ऑडियो यहाँ प्रकट होगा
बनाएँ (G)
डाउनलोड
अपने दोस्तों को बताइए!

डेवलपर के लिए एपीआई फीचर

सभी आप ध्वनि- पढ़े अनुप्रयोगों को बनाने की जरूरत है

सरल रिटाएटी एपीआई

भाषा बनाने के लिए एक पिय निवेदन. JSON निवेदन, ऑडियो प्रतिक्रिया. किसी भी प्रोग्रामिंग भाषा के साथ काम करता है जो एचटीटीपी समर्थन करता है.

चाप- टेक- बिन्दु खोलें

ओपन- इनबॉक्स टीएओ को खोलने के लिए ड्रॉपमेंट. आपके बेस_ कर्ट तथा एपीआई कुंजी को स्विच करें — मौज़ूदा कोड तुरंत काम करता है.

24+ मॉडल उपलब्ध

एकल एपीआई के माध्यम से हर मॉडल पहुंचें. किसी पैरामीटर को बदलने के द्वारा मॉडलों को स्विच करें. गुणवत्ता, गति, और लागत की तुलना करें.

उप- प्रतिशत के बीच में

कोकोरो 1 सेकंड में ऑडियो बनाता है. वास्तविक समय गपशप, आवाज सहायक, तथा इंटरएक्टिव अनुप्रयोगों के लिए बिल्कुल सही.

आवाज कोलोन एपीआई

एपीआई के माध्यम से एक छोटे से ऑडियो नमूना से किसी भी आवाज का प्रयोग करें. बाद के सभी पीढ़ियों के लिए क्लोन ध्वनि इस्तेमाल करें.

बहु फ़ॉर्मेट

WAV, एमपी3, या FLAC के रूप में आउटपुट चुनें. पैटर्न दर और बिट गहराई चुनें. वर्तमान समय ऐक्स ए.

डेवलपर के लिए सर्वोत्तम मॉडल

अपने अनुप्रयोग की गति, विशेषता, और लागत के लिए दायाँ मॉडल चुनें

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

के लिए उत्तम: अत्यंत तेज मॉडल — उप- आंतरिक, वास्तविक समय ऐक्सीडेंटर तथा गपशप- बमों के लिए आदर्श

कोशिश करें Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 आवाज कोलोन

के लिए उत्तम: आवाज सहायक अनुप्रयोग के लिए आवाज चालचलन के साथ टीएसएसटी स्ट्रीम किया जा रहा है

कोशिश करें CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

के लिए उत्तम: गपशप और सहायक आवाज के लिए स्वाभाविक समय के साथ वार्तालाप एआई

कोशिश करें Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

के लिए उत्तम: उच्च-वो अनुप्रयोग के लिए मुक्त, शून्य लागत पर सीपीयू- सिर्फ एक मॉडल

कोशिश करें Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

के लिए उत्तम: सृजनात्मक और मनोरंजन एस्ट्रेशन के लिए ध्वनि पीढ़ी

कोशिश करें Bark

टीटी API को कैसे एकीकृत करें

साइन अप से पहले API को 5 मिनट में कॉल करें

1

अपना एपीआई कुंजी प्राप्त करें

15,000 अक्षरों में यह भी शामिल है ।

2

अपना पहला कॉल बनाएँ

पाठ, मॉडल, तथा आवाज के साथ /v1/ tuts. ऑडियो बाइट्स वापस प्राप्त करें. कोड की 5 लाइनों के तहत.

3

अपना मॉडल चुनें

केस के लिए भिन्न मॉडलों की जाँच करें. तुलना गति, गुणवत्ता, और कीमत प्रति पीढ़ी की तुलना करें.

4

उत्पादों के लिए जहाज

भुगतान के साथ स्केल करें. भुगतान योजनाओं पर कोई दर सीमा नहीं. अपनेबोर्ड में उपयोग को मॉनीटर करें.

क्विक प्रारंभ कोड उदाहरण

हमारे see API के साथ किसी भी भाषा में TTS.ai000000 का विस्तार

Python लोकप्रिय
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL यूनिवर्सल
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
कृत्रिम फ़ॉर्मेट खोलें ड्रॉप- इन
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

What Developers Build with TTS.ai

सामान्यीकरण घटक व अनुप्रयोग

एआई चैटस व सहायक

अपने चैटबोट या एआईएसएस सहायक में आवाज आउटपुट जोड़ें. tALM एम एम डीएसईएस द्वारा ध्वनि-एसएएम जवाब वास्तव में समय की बातचीत के लिए ज्यादा देर तक गणना करता है. सीएस एसएसएसएसई एक स्वाभाविक समय के साथ बातचीत शुरू करता है.

  • बातचीत शुरू करने के लिएLMM प्रतिक्रिया
  • कोकोरो के साथ उप- सेकेंड
  • सेमीएम के साथ वार्तालाप
  • ऑडियो आउटपुट स्ट्रीमिंग

मोबाइल व आवाज अनुप्रयोग

भाषा सक्षम करें या सीधे सेल पाँप, पहुँच औज़ारों, ऐप और भाषा सीखने के साधन बनाएं. हमारी रिस्टिटरिट किसी भी मोबाइल फ्रेमवर्क के साथ काम करता है. ऑडियो फ़ाइलें डाउनलोड करें या सीधे क्लाएंट पर ले जाएँ.

  • नेटिव, फ्लॉटर, तेज़ी से, कोटलिन
  • पहुँच तथा एएसडी पढ़ने
  • भाषा सीखने का मंच
  • ऑडियो सामग्री बनानाName

सा. यु. पू.

व्हाइट- IncS उत्पादन में आवाज सक्षम करता है. tTS, SAS, आवाज, और ऑडियो प्रक्रिया को अपने मंच में विशेषता के रूप में जोड़ें. हमारे आवाज बैकएण्ड का प्रयोग करें बिना GPULONACKICK के प्रबंधन के.

  • सफेद- प्रविष्ट आवाज विशेषताएँ
  • यु. पू.
  • कौशल का प्रयोग करें
  • अपने उपयोक्ताओं को प्रस्तुत करने के लिए 20+ मॉडल

स्वचालित प्राप्त करने में पाइप्सलाइन्स

CI/CDs में ध्वनि बनाना, सामग्री फार्मेट करना, और बैच प्रक्रिया कार्य फ्लो करता है. स्प्रेडशीट डाटा से हज़ारों ऑडियो फ़ाइलें बनाएँ, स्वचालित स्कैन किए जा रहे हैं या स्थानीयकरण के निर्माण के लिए सामग्री बनाता है.

  • एपीआई के द्वारा बैच प्रक्रिया
  • स्थानीयकरण सामग्री
  • सीआई/सीडी एकीकरण
  • ऑडियोमैप में स्प्रेडशीट

एपीआई विशेषताएँ

उत्पादन अनुप्रयोगों के लिए बनाया गया

20+

डीटीएस मॉडल

100+

स्थिति

30+

भाषाएँ

<1s

लेटेक्स (केस्को)

बार बार पूछे जाने वाले प्रश्न

TTS.ai डेवलपर API के बारे में आम सवाल

Yes. Our API follows the OpenAI audio speech format. If you are using the OpenAI Python or JavaScript client library, you can switch to TTS.ai by changing the base_url and api_key parameters. Your existing code works without modification.

Caskooo आम वाक्यों के लिए 1 सेकेंड में ऑडियो बनाता है. Case Baseiest 2 भी कम समझ में लाने के लिए आउटपुट को समर्थन करता है. चैटters और आवाज सहायकों के लिए, कुल दौर समय आम तौर पर पाठ लंबाई और मॉडल चयन पर निर्भर करता है.

फ्री मॉडल (केरो, पाइपो, VIS, VIS) पूरी तरह से मुक्त हैं. मानक मॉडल पाठ के प्रति 2x अक्षर का प्रयोग करते हैं प्रति 1K के लिए 4x अक्षरों का प्रयोग करते हैं. कृपया 1 के साथ 1 के अक्षर दर्ज करें. योजना $9/17/720 के अक्षरों के लिए शुरू होती है.

हाँ. एक संदर्भ ऑडियो नमूना अपलोड करें (5-30 सेकण्ड) आवाज अंत-0 पर, तब क्लोन आवाज आईडी का प्रयोग करे बाद में टीएस निवेदनों में. मॉडल जो समर्थन करता है वह 2 चैट- बाक्स, फ़ीटीटीटीडी भाषण, और जी.

फ्रीज के पास मूल दर है (3 घंटे की निवेदन बिना खाता के). Pidid योजनाओं में उदार दर उत्पादन अनुप्रयोगों के लिए उपयुक्त है. उत्पादन अनुप्रयोगों के लिए हमें उत्पादन स्तर-leveling के लिए संपर्क करें.

WAV (अंग्रेड, उच्च गुणवत्ता, उत्तम क्वालिटी), एमपी3 (अंग्रेड, छोटी फ़ाइलें, ओविड, ओविड, और FLAC (स्फीतिहीन संपीडन). अपने अनुरोध में फ़ॉर्मेट निर्धारित करें. डिफ़ॉल्ट WAV मॉडल दर पर.

हाँ. हमारे TTSSTH मॉडल और एक पूर्ण आवाज सहायक बनाने के लिए एक टीआईएम के साथ जोड़. कोकोरो वास्तव में बातचीत के लिए उप-समय फिट आदर्श प्रदान करता है. कोईईई 2 स्ट्रीमिंग आउटपुट को कम से कम पाया प्रतिक्रिया के लिए समर्थन करता है.

कोंसा 2 और कोकोरो ऑडियो आउटपुट स्ट्रीमिंग का समर्थन करता है जहाँ ऑडियो बार निकाले जाते हैं. यह वास्तविक समय को कम करता है ध्वनि सहायक तथा इंटरनेशनल अनुप्रयोगों की तरह.

MHERT HTTP स्थिति कोड बताता है. 5xx त्रुटियाँ और दर सीमा प्रतिक्रिया के लिए पीछे समाप्त करें. मिशन महत्वपूर्ण अनुप्रयोगों के लिए एक कतार जोड़ें, तर्क के साथ एक कतार जोड़ें. हमारे API का अधिकतम समय है लेकिन तेज त्रुटि नियंत्रण हमेशा सिफ़ारिश की जाती है.

हाँ. /v1 और /v1/Myls अंत बिन्दुओं की वापसी सभी उपलब्ध आवाजों और मॉडलों (संत्र समर्थन, गुणवत्ता, दरें, दरें, रेटिंग, और टैगर के साथ. इन प्रभावशाली मॉडल चयनक को बनाने के लिए इस्तेमाल करें अपने अनुप्रयोग में चयन करें.

फ्री मॉडल (केरो, पाइपो, VIFS, VIS) एक प्रभावी संग्रह के रूप में सेवा करते हैं जब से वे शून्य का श्रेय ख़र्च करते हैं. मुक्त मॉडल के साथ अपने संयोजन की जाँच करें, फिर मॉडल पैरामीटर बदलने के द्वारा उत्पादन में स्विच करें. कोई अलग जाँच वातावरण की ज़रूरत नहीं है.

हमारे अधिकांश मॉडल खुले स्रोत हैं और खुद पर निर्भर किया जा सकता है. लेकिन, स्व-किंग महत्वपूर्ण Guguck संसाधन (हम 4xevseee Tivaae P40 के साथ 4xeeeeeeeeeeeeeeeeeeeaxe Piaxeaxad कुल कुल का उपयोग करते हैं. NPERGERGERGERARGGERGERARAGERT कुल के बिना एक उत्पादन विकल्प प्रदान करता है.
5.0/5 (1)

क्या हम सुधार कर सकते हैं?

आवाज एआई के साथ बनाने के लिए तैयार है?

अपनी मुफ्त एपीआई कुंजी प्राप्त करें और निर्माण शुरू करें. साइन अप, मुक्त मॉडलों पर 50 श्रेय उपलब्ध, विस्तृत दस्तावेज.