बग अहवाल / वैशिष्ट्य विनंती

डेव्हलपर करीता पाठ्य ते वक्तव्य APIName

आमच्या REST API द्वारे आवाज सक्षम अनुप्रयोग तयार करा. आपल्या अनुप्रयोगांना, चॅटबॉट्स, आवाज सहाय्यक आणि SaaS उत्पादनांना नैसर्गिक पाठ-वाक्, आवाज क्लोनिंग, भाषण-वाक् आणि ऑडिओ प्रोसेसिंग जोडा. OpenAI-सुसंगत स्वरूप, 20+ मॉडेल, सोपे एकीकरण.

REST API चॅटबॉट्स आवाज अनुप्रयोगName SaaS उत्पादने स्वचालन

पूर्ण TTS संपादक API दस्तऐवजीकरण

आता प्रयत्न करा

0/500

कोकोरो, पाइपर, VITS, MeloTTS सह मोफत

तुमचे निर्मित ऑडिओ येथे दिसेल

पूर्ण TTS संपादक उघडा

डेव्हलपर करीता API वैशिष्ट्ये

आवाज समर्थित अनुप्रयोग बनविण्याकरीता तुम्हाला आवश्यक असलेले सर्वName

सोपे REST APIName

भाषण निर्माण करण्याकरीता एक POST विनंती. JSON विनंती, ऑडिओ प्रतिसाद. HTTP समर्थीत कोणत्याही प्रोग्रामिंग भाषासह कार्य करते.

OpenAI- सुसंगत

OpenAI TTS API करीता ड्रॉप-इन प्रतिस्थापन. तुमचे base_url व API कि बदलवा - अस्तित्वातील कोड त्वरित कार्य करते.

२४+ मॉडेल उपलब्ध

प्रत्येक मॉडेल एकमेव API द्वारे वापरा. एक पैरामीटर बदलून मॉडेल बदलवा. गुणवत्ता, वेग आणि किंमत तुलना करा.

उप- सेकंद लाटेन्सी

कोकोरो १ सेकंदात ऑडिओ तयार करतो. वास्तविक वेळचे चॅटबॉट, आवाज सहाय्यक व परस्पर क्रिया अनुप्रयोग करीता उत्तम.

आवाज क्लोनिंग API

API द्वारे लहान ऑडिओ नमूने पासून आवाज क्लोन करा. सर्व पुढील पिढ्यांसाठी क्लोन आवाज वापरा.

अनेक स्वरूप

WAV, MP3, OGG, किंवा FLAC प्रमाणे आऊटपुट. सॅम्पल दर व बिट खोली निवडा. वास्तविक वेळ अनुप्रयोग करीता स्ट्रीमिंग ऑडिओ समर्थन.

डेव्हलपर एकीकरण करीता सर्वोत्तम मॉडेल

तुमच्या अनुप्रयोगाच्या वेग, गुणवत्ता व खर्च आवश्यकता करीता योग्य मॉडेल निवडा

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

ठराविक 5/5

सर्वोत्तम: सर्वात जलद मॉडेल - उप-सेकंद लाटेन्सी, वास्तविक वेळ अनुप्रयोग आणि चॅटबॉट्ससाठी आदर्श

प्रयत्न करा Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

माध्यम 5/5 आवाज क्लोनिंग

सर्वोत्तम: आवाज सहाय्यक अनुप्रयोग करीता आवाज क्लोनिंगसह TTS स्ट्रीमिंग

प्रयत्न करा CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

मंद 5/5

सर्वोत्तम: चॅटबॉट व सहाय्यक आवाज करीता नैसर्गिक वेळेसह संवादात्मक AI

प्रयत्न करा Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

ठराविक 3/5

सर्वोत्तम: शून्य क्रेडिट खर्चासह मोठ्या प्रमाणातील अनुप्रयोगांसाठी मोफत, फक्त CPU मॉडेल

प्रयत्न करा Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

मंद 4/5

सर्वोत्तम: क्रिएटिव्ह व मनोरंजन अनुप्रयोग करीता ध्वनी प्रभाव सह ऑडिओ जनरेटरName

प्रयत्न करा Bark

TTS API कसे एकत्रित करावे

नोंदणीपासून पहिल्या API कॉलपर्यंत5मिनिटांच्या आत

तुमची API किल्ली प्राप्त करा

मोफत नोंदणी करा आणि आपल्या खात्यापासून API कि तयार करा. 15,000 अक्षरे समाविष्ट आहेत.

तुमचा पहिला कॉल करा

पाठ्य, मॉडेल व आवाजासह /v1/tts ला POST करा. ऑडिओ बायट्स परत मिळवा. कोडच्या ५ ओळींखाली.

तुमचे मॉडेल निवडा

तुमच्या वापरासाठी वेगवेगळ्या मॉडेल्स चाचणी करा. वेग, गुणवत्ता आणि दर पीढीचा खर्च तुलना करा.

उत्पादन करीता पाठवा

याचा वापर शस्त्रक्रिया करताना होतो.

त्वरित प्रारंभ कोड उदाहरण

TTS.ai आपल्या REST API सोबत कोणत्याही भाषेत एकत्रित करा

Python लोकप्रिय

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL वैश्विक

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- सुसंगत स्वरूप ड्रॉप-इन

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

तुमची मोफत API किल्ली मिळवा

डेव्हलपर TTS.ai सोबत काय बनवितात

सामान्य एकीकरण पैलू आणि अनुप्रयोग

AI चॅटबॉट्स व सहायकName

तुमच्या चॅटबॉट किंवा AI सहाय्यकाला आवाज आऊटपुट जोडा. आवाज-सक्षम इंटरफेससाठी TTS द्वारे LLM प्रतिसाद पाइप करा. कोकोरो वास्तविक वेळ संवादांसाठी उप-सेकंद लॅटेन्सी पुरवते. सेसामे CSM नैसर्गिक वेळेसह संवादात्मक भाषण निर्माण करते.

भाषण पाईपलाईन करीता LLM प्रतिसादName
कोकोरो सह उप- सेकंद लाटेन्सी
विकिमीडिया कॉमन्सवर सीएसएम संबंधित संचिका आहेत
ऑडिओ आऊटपुट स्ट्रीमिंग

मोबाइल व आवाज अनुप्रयोगName

आवाज-समर्थित मोबाईल ऍप्लिकेशन्स, सुलभ साधने, वाचन ऍप्लिकेशन्स आणि भाषा शिकण्याच्या प्लॅटफॉर्म तयार करा. आमचे REST API कोणत्याही मोबाईल फ्रेमवर्कसह काम करते. ऑडिओ फाइल्स डाउनलोड करा किंवा थेट क्लायंटला स्ट्रीम करा.

React नेटिव, फ्लॅटर, Swift, KotlinName
प्रवेशीयता व वाचन अनुप्रयोगName
भाषा शिकण्याची साधनेName
ऑडिओ अनुक्रमनिर्मिती

SaaS उत्पादने

आपल्या SaaS उत्पादनात व्हाइट-लेबल आवाज क्षमता. TTS, STT, आवाज क्लोनिंग आणि ऑडिओ प्रोसेसिंग आपल्या प्लॅटफॉर्ममध्ये वैशिष्ट्ये म्हणून जोडा. GPU पायाभूत सुविधा व्यवस्थापन न करता आपल्या आवाज बॅकएंड म्हणून आमचे API वापरा.

व्हाइट- लेबल आवाज वैशिष्ट्ये
GPU पायाभूत सुविधाची गरज नाही
वापरानुसार दर निश्चिती
आपल्या वापरकर्त्यांना ऑफर करण्यासाठी 20+ मॉडेल्स

स्वचालन पाईपलाईन

CI/CD पाईपलाईन, सामग्री स्वचालन आणि बॅच प्रोसेसिंग वर्कफ्लोमध्ये आवाज निर्मिती एकत्र करा. स्प्रेडशीट डेटापासून हजारो ऑडिओ फाइल तयार करा, पॉडकास्ट उत्पादन स्वचालन करा किंवा सामग्री स्थानिकीकरण पाईपलाईन तयार करा.

API द्वारे बॅच प्रक्रिया
विषयवस्तु स्थानिकीकरण पाईपलाईन
CI/CD एकीकरण
ऑडिओ स्वचालन करीता स्प्रेडशीटName

पूर्ण API दस्तऐवजीकरण पहा

API वर्णन

उत्पादन अनुप्रयोग करीता बनविले गेले

20+

TTS नमूने

100+

आवाज

30+

भाषाName

<1s

लाटेन्सी (कोकोरो)

मोफत नोंदणी करा — 15,000 अक्षरे

वारंवार विचारले जाणारे प्रश्न

TTS.ai डेव्हलपर API विषयी सामान्य प्रश्न

होय. आमचे API OpenAI ऑडिओ भाषण स्वरूपाचा अनुसरण करते. जर तुम्ही OpenAI Python किंवा JavaScript क्लाऐंट लायब्ररीचा वापर करत असाल तर, तुम्ही base_url आणि api_key पैरामीटर बदलवून TTS.ai वर जाऊ शकता. तुमचा आधिपासूनचा कोड बदलविल्याशिवाय कार्य करते.

कोकोरो साधारण वाक्यांसाठी 1 सेकंदात ऑडिओ तयार करतो. कोसीव्हॉईस2अधिक कमी प्रतीक्षित लाटेन्सीसाठी स्ट्रीमिंग आऊटपुटला समर्थन देतो. चॅटबॉट्स व आवाज सहाय्यकांसाठी, एकूण राउंड-ट्रिप वेळ सामान्यतः 1-3 सेकंद असतो, पाठ्य लांबी व मॉडेल निवडीवर अवलंबून असतो.

मोफत मॉडेल (कोकोरो, पाइपर, VITS, MeloTTS) पूर्णपणे मोफत आहेत. मानक मॉडेल 2x अक्षरे वापरतात प्रति 1K पाठ्य. प्रीमियम मॉडेल 4x अक्षरे वापरतात प्रति 1K पाठ्य. 15,000 अक्षरे मोफत नोंदणी. योजना 500,000 अक्षरे $9/ महिन्यात सुरू होते.

होय. रेफरन्स ऑडिओ नमूना (5-30 सेकंद) आवाज क्लोनिंग अंतबिंदूवर अपलोड करा, नंतर पुढील TTS विनंतींत क्लोनेड आवाज ID चा वापर करा. क्लोनिंग करीता समर्थन देणारे मॉडेल म्हणजे CosyVoice2, Chatterbox, Fish Speech, आणि GPT-SoVITS.

मोफत स्तरावर मूलभूत दर मर्यादा आहे (खाते नसताना प्रति तास ३ विनंती). विम्याची योजना उत्पादन अनुप्रयोगांसाठी योग्य आहे. उद्योजक-स्तरीय कार्यक्षमता आवश्यकतांसाठी आम्हाला संपर्क साधा.

WAV (असंकुचित, सर्वात उत्तम दर्जाचे), MP3 (संकुचित, लहान फाइल), OGG (ओपन स्वरूप), व FLAC (नष्टविना संकुचन). तुमच्या विनंतीत स्वरूप निश्चित करा. मुलभूत मॉडेलचे मूळ सेंपल दरावर WAV आहे.

होय. एक पूर्ण आवाज सहाय्यक पाईपलाईन तयार करण्यासाठी भाषण- ते- पाठ्य मॉडेल आणि एलएलएमसह आमचे टीटीएस API एकत्र करा. कोकोरो वास्तविक वेळ संवादासाठी उप- सेकंद लॅटेन्सी आदर्श प्रदान करते. कॉसीव्हॉईस2अधिक कमी प्रतिसाद वेळांसाठी स्ट्रीमिंग आउटपुटला समर्थन देते.

कॉसीव्हॉईस2आणि कोकोरो प्रवाही ऑडिओ आऊटपुट समर्थन देते जेथे ऑडिओ चक्क तयार होतात तसे पुरविले जातात. हे आवाज सहाय्यक व परस्पर अनुभव यांसारख्या वास्तविक-वेळ अनुप्रयोगांसाठी प्रथम-बायट वेळ कमी करते.

API मानक HTTP स्थिती कोड परत करतो. 5xx त्रुटी व दर मर्यादा प्रतिसाद करीता एक्सपोनेन्शिअल बॅकऑफ लागू करा. मिशन- क्रिटिकल अनुप्रयोग करीता, पुन्हा प्रयत्न तर्कासह कतार जोडा. आमचे API उच्च अपटाइम आहे परंतु त्रुटी हाताळणी नेहमीच शिफारस केली जाते.

होय. /v1/voices आणि /v1/models अंतबिंदू त्यांच्या मेटाडेटासह सर्व उपलब्ध आवाज व मॉडेल्सची JSON यादी परत देतात (भाषा समर्थन, गुणवत्ता श्रेणी, वेग श्रेणी, आणि किंमत पातळी). तुमच्या अनुप्रयोगात गतिमान मॉडेल निवडक निर्माण करण्यासाठी यांचा वापर करा.

मोफत नमुने (Kokoro, Piper, VITS, MeloTTS) प्रभावी सॅन्डबॉक्स म्हणून कार्य करतात कारण ते शून्य क्रेडिट खर्च करतात. मोफत नमुने वापरून तुमचे एकत्रीकरण चाचणी करा, मग नमूना परिमाणे बदलून उत्पादनात प्रीमियम नमुने बदलवा. वेगळे चाचणी वातावरण आवश्यक नाही.

आमचे बहुतेक मॉडेल ओपन सोर्स आहेत आणि स्वतः होस्ट केले जाऊ शकतात. तथापि, स्वतः होस्ट करण्यासाठी मोठ्या प्रमाणात जीपीयू संसाधनांची आवश्यकता असते (आम्ही 4x NVIDIA Tesla P40 वापरतो ज्यात एकूण 96GB VRAM आहे).

5.0/5 (1)

यासाठी ॲपलने आय.

आपल्या मोफत API किल्ली मिळवा आणि बांधकाम सुरू करा. नोंदणीवर 15 क्रेडिट, मोफत मॉडेल उपलब्ध, व्यापक दस्तऐवजीकरण.

नोंदणी करा किंमत पहा

डेव्हलपर करीता पाठ्य ते वक्तव्य APIName

आता प्रयत्न करा

TTS.ai आवडले? तुमच्या मित्रांना सांगा!

डेव्हलपर करीता API वैशिष्ट्ये

सोपे REST APIName

OpenAI- सुसंगत

२४+ मॉडेल उपलब्ध

उप- सेकंद लाटेन्सी

आवाज क्लोनिंग API

अनेक स्वरूप

डेव्हलपर एकीकरण करीता सर्वोत्तम मॉडेल

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API कसे एकत्रित करावे

तुमची API किल्ली प्राप्त करा

तुमचा पहिला कॉल करा

तुमचे मॉडेल निवडा

उत्पादन करीता पाठवा

त्वरित प्रारंभ कोड उदाहरण

डेव्हलपर TTS.ai सोबत काय बनवितात

AI चॅटबॉट्स व सहायकName

मोबाइल व आवाज अनुप्रयोगName

SaaS उत्पादने

स्वचालन पाईपलाईन

API वर्णन

वारंवार विचारले जाणारे प्रश्न

यामुळे ऍपल आयफोनच्या बाबतीतही तेच घडले.

या वेळी काय करावे हे कळत नाही.

याचा वापर फायबर ऑप्टिक फायबरसाठी कसा केला जातो?

मी API द्वारे आवाज क्लोनिंगचा वापर करू शकतो का?

दराची मर्यादा आहे का?

हे API कोणते ऑडिओ स्वरूप परत करते?

मी आवाज सहाय्यक किंवा चॅटबॉट तयार करण्यासाठी API वापरू शकतो का?

या योजनेत एफडीआय किंवा परकीय चलन उपलब्ध आहे.

यामुळे उत्पादनात वाढ होते व उत्पादन खर्च कमी होतो.

मी प्रोग्रामद्वारे उपलब्ध आवाज व नमुने सूचीबद्ध करू शकतो का?

या योजनेत एक ॲप किंवा वेबसाईट आहे.

यामुळे ॲप वापरताना ॲप स्टोरवर जाऊन ॲप डाउनलोड करता येते.

यासाठी ॲपलने आय.