डेव्हलपर करीता पाठ्य ते वक्तव्य APIName

आमच्या REST API द्वारे आवाज सक्षम अनुप्रयोग तयार करा. आपल्या अनुप्रयोगांना, चॅटबॉट्स, आवाज सहाय्यक आणि SaaS उत्पादनांना नैसर्गिक पाठ-वाक्, आवाज क्लोनिंग, भाषण-वाक् आणि ऑडिओ प्रोसेसिंग जोडा. OpenAI-सुसंगत स्वरूप, 20+ मॉडेल, सोपे एकीकरण.

REST API चॅटबॉट्स आवाज अनुप्रयोगName SaaS उत्पादने स्वचालन

आता प्रयत्न करा

कोकोरो, पाइपर, VITS, MeloTTS सह मोफत
तुमचे निर्मित ऑडिओ येथे दिसेल
बनविले
डाउनलोड
TTS.ai आवडले? तुमच्या मित्रांना सांगा!

डेव्हलपर करीता API वैशिष्ट्ये

आवाज समर्थित अनुप्रयोग बनविण्याकरीता तुम्हाला आवश्यक असलेले सर्वName

सोपे REST APIName

भाषण निर्माण करण्याकरीता एक POST विनंती. JSON विनंती, ऑडिओ प्रतिसाद. HTTP समर्थीत कोणत्याही प्रोग्रामिंग भाषासह कार्य करते.

OpenAI- सुसंगत

OpenAI TTS API करीता ड्रॉप-इन प्रतिस्थापन. तुमचे base_url व API कि बदलवा - अस्तित्वातील कोड त्वरित कार्य करते.

२४+ मॉडेल उपलब्ध

प्रत्येक मॉडेल एकमेव API द्वारे वापरा. एक पैरामीटर बदलून मॉडेल बदलवा. गुणवत्ता, वेग आणि किंमत तुलना करा.

उप- सेकंद लाटेन्सी

कोकोरो १ सेकंदात ऑडिओ तयार करतो. वास्तविक वेळचे चॅटबॉट, आवाज सहाय्यक व परस्पर क्रिया अनुप्रयोग करीता उत्तम.

आवाज क्लोनिंग API

API द्वारे लहान ऑडिओ नमूने पासून आवाज क्लोन करा. सर्व पुढील पिढ्यांसाठी क्लोन आवाज वापरा.

अनेक स्वरूप

WAV, MP3, OGG, किंवा FLAC प्रमाणे आऊटपुट. सॅम्पल दर व बिट खोली निवडा. वास्तविक वेळ अनुप्रयोग करीता स्ट्रीमिंग ऑडिओ समर्थन.

डेव्हलपर एकीकरण करीता सर्वोत्तम मॉडेल

तुमच्या अनुप्रयोगाच्या वेग, गुणवत्ता व खर्च आवश्यकता करीता योग्य मॉडेल निवडा

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

सर्वोत्तम: सर्वात जलद मॉडेल - उप-सेकंद लाटेन्सी, वास्तविक वेळ अनुप्रयोग आणि चॅटबॉट्ससाठी आदर्श

प्रयत्न करा Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 आवाज क्लोनिंग

सर्वोत्तम: आवाज सहाय्यक अनुप्रयोग करीता आवाज क्लोनिंगसह TTS स्ट्रीमिंग

प्रयत्न करा CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

सर्वोत्तम: चॅटबॉट व सहाय्यक आवाज करीता नैसर्गिक वेळेसह संवादात्मक AI

प्रयत्न करा Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

सर्वोत्तम: शून्य क्रेडिट खर्चासह मोठ्या प्रमाणातील अनुप्रयोगांसाठी मोफत, फक्त CPU मॉडेल

प्रयत्न करा Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

सर्वोत्तम: क्रिएटिव्ह व मनोरंजन अनुप्रयोग करीता ध्वनी प्रभाव सह ऑडिओ जनरेटरName

प्रयत्न करा Bark

TTS API कसे एकत्रित करावे

नोंदणीपासून पहिल्या API कॉलपर्यंत5मिनिटांच्या आत

1

तुमची API किल्ली प्राप्त करा

मोफत नोंदणी करा आणि आपल्या खात्यापासून API कि तयार करा. 15,000 अक्षरे समाविष्ट आहेत.

2

तुमचा पहिला कॉल करा

पाठ्य, मॉडेल व आवाजासह /v1/tts ला POST करा. ऑडिओ बायट्स परत मिळवा. कोडच्या ५ ओळींखाली.

3

तुमचे मॉडेल निवडा

तुमच्या वापरासाठी वेगवेगळ्या मॉडेल्स चाचणी करा. वेग, गुणवत्ता आणि दर पीढीचा खर्च तुलना करा.

4

उत्पादन करीता पाठवा

याचा वापर शस्त्रक्रिया करताना होतो.

त्वरित प्रारंभ कोड उदाहरण

TTS.ai आपल्या REST API सोबत कोणत्याही भाषेत एकत्रित करा

Python लोकप्रिय
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL वैश्विक
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- सुसंगत स्वरूप ड्रॉप-इन
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

डेव्हलपर TTS.ai सोबत काय बनवितात

सामान्य एकीकरण पैलू आणि अनुप्रयोग

AI चॅटबॉट्स व सहायकName

तुमच्या चॅटबॉट किंवा AI सहाय्यकाला आवाज आऊटपुट जोडा. आवाज-सक्षम इंटरफेससाठी TTS द्वारे LLM प्रतिसाद पाइप करा. कोकोरो वास्तविक वेळ संवादांसाठी उप-सेकंद लॅटेन्सी पुरवते. सेसामे CSM नैसर्गिक वेळेसह संवादात्मक भाषण निर्माण करते.

  • भाषण पाईपलाईन करीता LLM प्रतिसादName
  • कोकोरो सह उप- सेकंद लाटेन्सी
  • विकिमीडिया कॉमन्सवर सीएसएम संबंधित संचिका आहेत
  • ऑडिओ आऊटपुट स्ट्रीमिंग

मोबाइल व आवाज अनुप्रयोगName

आवाज-समर्थित मोबाईल ऍप्लिकेशन्स, सुलभ साधने, वाचन ऍप्लिकेशन्स आणि भाषा शिकण्याच्या प्लॅटफॉर्म तयार करा. आमचे REST API कोणत्याही मोबाईल फ्रेमवर्कसह काम करते. ऑडिओ फाइल्स डाउनलोड करा किंवा थेट क्लायंटला स्ट्रीम करा.

  • React नेटिव, फ्लॅटर, Swift, KotlinName
  • प्रवेशीयता व वाचन अनुप्रयोगName
  • भाषा शिकण्याची साधनेName
  • ऑडिओ अनुक्रमनिर्मिती

SaaS उत्पादने

आपल्या SaaS उत्पादनात व्हाइट-लेबल आवाज क्षमता. TTS, STT, आवाज क्लोनिंग आणि ऑडिओ प्रोसेसिंग आपल्या प्लॅटफॉर्ममध्ये वैशिष्ट्ये म्हणून जोडा. GPU पायाभूत सुविधा व्यवस्थापन न करता आपल्या आवाज बॅकएंड म्हणून आमचे API वापरा.

  • व्हाइट- लेबल आवाज वैशिष्ट्ये
  • GPU पायाभूत सुविधाची गरज नाही
  • वापरानुसार दर निश्चिती
  • आपल्या वापरकर्त्यांना ऑफर करण्यासाठी 20+ मॉडेल्स

स्वचालन पाईपलाईन

CI/CD पाईपलाईन, सामग्री स्वचालन आणि बॅच प्रोसेसिंग वर्कफ्लोमध्ये आवाज निर्मिती एकत्र करा. स्प्रेडशीट डेटापासून हजारो ऑडिओ फाइल तयार करा, पॉडकास्ट उत्पादन स्वचालन करा किंवा सामग्री स्थानिकीकरण पाईपलाईन तयार करा.

  • API द्वारे बॅच प्रक्रिया
  • विषयवस्तु स्थानिकीकरण पाईपलाईन
  • CI/CD एकीकरण
  • ऑडिओ स्वचालन करीता स्प्रेडशीटName

API वर्णन

उत्पादन अनुप्रयोग करीता बनविले गेले

20+

TTS नमूने

100+

आवाज

30+

भाषाName

<1s

लाटेन्सी (कोकोरो)

वारंवार विचारले जाणारे प्रश्न

TTS.ai डेव्हलपर API विषयी सामान्य प्रश्न

होय. आमचे API OpenAI ऑडिओ भाषण स्वरूपाचा अनुसरण करते. जर तुम्ही OpenAI Python किंवा JavaScript क्लाऐंट लायब्ररीचा वापर करत असाल तर, तुम्ही base_url आणि api_key पैरामीटर बदलवून TTS.ai वर जाऊ शकता. तुमचा आधिपासूनचा कोड बदलविल्याशिवाय कार्य करते.

कोकोरो साधारण वाक्यांसाठी 1 सेकंदात ऑडिओ तयार करतो. कोसीव्हॉईस2अधिक कमी प्रतीक्षित लाटेन्सीसाठी स्ट्रीमिंग आऊटपुटला समर्थन देतो. चॅटबॉट्स व आवाज सहाय्यकांसाठी, एकूण राउंड-ट्रिप वेळ सामान्यतः 1-3 सेकंद असतो, पाठ्य लांबी व मॉडेल निवडीवर अवलंबून असतो.

मोफत मॉडेल (कोकोरो, पाइपर, VITS, MeloTTS) पूर्णपणे मोफत आहेत. मानक मॉडेल 2x अक्षरे वापरतात प्रति 1K पाठ्य. प्रीमियम मॉडेल 4x अक्षरे वापरतात प्रति 1K पाठ्य. 15,000 अक्षरे मोफत नोंदणी. योजना 500,000 अक्षरे $9/ महिन्यात सुरू होते.

होय. रेफरन्स ऑडिओ नमूना (5-30 सेकंद) आवाज क्लोनिंग अंतबिंदूवर अपलोड करा, नंतर पुढील TTS विनंतींत क्लोनेड आवाज ID चा वापर करा. क्लोनिंग करीता समर्थन देणारे मॉडेल म्हणजे CosyVoice2, Chatterbox, Fish Speech, आणि GPT-SoVITS.

मोफत स्तरावर मूलभूत दर मर्यादा आहे (खाते नसताना प्रति तास ३ विनंती). विम्याची योजना उत्पादन अनुप्रयोगांसाठी योग्य आहे. उद्योजक-स्तरीय कार्यक्षमता आवश्यकतांसाठी आम्हाला संपर्क साधा.

WAV (असंकुचित, सर्वात उत्तम दर्जाचे), MP3 (संकुचित, लहान फाइल), OGG (ओपन स्वरूप), व FLAC (नष्टविना संकुचन). तुमच्या विनंतीत स्वरूप निश्चित करा. मुलभूत मॉडेलचे मूळ सेंपल दरावर WAV आहे.

होय. एक पूर्ण आवाज सहाय्यक पाईपलाईन तयार करण्यासाठी भाषण- ते- पाठ्य मॉडेल आणि एलएलएमसह आमचे टीटीएस API एकत्र करा. कोकोरो वास्तविक वेळ संवादासाठी उप- सेकंद लॅटेन्सी आदर्श प्रदान करते. कॉसीव्हॉईस2अधिक कमी प्रतिसाद वेळांसाठी स्ट्रीमिंग आउटपुटला समर्थन देते.

कॉसीव्हॉईस2आणि कोकोरो प्रवाही ऑडिओ आऊटपुट समर्थन देते जेथे ऑडिओ चक्क तयार होतात तसे पुरविले जातात. हे आवाज सहाय्यक व परस्पर अनुभव यांसारख्या वास्तविक-वेळ अनुप्रयोगांसाठी प्रथम-बायट वेळ कमी करते.

API मानक HTTP स्थिती कोड परत करतो. 5xx त्रुटी व दर मर्यादा प्रतिसाद करीता एक्सपोनेन्शिअल बॅकऑफ लागू करा. मिशन- क्रिटिकल अनुप्रयोग करीता, पुन्हा प्रयत्न तर्कासह कतार जोडा. आमचे API उच्च अपटाइम आहे परंतु त्रुटी हाताळणी नेहमीच शिफारस केली जाते.

होय. /v1/voices आणि /v1/models अंतबिंदू त्यांच्या मेटाडेटासह सर्व उपलब्ध आवाज व मॉडेल्सची JSON यादी परत देतात (भाषा समर्थन, गुणवत्ता श्रेणी, वेग श्रेणी, आणि किंमत पातळी). तुमच्या अनुप्रयोगात गतिमान मॉडेल निवडक निर्माण करण्यासाठी यांचा वापर करा.

मोफत नमुने (Kokoro, Piper, VITS, MeloTTS) प्रभावी सॅन्डबॉक्स म्हणून कार्य करतात कारण ते शून्य क्रेडिट खर्च करतात. मोफत नमुने वापरून तुमचे एकत्रीकरण चाचणी करा, मग नमूना परिमाणे बदलून उत्पादनात प्रीमियम नमुने बदलवा. वेगळे चाचणी वातावरण आवश्यक नाही.

आमचे बहुतेक मॉडेल ओपन सोर्स आहेत आणि स्वतः होस्ट केले जाऊ शकतात. तथापि, स्वतः होस्ट करण्यासाठी मोठ्या प्रमाणात जीपीयू संसाधनांची आवश्यकता असते (आम्ही 4x NVIDIA Tesla P40 वापरतो ज्यात एकूण 96GB VRAM आहे).
5.0/5 (1)

आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.

यासाठी ॲपलने आय.

आपल्या मोफत API किल्ली मिळवा आणि बांधकाम सुरू करा. नोंदणीवर 15 क्रेडिट, मोफत मॉडेल उपलब्ध, व्यापक दस्तऐवजीकरण.