विकासकर्ताका लागि पाठबाट भाषण एपीआईName

हाम्रो REST API संग आवाज-सक्षम अनुप्रयोगहरू निर्माण गर्नुहोस्। आफ्नो अनुप्रयोगहरू, च्याटबोटहरू, आवाज सहायकहरू र SaaS उत्पादनहरूमा प्राकृतिक पाठ-देखि-भाषण, आवाज क्लोनिंग, भाषण-देखि-पाठ र अडियो प्रोसेसिंग थप्नुहोस्। OpenAI-संगत ढाँचा, 20+ मोडेल, सरल एकीकरण।

REST एपीआई च्याटबोटहरू आवाज अनुप्रयोगName SaaS उत्पादनहरू स्वचालित

अहिले प्रयास गर्नुहोस्

कोकोरो, पाइपर, भिट्स, मेलोटीटीएससँग निःशुल्क
तपाईँको सिर्जना गरिएको अडियो यहाँ देखा पर्नेछ
सिर्जना गरिएको
डाउनलोड गर्नुहोस्
TTS.ai प्रेम? आफ्नो साथीहरूलाई भन्नुहोस्!

विकासकर्ताहरूका लागि API विशेषताहरू

तपाईँलाई आवाज सक्षम अनुप्रयोगहरू निर्माण गर्न आवश्यक सबै कुराName

साधारण REST API

भाषण सिर्जना गर्न एक POST अनुरोध। JSON अनुरोध, अडियो प्रतिक्रिया। HTTP समर्थन गर्ने कुनै पनि प्रोग्रामिङ भाषासँग काम गर्दछ।

खुला AI- मिल्दो

OpenAI TTS एपीआई लागि ड्रप-मा प्रतिस्थापन. आफ्नो base_url र एपीआई कुञ्जी स्विच - अवस्थित कोड तुरुन्तै काम.

24+ मोडेल उपलब्ध

एकल एपीआई मार्फत हरेक नमूना पहुँच। एक मापदण्ड परिवर्तन गरेर नमूना स्विच। गुणस्तर, गति र लागत तुलना।

उप-सेकेन्ड लाटेन्सी

कोकोरो 1 सेकेन्डमा अडियो उत्पन्न गर्दछ। वास्तविक समय च्याटबोट्स, आवाज सहायक र अन्तरक्रियात्मक अनुप्रयोगहरूको लागि उत्तम।

आवाज क्लोनिङ API

एपीआई मार्फत छोटो अडियो नमूनाबाट कुनै पनि आवाज क्लोन गर्नुहोस् । सबै पछिल्लो पुस्ताका लागि क्लोन गरिएको आवाज प्रयोग गर्नुहोस् ।

बहुविध ढाँचा

WAV, MP3, OGG, वा FLAC को रूपमा निर्गत गर्नुहोस् । नमूना दर र बिट गहिराइ रोज्नुहोस् । वास्तविक समय अनुप्रयोगका लागि स्ट्रिमिङ अडियो समर्थन ।

विकासकर्ता एकीकरणको लागि सर्वश्रेष्ठ मोडेलहरू

आफ्नो अनुप्रयोगको गति, गुणस्तर, र लागत आवश्यकताहरूको लागि सही मोडेल रोज्नुहोस्

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

यसका लागि उत्तम: छिटो मोडेल - उप-सेकेन्ड latency, वास्तविक-समय अनुप्रयोगहरू र chatbots लागि आदर्श

प्रयास गर्नुहोस् Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 आवाज क्लोनिङ

यसका लागि उत्तम: आवाज सहायक अनुप्रयोगका लागि आवाज क्लोनिङसँग TTS स्ट्रिमिङ

प्रयास गर्नुहोस् CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

यसका लागि उत्तम: च्याटबोट र सहायक आवाज लागि प्राकृतिक समय संग Conversational AI

प्रयास गर्नुहोस् Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

यसका लागि उत्तम: शून्य क्रेडिट लागतको साथ उच्च-भोल्युम अनुप्रयोगहरूको लागि नि: शुल्क, सीपीयू-मात्र मोडेल

प्रयास गर्नुहोस् Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

यसका लागि उत्तम: रचनात्मक र मनोरञ्जन अनुप्रयोगहरूका लागि ध्वनि प्रभावहरूसँग अडियो सिर्जना

प्रयास गर्नुहोस् Bark

TTS API कसरी एकीकृत गर्ने

पहिलो API कल मा साइन अप देखि5मिनेट

1

तपाईँको एपीआई कुञ्जी प्राप्त गर्नुहोस्

नि: शुल्क लागि साइन अप र आफ्नो खाता डैशबोर्ड देखि एक एपीआई कुञ्जी उत्पन्न. 15,000 क्यारेक्टर समावेश.

2

तपाईँको पहिलो कल गर्नुहोस्

पाठ, नमूना, र आवाज संग / v1 / tts पोस्ट. अडियो बाइट्स फिर्ता प्राप्त. अन्तर्गत5कोड लाइनहरू.

3

तपाईँको नमूना रोज्नुहोस्

आफ्नो प्रयोग मामला लागि विभिन्न मोडेल परीक्षण। गति, गुणस्तर, र प्रति पुस्ता लागत तुलना।

4

उत्पादनमा जहाज

तपाईं-जाने रूपमा भुक्तानी क्यारेक्टरहरूसँग स्केल गर्नुहोस्। भुक्तानी योजनाहरूमा कुनै दर सीमाहरू छैन। आफ्नो डैशबोर्डमा प्रयोग निगरानी गर्नुहोस्।

द्रुत सुरुआत सङ्केत उदाहरण

हाम्रो REST API संग कुनै पनि भाषामा TTS.ai एकीकृत गर्नुहोस्

Python लोकप्रिय
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL विश्वव्यापी
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
खुला AI- मिल्दो ढाँचा ड्रप-इन
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

के विकासकर्ताहरू TTS.ai सँग निर्माण गर्दछन्

सामान्य एकीकरण ढाँचा र अनुप्रयोगहरू

AI च्याटबोटहरू र सहायकहरू

आफ्नो च्याटबोट वा एआई सहायकमा आवाज आउटपुट थप्नुहोस्। आवाज-सक्षम इन्टरफेसहरूको लागि TTS मार्फत पाइप LLM प्रतिक्रियाहरू। कोकोरोले वास्तविक समय वार्तालापहरूको लागि उप-सेकेन्ड लाटेन्सी प्रदान गर्दछ। सेसा CSM प्राकृतिक समय संग संवादात्मक भाषण उत्पन्न गर्दछ।

  • भाषण पाइपलाइनमा LLM प्रतिक्रिया
  • कोकोरोसँग उप-सेकेन्ड लाटेन्सी
  • यसको प्रकाशन काठमाडौंमा मासिक अवधिमा हुन्छ।
  • अडियो निर्गत स्ट्रिमिङ

मोबाइल र आवाज अनुप्रयोगName

आवाज-सक्षम मोबाइल अनुप्रयोगहरू, पहुँच उपकरणहरू, पढ्ने अनुप्रयोगहरू र भाषा सिक्ने प्लेटफर्महरू निर्माण गर्नुहोस्। हाम्रो REST API कुनै पनि मोबाइल फ्रेमवर्कसँग काम गर्दछ। अडियो फाइलहरू डाउनलोड गर्नुहोस् वा ग्राहकलाई सीधा प्रवाह गर्नुहोस्।

  • रिअक्ट नेटिव, फ्ल्युटर, स्विफ्ट, कोटलिन
  • पहुँचता र पढ्ने अनुप्रयोगहरू
  • भाषा सिक्ने प्लेटफर्महरू
  • अडियो सामग्री सिर्जना

SaaS उत्पादनहरू

तपाईंको SaaS उत्पादनमा सेतो-लेबल आवाज क्षमताहरू। TTS, STT, आवाज क्लोनिंग, र अडियो प्रोसेसिंग तपाईंको प्लेटफर्ममा सुविधाहरूको रूपमा थप्नुहोस्। GPU पूर्वाधार व्यवस्थापन बिना तपाईंको आवाज ब्याकएन्डको रूपमा हाम्रो API प्रयोग गर्नुहोस्।

  • सेतो लेबुल आवाज विशेषताहरू
  • GPU पूर्वाधार आवश्यक छैन
  • प्रयोग प्रति-शुल्क मूल्याङ्कन
  • आफ्नो प्रयोगकर्ताहरू प्रस्ताव गर्न 20+ मोडेल

स्वचालित पाइपलाइनहरू

CI / CD पाइपलाइनहरू, सामग्री स्वचालन र ब्याच प्रोसेसिंग कार्यप्रवाहहरूमा आवाज उत्पादन एकीकृत गर्नुहोस्। स्प्रेडशीट डाटाबाट अडियो फाइलहरूको हजारौं उत्पन्न गर्नुहोस्, पोडकास्ट उत्पादन स्वचालित गर्नुहोस्, वा सामग्री स्थानीयकरण पाइपलाइनहरू निर्माण गर्नुहोस्।

  • एपीआई मार्फत ब्याच प्रक्रिया
  • सामग्री स्थानीयकरण पाइपलाइनहरू
  • CI/CD एकीकरण
  • अडियो स्वचालित गर्न स्प्रेडसिट

API निर्दिष्टीकरण

उत्पादन अनुप्रयोगहरूका लागि निर्माण गरिएको

20+

TTS नमूना

100+

आवाजहरू

30+

भाषाहरू

<1s

लाटेन्सी (Kokoro)

प्राय सोधिने प्रश्नहरू

TTS.ai विकासकर्ता एपीआई बारेमा सामान्य प्रश्नहरू

हो। हाम्रो API OpenAI अडियो भाषण ढाँचा पालना गर्दछ। यदि तपाईं OpenAI पाइथन वा जाभास्क्रिप्ट क्लाइन्ट लाइब्रेरी प्रयोग गर्दै हुनुहुन्छ भने, तपाईं base_url र api_key परिमितिहरू परिवर्तन गरेर TTS.ai मा स्विच गर्न सक्नुहुन्छ। तपाईँको अवस्थित कोड परिवर्तन बिना काम गर्दछ।

कोकोरो सामान्य वाक्यहरूको लागि 1 सेकेन्डमा अडियो उत्पन्न गर्दछ। CosyVoice2ले अझै पनि कम धारणा गरिएको लाटेन्सीको लागि स्ट्रिमिङ निर्गत समर्थन गर्दछ। च्याटबोटहरू र आवाज सहायकहरूको लागि, कुल राउन्ड-ट्रिप समय सामान्यतया पाठ लम्बाइ र मोडेलको विकल्पमा निर्भर 1-3 सेकेन्ड हो।

नि: शुल्क मोडेल (कोकोरो, पाइपर, VITS, MeloTTS) पूर्ण रूपमा नि: शुल्क छन्। मानक मोडेलहरू पाठको प्रति 1K प्रति 2x क्यारेक्टरहरू प्रयोग गर्दछ। प्रिमियम मोडेलहरू पाठको प्रति 1K प्रति 4x क्यारेक्टरहरू प्रयोग गर्दछ। 15,000 क्यारेक्टरहरूसँग नि: शुल्क साइन अप गर्नुहोस्। योजनाहरू 500,000 क्यारेक्टरहरूको लागि $9/month मा सुरु हुन्छ।

हो । एउटा सन्दर्भ अडियो नमूना (५-३० सेकेन्ड) आवाज क्लोनिङ अन्त बिन्दुमा अपलोड गर्नुहोस्, त्यसपछि पछिल्लो TTS अनुरोधमा क्लोन गरिएको आवाज आईडी प्रयोग गर्नुहोस् । क्लोनिङ समर्थन गर्ने नमूनाहरूमा कोसीभाइज २, च्याटरबक्स, माछा वक्तव्य र GPT-SoVITS समावेश छन् ।

नि: शुल्क तहमा आधारभूत दर सीमित छ (3 खाता बिना प्रति घण्टा अनुरोधहरू)। भुक्तानी योजनाहरू उत्पादन अनुप्रयोगहरूको लागि उपयुक्त उदार दर सीमाहरू छन्। उद्यम स्तर थ्रुपुट आवश्यकताहरूको लागि हामीलाई सम्पर्क गर्नुहोस्।

WAV (असङ्कुचित, उच्चतम गुणस्तर), MP3 (सङ्कुचित, साना फाइल), OGG (खोलिएको ढाँचा), र FLAC (नष्टविहिन सङ्कुचन) । तपाईँको अनुरोधमा ढाँचा निर्दिष्ट गर्नुहोस् । पूर्वनिर्धारित मोडेलको मौलिक नमूना दरमा WAV हो ।

हो। एक पूर्ण आवाज सहायक पाइपलाइन निर्माण गर्न एक भाषण-देखि-पाठ मोडेल र एक LLM संग हाम्रो TTS API संयोजन गर्नुहोस्। कोकोरोले वास्तविक समय कुराकानी लागि उप-सेकेन्ड लाटेन्सी आदर्श प्रदान गर्दछ। CosyVoice2ले अझै पनि कम धारणा प्रतिक्रिया समयको लागि स्ट्रिमिंग आउटपुट समर्थन गर्दछ।

कोसीभोइस २ र कोकोरोले स्ट्रिमिङ अडियो निर्गतलाई समर्थन गर्दछ जहाँ अडियो टुक्राहरू तिनीहरू उत्पन्न भए जस्तै वितरण गरिन्छ । यसले आवाज सहायकहरू र अन्तरक्रियात्मक अनुभवहरू जस्तै वास्तविक समय अनुप्रयोगहरूका लागि समय-देखि-पहिलो-बाईट घटाउँछ ।

एपीआई मानक एचटीटीपी स्थिति कोड फर्काउँछ। 5xx त्रुटिहरू र दर सीमा प्रतिक्रियाहरूको लागि घातीय ब्याकअफ लागू गर्नुहोस्। मिशन-महत्वपूर्ण अनुप्रयोगहरूको लागि, फेरि प्रयास तर्कसँग लाम थप्नुहोस्। हाम्रो एपीआई उच्च अपटाइम छ तर लचीला त्रुटि ह्यान्डलिंग सधैं सिफारिस गरिन्छ।

हो । /v1/voices र /v1/models अन्त बिन्दुले तिनीहरूको मेटाडेटा (भाषा समर्थन, गुणस्तर मूल्याङ्कन, गति मूल्याङ्कन, र मूल्य निर्धारण तह) सँग सबै उपलब्ध आवाज र नमूनाहरूको JSON सूचीहरू फर्काउँछ । तपाईँको अनुप्रयोगमा गतिशील नमूना चयनकर्ताहरू निर्माण गर्न यी प्रयोग गर्नुहोस् ।

निःशुल्क नमूना (Kokoro, Piper, VITS, MeloTTS) तिनीहरूले शून्य क्रेडिट लागत देखि प्रभावकारी स्यान्डबक्स रूपमा सेवा। निःशुल्क नमूना संग आफ्नो एकीकरण परीक्षण, त्यसपछि नमूना परिमिति परिवर्तन गरेर उत्पादन मा प्रिमियम नमूना स्विच। कुनै छुट्टै परीक्षण वातावरण आवश्यक छ।

हाम्रो अधिकांश मोडेलहरू खुला स्रोत हुन् र स्व-होस्ट गर्न सकिन्छ। यद्यपि, स्व-होस्टिङले महत्वपूर्ण जीपीयू स्रोतहरू आवश्यक पर्दछ (हामीले 4x एनभिडिया टेस्ला P40 96GB VRAM कूल प्रयोग गर्दछौं)। एपीआईले पूर्वाधार व्यवस्थापन बिना लागत प्रभावकारी विकल्प प्रदान गर्दछ।
5.0/5 (1)

हामी के सुधार गर्न सक्छन्? आफ्नो प्रतिक्रिया हामीलाई समस्या समाधान गर्न मद्दत गर्दछ.

आवाज AI संग निर्माण गर्न तयार?

आफ्नो नि: शुल्क एपीआई कुञ्जी प्राप्त र निर्माण सुरु. 15 साइन अप मा क्रेडिट, नि: शुल्क मोडेल उपलब्ध, व्यापक कागजात.