विकासकर्ताका लागि पाठबाट भाषण एपीआईName

हाम्रो REST API संग आवाज-सक्षम अनुप्रयोगहरू निर्माण गर्नुहोस्। आफ्नो अनुप्रयोगहरू, च्याटबोटहरू, आवाज सहायकहरू र SaaS उत्पादनहरूमा प्राकृतिक पाठ-देखि-भाषण, आवाज क्लोनिंग, भाषण-देखि-पाठ र अडियो प्रोसेसिंग थप्नुहोस्। OpenAI-संगत ढाँचा, 20+ मोडेल, सरल एकीकरण।

REST एपीआई च्याटबोटहरू आवाज अनुप्रयोगName SaaS उत्पादनहरू स्वचालित

पूर्ण TTS सम्पादक API कागजात

अहिले प्रयास गर्नुहोस्

0/500

कोकोरो, पाइपर, भिट्स, मेलोटीटीएससँग निःशुल्क

तपाईँको सिर्जना गरिएको अडियो यहाँ देखा पर्नेछ

पूर्ण TTS सम्पादक खोल्नुहोस्

विकासकर्ताहरूका लागि API विशेषताहरू

तपाईँलाई आवाज सक्षम अनुप्रयोगहरू निर्माण गर्न आवश्यक सबै कुराName

साधारण REST API

भाषण सिर्जना गर्न एक POST अनुरोध। JSON अनुरोध, अडियो प्रतिक्रिया। HTTP समर्थन गर्ने कुनै पनि प्रोग्रामिङ भाषासँग काम गर्दछ।

खुला AI- मिल्दो

OpenAI TTS एपीआई लागि ड्रप-मा प्रतिस्थापन. आफ्नो base_url र एपीआई कुञ्जी स्विच - अवस्थित कोड तुरुन्तै काम.

24+ मोडेल उपलब्ध

एकल एपीआई मार्फत हरेक नमूना पहुँच। एक मापदण्ड परिवर्तन गरेर नमूना स्विच। गुणस्तर, गति र लागत तुलना।

उप-सेकेन्ड लाटेन्सी

कोकोरो 1 सेकेन्डमा अडियो उत्पन्न गर्दछ। वास्तविक समय च्याटबोट्स, आवाज सहायक र अन्तरक्रियात्मक अनुप्रयोगहरूको लागि उत्तम।

आवाज क्लोनिङ API

एपीआई मार्फत छोटो अडियो नमूनाबाट कुनै पनि आवाज क्लोन गर्नुहोस् । सबै पछिल्लो पुस्ताका लागि क्लोन गरिएको आवाज प्रयोग गर्नुहोस् ।

बहुविध ढाँचा

WAV, MP3, OGG, वा FLAC को रूपमा निर्गत गर्नुहोस् । नमूना दर र बिट गहिराइ रोज्नुहोस् । वास्तविक समय अनुप्रयोगका लागि स्ट्रिमिङ अडियो समर्थन ।

विकासकर्ता एकीकरणको लागि सर्वश्रेष्ठ मोडेलहरू

आफ्नो अनुप्रयोगको गति, गुणस्तर, र लागत आवश्यकताहरूको लागि सही मोडेल रोज्नुहोस्

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

स्थिर 5/5

यसका लागि उत्तम: छिटो मोडेल - उप-सेकेन्ड latency, वास्तविक-समय अनुप्रयोगहरू र chatbots लागि आदर्श

प्रयास गर्नुहोस् Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

मध्यम 5/5 आवाज क्लोनिङ

यसका लागि उत्तम: आवाज सहायक अनुप्रयोगका लागि आवाज क्लोनिङसँग TTS स्ट्रिमिङ

प्रयास गर्नुहोस् CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

ढिलो 5/5

यसका लागि उत्तम: च्याटबोट र सहायक आवाज लागि प्राकृतिक समय संग Conversational AI

प्रयास गर्नुहोस् Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

स्थिर 3/5

यसका लागि उत्तम: शून्य क्रेडिट लागतको साथ उच्च-भोल्युम अनुप्रयोगहरूको लागि नि: शुल्क, सीपीयू-मात्र मोडेल

प्रयास गर्नुहोस् Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ढिलो 4/5

यसका लागि उत्तम: रचनात्मक र मनोरञ्जन अनुप्रयोगहरूका लागि ध्वनि प्रभावहरूसँग अडियो सिर्जना

प्रयास गर्नुहोस् Bark

TTS API कसरी एकीकृत गर्ने

पहिलो API कल मा साइन अप देखि5मिनेट

तपाईँको एपीआई कुञ्जी प्राप्त गर्नुहोस्

नि: शुल्क लागि साइन अप र आफ्नो खाता डैशबोर्ड देखि एक एपीआई कुञ्जी उत्पन्न. 15,000 क्यारेक्टर समावेश.

तपाईँको पहिलो कल गर्नुहोस्

पाठ, नमूना, र आवाज संग / v1 / tts पोस्ट. अडियो बाइट्स फिर्ता प्राप्त. अन्तर्गत5कोड लाइनहरू.

तपाईँको नमूना रोज्नुहोस्

आफ्नो प्रयोग मामला लागि विभिन्न मोडेल परीक्षण। गति, गुणस्तर, र प्रति पुस्ता लागत तुलना।

उत्पादनमा जहाज

तपाईं-जाने रूपमा भुक्तानी क्यारेक्टरहरूसँग स्केल गर्नुहोस्। भुक्तानी योजनाहरूमा कुनै दर सीमाहरू छैन। आफ्नो डैशबोर्डमा प्रयोग निगरानी गर्नुहोस्।

द्रुत सुरुआत सङ्केत उदाहरण

हाम्रो REST API संग कुनै पनि भाषामा TTS.ai एकीकृत गर्नुहोस्

Python लोकप्रिय

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL विश्वव्यापी

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

खुला AI- मिल्दो ढाँचा ड्रप-इन

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

आफ्नो निःशुल्क एपीआई कुञ्जी प्राप्त गर्नुहोस्

के विकासकर्ताहरू TTS.ai सँग निर्माण गर्दछन्

सामान्य एकीकरण ढाँचा र अनुप्रयोगहरू

AI च्याटबोटहरू र सहायकहरू

आफ्नो च्याटबोट वा एआई सहायकमा आवाज आउटपुट थप्नुहोस्। आवाज-सक्षम इन्टरफेसहरूको लागि TTS मार्फत पाइप LLM प्रतिक्रियाहरू। कोकोरोले वास्तविक समय वार्तालापहरूको लागि उप-सेकेन्ड लाटेन्सी प्रदान गर्दछ। सेसा CSM प्राकृतिक समय संग संवादात्मक भाषण उत्पन्न गर्दछ।

भाषण पाइपलाइनमा LLM प्रतिक्रिया
कोकोरोसँग उप-सेकेन्ड लाटेन्सी
यसको प्रकाशन काठमाडौंमा मासिक अवधिमा हुन्छ।
अडियो निर्गत स्ट्रिमिङ

मोबाइल र आवाज अनुप्रयोगName

आवाज-सक्षम मोबाइल अनुप्रयोगहरू, पहुँच उपकरणहरू, पढ्ने अनुप्रयोगहरू र भाषा सिक्ने प्लेटफर्महरू निर्माण गर्नुहोस्। हाम्रो REST API कुनै पनि मोबाइल फ्रेमवर्कसँग काम गर्दछ। अडियो फाइलहरू डाउनलोड गर्नुहोस् वा ग्राहकलाई सीधा प्रवाह गर्नुहोस्।

रिअक्ट नेटिव, फ्ल्युटर, स्विफ्ट, कोटलिन
पहुँचता र पढ्ने अनुप्रयोगहरू
भाषा सिक्ने प्लेटफर्महरू
अडियो सामग्री सिर्जना

SaaS उत्पादनहरू

तपाईंको SaaS उत्पादनमा सेतो-लेबल आवाज क्षमताहरू। TTS, STT, आवाज क्लोनिंग, र अडियो प्रोसेसिंग तपाईंको प्लेटफर्ममा सुविधाहरूको रूपमा थप्नुहोस्। GPU पूर्वाधार व्यवस्थापन बिना तपाईंको आवाज ब्याकएन्डको रूपमा हाम्रो API प्रयोग गर्नुहोस्।

सेतो लेबुल आवाज विशेषताहरू
GPU पूर्वाधार आवश्यक छैन
प्रयोग प्रति-शुल्क मूल्याङ्कन
आफ्नो प्रयोगकर्ताहरू प्रस्ताव गर्न 20+ मोडेल

स्वचालित पाइपलाइनहरू

CI / CD पाइपलाइनहरू, सामग्री स्वचालन र ब्याच प्रोसेसिंग कार्यप्रवाहहरूमा आवाज उत्पादन एकीकृत गर्नुहोस्। स्प्रेडशीट डाटाबाट अडियो फाइलहरूको हजारौं उत्पन्न गर्नुहोस्, पोडकास्ट उत्पादन स्वचालित गर्नुहोस्, वा सामग्री स्थानीयकरण पाइपलाइनहरू निर्माण गर्नुहोस्।

एपीआई मार्फत ब्याच प्रक्रिया
सामग्री स्थानीयकरण पाइपलाइनहरू
CI/CD एकीकरण
अडियो स्वचालित गर्न स्प्रेडसिट

पूरा API मिसिलीकरण हेर्नुहोस्

API निर्दिष्टीकरण

उत्पादन अनुप्रयोगहरूका लागि निर्माण गरिएको

20+

TTS नमूना

100+

आवाजहरू

30+

भाषाहरू

<1s

लाटेन्सी (Kokoro)

निःशुल्क दर्ता गर्नुहोस् — 15,000 क्यारेक्टरहरू

प्राय सोधिने प्रश्नहरू

TTS.ai विकासकर्ता एपीआई बारेमा सामान्य प्रश्नहरू

हो। हाम्रो API OpenAI अडियो भाषण ढाँचा पालना गर्दछ। यदि तपाईं OpenAI पाइथन वा जाभास्क्रिप्ट क्लाइन्ट लाइब्रेरी प्रयोग गर्दै हुनुहुन्छ भने, तपाईं base_url र api_key परिमितिहरू परिवर्तन गरेर TTS.ai मा स्विच गर्न सक्नुहुन्छ। तपाईँको अवस्थित कोड परिवर्तन बिना काम गर्दछ।

कोकोरो सामान्य वाक्यहरूको लागि 1 सेकेन्डमा अडियो उत्पन्न गर्दछ। CosyVoice2ले अझै पनि कम धारणा गरिएको लाटेन्सीको लागि स्ट्रिमिङ निर्गत समर्थन गर्दछ। च्याटबोटहरू र आवाज सहायकहरूको लागि, कुल राउन्ड-ट्रिप समय सामान्यतया पाठ लम्बाइ र मोडेलको विकल्पमा निर्भर 1-3 सेकेन्ड हो।

नि: शुल्क मोडेल (कोकोरो, पाइपर, VITS, MeloTTS) पूर्ण रूपमा नि: शुल्क छन्। मानक मोडेलहरू पाठको प्रति 1K प्रति 2x क्यारेक्टरहरू प्रयोग गर्दछ। प्रिमियम मोडेलहरू पाठको प्रति 1K प्रति 4x क्यारेक्टरहरू प्रयोग गर्दछ। 15,000 क्यारेक्टरहरूसँग नि: शुल्क साइन अप गर्नुहोस्। योजनाहरू 500,000 क्यारेक्टरहरूको लागि $9/month मा सुरु हुन्छ।

हो । एउटा सन्दर्भ अडियो नमूना (५-३० सेकेन्ड) आवाज क्लोनिङ अन्त बिन्दुमा अपलोड गर्नुहोस्, त्यसपछि पछिल्लो TTS अनुरोधमा क्लोन गरिएको आवाज आईडी प्रयोग गर्नुहोस् । क्लोनिङ समर्थन गर्ने नमूनाहरूमा कोसीभाइज २, च्याटरबक्स, माछा वक्तव्य र GPT-SoVITS समावेश छन् ।

नि: शुल्क तहमा आधारभूत दर सीमित छ (3 खाता बिना प्रति घण्टा अनुरोधहरू)। भुक्तानी योजनाहरू उत्पादन अनुप्रयोगहरूको लागि उपयुक्त उदार दर सीमाहरू छन्। उद्यम स्तर थ्रुपुट आवश्यकताहरूको लागि हामीलाई सम्पर्क गर्नुहोस्।

WAV (असङ्कुचित, उच्चतम गुणस्तर), MP3 (सङ्कुचित, साना फाइल), OGG (खोलिएको ढाँचा), र FLAC (नष्टविहिन सङ्कुचन) । तपाईँको अनुरोधमा ढाँचा निर्दिष्ट गर्नुहोस् । पूर्वनिर्धारित मोडेलको मौलिक नमूना दरमा WAV हो ।

हो। एक पूर्ण आवाज सहायक पाइपलाइन निर्माण गर्न एक भाषण-देखि-पाठ मोडेल र एक LLM संग हाम्रो TTS API संयोजन गर्नुहोस्। कोकोरोले वास्तविक समय कुराकानी लागि उप-सेकेन्ड लाटेन्सी आदर्श प्रदान गर्दछ। CosyVoice2ले अझै पनि कम धारणा प्रतिक्रिया समयको लागि स्ट्रिमिंग आउटपुट समर्थन गर्दछ।

कोसीभोइस २ र कोकोरोले स्ट्रिमिङ अडियो निर्गतलाई समर्थन गर्दछ जहाँ अडियो टुक्राहरू तिनीहरू उत्पन्न भए जस्तै वितरण गरिन्छ । यसले आवाज सहायकहरू र अन्तरक्रियात्मक अनुभवहरू जस्तै वास्तविक समय अनुप्रयोगहरूका लागि समय-देखि-पहिलो-बाईट घटाउँछ ।

एपीआई मानक एचटीटीपी स्थिति कोड फर्काउँछ। 5xx त्रुटिहरू र दर सीमा प्रतिक्रियाहरूको लागि घातीय ब्याकअफ लागू गर्नुहोस्। मिशन-महत्वपूर्ण अनुप्रयोगहरूको लागि, फेरि प्रयास तर्कसँग लाम थप्नुहोस्। हाम्रो एपीआई उच्च अपटाइम छ तर लचीला त्रुटि ह्यान्डलिंग सधैं सिफारिस गरिन्छ।

हो । /v1/voices र /v1/models अन्त बिन्दुले तिनीहरूको मेटाडेटा (भाषा समर्थन, गुणस्तर मूल्याङ्कन, गति मूल्याङ्कन, र मूल्य निर्धारण तह) सँग सबै उपलब्ध आवाज र नमूनाहरूको JSON सूचीहरू फर्काउँछ । तपाईँको अनुप्रयोगमा गतिशील नमूना चयनकर्ताहरू निर्माण गर्न यी प्रयोग गर्नुहोस् ।

निःशुल्क नमूना (Kokoro, Piper, VITS, MeloTTS) तिनीहरूले शून्य क्रेडिट लागत देखि प्रभावकारी स्यान्डबक्स रूपमा सेवा। निःशुल्क नमूना संग आफ्नो एकीकरण परीक्षण, त्यसपछि नमूना परिमिति परिवर्तन गरेर उत्पादन मा प्रिमियम नमूना स्विच। कुनै छुट्टै परीक्षण वातावरण आवश्यक छ।

हाम्रो अधिकांश मोडेलहरू खुला स्रोत हुन् र स्व-होस्ट गर्न सकिन्छ। यद्यपि, स्व-होस्टिङले महत्वपूर्ण जीपीयू स्रोतहरू आवश्यक पर्दछ (हामीले 4x एनभिडिया टेस्ला P40 96GB VRAM कूल प्रयोग गर्दछौं)। एपीआईले पूर्वाधार व्यवस्थापन बिना लागत प्रभावकारी विकल्प प्रदान गर्दछ।

5.0/5 (1)

आवाज AI संग निर्माण गर्न तयार?

आफ्नो नि: शुल्क एपीआई कुञ्जी प्राप्त र निर्माण सुरु. 15 साइन अप मा क्रेडिट, नि: शुल्क मोडेल उपलब्ध, व्यापक कागजात.

निःशुल्क दर्ता गर्नुहोस् मूल्याङ्कन हेर्नुहोस्

विकासकर्ताका लागि पाठबाट भाषण एपीआईName

अहिले प्रयास गर्नुहोस्

TTS.ai प्रेम? आफ्नो साथीहरूलाई भन्नुहोस्!

विकासकर्ताहरूका लागि API विशेषताहरू

साधारण REST API

खुला AI- मिल्दो

24+ मोडेल उपलब्ध

उप-सेकेन्ड लाटेन्सी

आवाज क्लोनिङ API

बहुविध ढाँचा

विकासकर्ता एकीकरणको लागि सर्वश्रेष्ठ मोडेलहरू

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API कसरी एकीकृत गर्ने

तपाईँको एपीआई कुञ्जी प्राप्त गर्नुहोस्

तपाईँको पहिलो कल गर्नुहोस्

तपाईँको नमूना रोज्नुहोस्

उत्पादनमा जहाज

द्रुत सुरुआत सङ्केत उदाहरण

के विकासकर्ताहरू TTS.ai सँग निर्माण गर्दछन्

AI च्याटबोटहरू र सहायकहरू

मोबाइल र आवाज अनुप्रयोगName

SaaS उत्पादनहरू

स्वचालित पाइपलाइनहरू

API निर्दिष्टीकरण

प्राय सोधिने प्रश्नहरू

यो API OpenAI TTS ढाँचा संग मिल्दो छ?

वास्तविक समय अनुप्रयोगहरूको लागि latency के हो?

कसरी मूल्यांकन एपीआई प्रयोग लागि काम गर्छ?

म एपीआई मार्फत आवाज क्लोन प्रयोग गर्न सक्छु?

त्यहाँ दर सीमा छ?

कुन अडियो ढाँचाहरू एपीआईले फर्काउँछ?

म एक आवाज सहायक वा च्याटबोट निर्माण गर्न एपीआई प्रयोग गर्न सक्छन्?

त्यहाँ एक WebSocket वा स्ट्रिमिंग API छ?

म कसरी उत्पादन मा त्रुटिहरू र retries ह्यान्डल गर्ने?

म उपलब्ध आवाज र नमूनाहरू सूचीबद्ध गर्न सक्छु?

के त्यहाँ स्यान्डबक्स वा परीक्षण परिवेश छ?

म एपीआई प्रयोग को सट्टा मोडेल स्व-होस्ट गर्न सक्छन्?

आवाज AI संग निर्माण गर्न तयार?