ڦيٿي / خاصيت جي درخواست رپورٽ ڪريو

ڊيولپرز لاءِ متن کان ڳالھائڻ وارو API

اسان جي REST API سان آواز جي اجازت واريون ايپليڪيشنون ٺاهيو. پنهنجي ايپليڪيشنن، چيٽ بوٽس، آواز جي مددگارن ۽ SaaS شين ۾ طبعي متن-to-speech، آواز جي کلوننگ، ڳالهائڻ-to-text، ۽ آڊيو پروسيسنگ شامل ڪريو. OpenAI-compatible فارميٽ، 20+ ماڊل، سادو انٽيگريشن.

REST API چيٽ بوٽ آواز جون ايپليڪيشنون SaaS مصنوعات خودڪار

مڪمل TTS ايڊيٽر API دستاويز

هاڻي ڪوشش ڪريو

0/500

ڪوڪورو، پيپر، VITS، MeloTTS سان مفت

پنھنجو پيدا ڪيل آڊيو اتي نظر ايندو

مڪمل TTS ايڊيٽر کوليو

ڊيولپرن لاءِ API خاصيتون

سڀڪنھن شيءِ جو توھان کي آواز سان ڪم ڪندڙ ايپليڪيشنون ٺاهڻ جي ضرورت آھي

سادو REST API

هڪ POST درخواست ڳالهائڻ پيدا ڪرڻ لاءِ. JSON درخواست، آڊيو جواب. ڪنهن به پروگرامنگ ٻولي سان ڪم ڪري ٿي جيڪا HTTP کي سپورٽ ڪري ٿي.

OpenAI- مطابقت رکندڙ

OpenAI TTS API لاءِ ڊراپ-ان بدلو. پنھنجي base_url ۽ API کي تبديل ڪريو - موجوده ڪوڊ فوري طور ڪم ڪري ٿو.

دستياب ماڊل

هر ماڊل کي هڪ API ذريعي رسائي. هڪ ماڊل کي تبديل ڪرڻ سان ماڊل تبديل ڪريو. معيار، رفتار ۽ قيمت جو مقابلو ڪريو.

سيڪنڊ جي دير

ڪوڪورو 1 سيڪنڊ ۾ آڊيو پيدا ڪري ٿو. ريئل ٽائيم چيٽ بوٽس، آواز جي مددگارن، ۽ مقابلي وارين ايپليڪيشنن لاءِ مثالي.

آواز جي کلوننگ API

API ذريعي ڪنھن به آواز کي مختصر آڊيو نموني مان ڪلون ڪريو. سڀني پوين نسلن لاءِ ڪلون ٿيل آواز استعمال ڪريو.

گھڻيون شڪلون

WAV, MP3, OGG, يا FLAC جي صورت ۾ ٻاھر ڪڍ. نموني جي شرح ۽ بٽ جي اوچائي چونڊيو. ريئل ٽائيم ايپليڪيشنن لاءِ آڊيو اسٽريمنگ مدد.

ڊيولپر انٽيگريشن لاءِ بهترين ماڊل

پنھنجي پروگرام لاءِ صحيح ماڊل چونڊيو

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

ويجھو 5/5

ھن لاءِ بهترين: تيزترين ماڊل - سيڪنڊ جي دير ، ريئل ٽائيم ايپليڪيشنن ۽ چيٽ بوٽس لاءِ مثالي

ڪوشش ڪريو Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ميڊيم 5/5 آواز جو کلون

ھن لاءِ بهترين: آواز جي مددگار ايپليڪيشنن لاءِ آواز جي ڪلوننگ سان TTS جي اسٽريمنگ

ڪوشش ڪريو CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

سست 5/5

ھن لاءِ بهترين: چٽ بوٽ ۽ مددگار آواز لاءِ قدرتي وقت سان رابطي وارو AI

ڪوشش ڪريو Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

ويجھو 3/5

ھن لاءِ بهترين: مفت، صرف سي پي يو ماڊل وڏي حجم وارين ايپليڪيشنن لاءِ صفر ڪريڊٽ خرچن سان

ڪوشش ڪريو Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

سست 4/5

ھن لاءِ بهترين: تخليقي ۽ تفريحي ايپليڪيشنن لاءِ آواز جي اثرن سان آڊيو پيدا ڪريو

ڪوشش ڪريو Bark

TTS API کي ڪيئن شامل ڪجي

5 منٽن جي هيٺان پهرين API ڪالي ۾ رجسٽريشن کان

پنھنجي API ڪوڊ حاصل ڪريو

مفت ۾ رجسٽر ٿيو ۽ پنهنجي اڪائونٽ ڊيش بورڊ مان API ڪوڊ پيدا ڪريو. 50 ڪريڊٽ شامل آهن.

پنھنجو پھريون ڊيل ڪريو

POST to /v1/tts with text, model, and voice. آڊيو بائيٽس موٽائي وٺو. ڪوڊ جي 5 لائين هيٺ.

پنھنجو ماڊل چونڊيو

توهان جي استعمال جي صورت لاءِ مختلف ماڊل آزمايو. رفتار، معيار، ۽ هر نسل جي قيمت جو مقابلو ڪريو.

پيداوار لاءِ موڪليو

پيئڻ-جيئن-توهان-وڌيڪ ڪريڊٽس سان پيماني تي. ادا ڪيل منصوبن تي ڪو به شرح حدون نه آهن. پنهنجي ڊيش بورڊ ۾ استعمال کي نگراني ڪريو.

جلد شروع ڪوڊ جا مثال

اسان جي REST API سان ڪنهن به ٻولي ۾ TTS.ai کي شامل ڪريو

Python مشهوريون

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL عالمي

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI مطابقت رکندڙ شڪل ڊراپ- ان

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

پنھنجي مفت API کيڏڻ

ڊيولپرز TTS.ai سان ڇا ٺاهيندا آهن

عام انٽيگريشن نمونا ۽ ايپليڪيشنون

AI چيٽ بوٽس ۽ مددگار

پنھنجي چيٽ بوٽ يا AI مددگار کي آواز جو نتيجو شامل ڪريو. TTS ذريعي آواز جي اجازت ڏنل رابطن لاءِ LLM جا جواب پيپ ڪريو. ڪوڪورو حقيقي وقت جي گفتگو لاءِ سيڪنڊن جي دير سان پيش ڪري ٿو. Sesame CSM قدرتي وقت سان گفتگو واري ڳالهائڻ کي پيدا ڪري ٿو.

ڳالھائڻ جي پائيپ لائين لاءِ LLM جو جواب
ڪوڪورو سان سب- سيڪنڊ جي دير
Sesame CSM سان گفتگو وارو خطاب
آڊيو ٻاھر ڪڍڻ

موبائل ۽ آواز جون ايپليڪيشنون

آواز جي قابل موبائيل ايپليڪيشنون، رسائي جا اوزار، پڙهڻ جا ايپليڪيشنون ۽ ٻولي سکڻ جا پليٽ فارم ٺاهيو. اسان جو REST API ڪنهن به موبائيل فريم ورڪ سان ڪم ڪري ٿو. آڊيو فائلون ڊائون لوڊ ڪريو يا ڪلائنٽ کي سڌو سنئون منتقل ڪريو.

React Native, Flutter, Swift, Kotlin
رسائي ۽ پڙهڻ جون ايپليڪيشنون
ٻولي سکڻ جا پليٽ فارم
آڊيو مواد پيدا ڪرڻ

SaaS مصنوعات

توهان جي SaaS پيداوار ۾ ويٽ-ليبل آواز جي صلاحيت. TTS، STT، آواز کلوننگ، ۽ آڊيو پروسيسنگ کي توهان جي پليٽ فارم ۾ خاصيتن جي طور تي شامل ڪريو. اسان جي API کي توهان جي آواز بيڪ اينڊ جي طور تي استعمال ڪريو GPU جي ڍانچي کي منظم ڪرڻ کانسواءِ.

ويٽ-ليبل آواز جون خاصيتون
GPU جي بنياد جي ضرورت نه آھي
استعمال تي ادائگي
20+ ماڊل توهان جي صارفين کي پيش ڪرڻ

خودڪار پائيپ لائين

CI / CD پائپ لائنن ۾ آواز جي پيدائش کي شامل ڪريو، مواد جي خودڪار، ۽ بيٽ پروسيسنگ ورڪ فلو. اسپيڊشيٽ ڊيٽا مان آڊيو فائلن جي هزارن کي پيدا ڪريو، پوڊ ڪاسٽ جي پيداوار کي خودڪار ڪريو، يا مواد جي مقامي پائيپ لائنن کي ٺاهيو.

API ذريعي بيٽ پروسيس
مواد جي مقامي پائيپ لائين
CI/CD انٽيگريشن
آڊيو آٽوميشن لاءِ اسپيڊشيٽ

مڪمل API دستاویز ڏسو

API وضاحتون

پيداوار جي ايپليڪيشنن لاءِ ٺهيل

20+

TTS ماڊل

100+

آواز

30+

ٻوليون

<1s

ڪوڪورو

مفت ۾ رجسٽر ٿيو — 15,000 characters

گھڻا پڇيا ويندا سوال

TTS.ai ڊيولپر API بابت عام سوال

ھائو. اسان جو API OpenAI آڊيو ڳالهائڻ جي فارميٽ تي عمل ڪندو آهي. جيڪڏھن اوھين OpenAI Python يا JavaScript ڪلينٽ لائبريري استعمال ڪري رهيا آھيو ته base_url ۽ api_key پيراميڊز کي تبديل ڪري TTS.ai تي تبديل ڪري سگھو ٿا. اوھان جو موجوده ڪوڊ بغير تبديلي جي ڪم ڪندو آھي.

ڪوڪورو عام جملن لاءِ 1 سيڪنڊ کان گهٽ ۾ آڊيو پيدا ڪري ٿو. CosyVoice 2 اڃا به گهٽ محسوس ڪيل دير لاءِ اسٽريمنگ آڪسائيٽ جي حمايت ڪري ٿو. چيٽ بوٽس ۽ آواز جي مددگارن لاءِ، مجموعي round-trip وقت عام طور تي 1-3 سيڪنڊ آهي، متن جي ڊيگهه ۽ ماڊل جي چونڊ تي منحصر آهي.

مفت ماڊل (Kokoro, Piper, VITS, MeloTTS) جي قيمت صفر ڪرنٽ آهي. معياري ماڊل جي قيمت 2 ڪرنٽ آهي هر 1,000 حروف. پريميئم ماڊل جي قيمت 4 ڪرنٽ آهي هر 1,000 حروف. 50 ڪرنٽ سان مفت ۾ رجسٽر ڪريو. منصوبا 500 ڪرنٽ لاءِ $ 9 / مهيني تي شروع ٿين ٿا.

ھائو. هڪ حوالو آڊيو نمونو (5-30 سيڪنڊ) آواز جي کلوننگ آخري نقطي تي اپ لوڊ ڪريو، پوءِ ڪلون ٿيل آواز جي ايڊريس کي آخري TTS درخواستن ۾ استعمال ڪريو. ماڊل جيڪي کلوننگ کي مدد ڏين ٿا تن ۾ CosyVoice 2، Chatterbox، Fish Speech، ۽ GPT-SoVITS شامل آهن.

مفت طبقي ۾ بنيادي شرح جي حد آهي (3 درخواستون ڪلاڪ ۾ اڪائونٽ کانسواءِ). ادا ڪيل منصوبن ۾ پيداوار جي ايپليڪيشنن لاءِ مناسب وڏيون شرحون آهن. ڪمپني جي سطح جي ضرورتن لاءِ اسان سان رابطو ڪريو.

WAV (نه ڳنڍيل، اعليٰ معيار)، MP3 ( ڳنڍيل، ننڍيون فائلون)، OGG (آزاد شڪل)، ۽ FLAC (بغير نقصان جي ڳنڍيل). پنھنجي درخواست ۾ شڪل جو نالو ڄاڻايو. ماڊل جي اصلي نموني جي شرح تي WAV ڊفالٽ آهي.

ھائو. اسان جي TTS API کي ڳالهائڻ کان متن تائين ماڊل ۽ هڪ LLM سان گڏجي هڪ مڪمل آواز جي مددگار پائپ لائن ٺاهيو. Kokoro حقيقي وقت جي گفتگو لاءِ مثالي سيڪنڊ جي دير فراهم ڪري ٿو. CosyVoice 2 اڃا به گهٽ محسوس رد عمل جي وقتن لاءِ اسٽريمنگ آڪسيجن جي حمايت ڪري ٿو.

CosyVoice 2 ۽ Kokoro اسٽريمنگ آڊيو آئوٽپوٽ جي حمايت ڪن ٿا جتي آڊيو ٽڪرا پيدا ڪيا وڃن ٿا جئين اهي پيدا ڪيا وڃن ٿا. اهو وقت-to-first-byte کي حقيقي وقت جي ايپليڪيشنن لاءِ گھٽائي ٿو جيئن ته آواز جا مددگار ۽ مقابلي وارا تجربا.

API معياري HTTP حالت ڪوڊ موٽائي ٿو. 5xx غلطين ۽ شرح حد جوابن لاءِ ايڪسپونينشل بيڪ آف کي لاڳو ڪريو. مشن-جديد ايپليڪيشنن لاءِ، ٻيهر ڪوشش منطق سان قافلو شامل ڪريو. اسان جي API ۾ اعليٰ آپٽ ٽائيم آهي پر هميشه صلاح ڏنل آهي.

ھائو. /v1/voices ۽ /v1/models انتهائي نقطا سڀني موجود آوازن ۽ ماڊلن جي JSON لسٽن کي سندن ميٽا ڊيٽا سان موٽائين ٿا (زباني مدد، معياري تصنيفون، رفتار تصنيفون، ۽ قيمتي طبقو). انھن کي پنھنجي ايپليڪيشن ۾ متحرڪ ماڊل چونڊيندڙن جي ٺاھڻ لاءِ استعمال ڪريو.

مفت ماڊل (Kokoro, Piper, VITS, MeloTTS) هڪ اثرائتي sandbox طور ڪم ڪن ٿا ڇاڪاڻ ته اهي صفر ڪريڊٽ خرچ ڪن ٿا. مفت ماڊل سان پنهنجي انٽيگريشن کي آزمايو، پوءِ ماڊل جي پيرا ميٽر کي تبديل ڪري پريميئم ماڊل ۾ تبديل ڪريو. ڪوبه الڳ ٽيسٽ ماحول جي ضرورت ناهي.

اسان جا اڪثر ماڊل اوپن سورس آهن ۽ پاڻ کي خودمختيار ڪري سگهجي ٿو. جيتوڻيڪ، پاڻ کي خودمختيار ڪرڻ جي ضرورت آهي قابل ذڪر GPU وسيلا (اسين 4x NVIDIA Tesla P40 استعمال ڪريون ٿا 96GB VRAM سان گڏ). API وسيلن جي انتظام کانسواءِ هڪ قيمتي متبادل فراهم ڪري ٿو.

5.0/5 (1)

آواز AI سان ٺاھڻ لاءِ تيار آھيو؟

پنهنجي مفت API ڪوڊ حاصل ڪريو ۽ ٺاھڻ شروع ڪريو. 50 ڪريڊٽس رجسٽريشن تي، مفت ماڊل دستياب، جامع دستاويز.

رجسٽر ڪريو قيمت ڏسو

ڊيولپرز لاءِ متن کان ڳالھائڻ وارو API

هاڻي ڪوشش ڪريو

TTS.ai کي پيارو آهي؟ پنھنجن دوستن کي چئو!

ڊيولپرن لاءِ API خاصيتون

سادو REST API

OpenAI- مطابقت رکندڙ

دستياب ماڊل

سيڪنڊ جي دير

آواز جي کلوننگ API

گھڻيون شڪلون

ڊيولپر انٽيگريشن لاءِ بهترين ماڊل

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API کي ڪيئن شامل ڪجي

پنھنجي API ڪوڊ حاصل ڪريو

پنھنجو پھريون ڊيل ڪريو

پنھنجو ماڊل چونڊيو

پيداوار لاءِ موڪليو

جلد شروع ڪوڊ جا مثال

ڊيولپرز TTS.ai سان ڇا ٺاهيندا آهن

AI چيٽ بوٽس ۽ مددگار

موبائل ۽ آواز جون ايپليڪيشنون

SaaS مصنوعات

خودڪار پائيپ لائين

API وضاحتون

گھڻا پڇيا ويندا سوال

ڇا API OpenAI TTS فارميٽ سان مطابقت رکي ٿو؟

ريئل-ٽائم ايپليڪيشنن لاءِ دير ڇا آهي؟

API استعمال لاءِ قيمت ڪيئن ڪم ڪري ٿي؟

آءٌ API ذريعي آواز جي کلوننگ استعمال ڪري سگهان ٿو؟

ڇا ڪا شرح جي حد آھي؟

API ڪھڙيون آڊيو شڪلون موٽائي ٿو؟

آءٌ آواز جي مددگار يا چيٽ بوٽ ٺاهڻ لاءِ API استعمال ڪري سگهان ٿو؟

ڇا ڪو ويب ساڪيٽ يا اسٽريمنگ API موجود آھي؟

مون کي پيداوار ۾ غلطين ۽ ٻيهر ڪوششن کي ڪيئن سنڀالجي؟

آءٌ پروگرامي طور موجود آوازن ۽ ماڊلن جي فهرست ڪري سگهان ٿو؟

ڇا ڪو رڻ باڪس يا ٽيسٽ ماحول موجود آهي؟

آءٌ API استعمال ڪرڻ جي بدران ماڊلز کي پاڻمرادو ميزبان ڪري سگهان ٿو؟

آواز AI سان ٺاھڻ لاءِ تيار آھيو؟