بگ / خصوصیت کی درخواست رپورٹ کریں

ڈیولپر کے لیے ٹیکس سے کلام API

ہماری REST API کے ساتھ آواز سے قابل ایپلیکیشن بناؤ۔ اپنے ایپلیکیشنز، چیٹ بٹس، وائٹ اسسٹنٹ اور SaaS مصنوعات میں قدرتی متن سے بولنے، بولنے کی کلوننگ، بولنے سے بولنے اور آڈیو پروسیسنگ شامل کریں۔ اوپن اے آئی-مطابق فارمیٹ، 20+ ماڈل، سادہ انٹیگریشن۔

REST API چیٹ باٹس آواز ایپلیکیشنز SaaS مصنوعات خودکار

مکمل TTS ایڈیٹر API دستاویزات

اب کوشش کریں

0/500

Kokoro, Piper, VITS, MeloTTS کے ساتھ مفت

آپ کی پیدا کی گئی آڈیو یہاں دکھائی دے گی

مکمل TTS ایڈیٹر کھولیں

ڈیولپر کے لیے API خصوصیات

آواز فعال ایپلیکیشن بنانے کے لیے آپ کو جو کچھ بھی ضرورت ہے

سادہ REST API

ایک POST درخواست آواز پیدا کرنے کے لیے. JSON درخواست، آڈیو جواب. کسی بھی پروگرامنگ زبان کے ساتھ کام کرتا ہے جو HTTP کو مدد دیتا ہے.

OpenAI سازگار

OpenAI TTS API کے لیے ڈراپ-این متبادل. آپ کا base_url اور API کلید بدلیں - موجود کوڈ فوراً کام کرتا ہے.

24+ ماڈل دستیاب

ہر ماڈل کو ایک API کے ذریعے رسائی ملے گی. ایک پیرامیٹر کو تبدیل کرکے ماڈل بدلیں. معیار، رفتار اور قیمت کو موازنہ کریں.

سب سیکنڈ لاٹنسی

Kokoro 1 سیکنڈ کے اندر اوڈيو بناتا هے ريل-ٽائم چیٹ باٹس، وائٹ اسسٹنٹز اور تعاملی ایپلیکيشنز کے ليے پورا

آواز کلوننگ API

API کے ذریعے مختصر اوڈيو نمونے سے کوئی آواز کلون کریں. تمام بعد کی نسلوں کے لیے کلون کی گئی آوازیں استعمال کریں.

متعدد فارمیٹ

WAV, MP3, OGG, or FLAC کے طور پر خروجی. نمونہ ریت اور بٹ گہرائی منتخب کریں. ریئل ٹائم ایپلیکیشنز کے لیے سٹریمینگ آڈیو حمایت.

ڈیولپر انٹیگریشن کے لئے بہترین ماڈل

آپ کے ایپلیکیشن کی رفتار، معیار اور لاگت کی ضرورتوں کے لیے صحیح ماڈل منتخب کریں

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

محفوظ 5/5

بہترین: سب سے تیز ماڈل - سب-سیکنڈ لاٹینسی، ریئل-ٹائم ایپلیکیشنز اور چیٹ بٹس کے لئے ایڈیل

کوشش کریں Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

متوسط 5/5 آواز کا کلوننگ

بہترین: آواز مددگار ایپلیکیشنز کے لیے آواز کلوننگ کے ساتھ TTS کی اسٹریمنگ

کوشش کریں CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

سست 5/5

بہترین: چیٹ بوٹ اور مددگار آواز کے لئے قدرتی وقت کے ساتھ گفتگو AI

کوشش کریں Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

محفوظ 3/5

بہترین: صفر خرچ پر اعلی حجم ایپلیکیشنز کے لئے مفت، صرف سی پی یو ماڈل

کوشش کریں Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

سست 4/5

بہترین: تخلیقی اور تفریحی ایپلیکیشنز کے لیے آواز کے اثرات کے ساتھ اوڈیو پیدا کرنا

کوشش کریں Bark

TTS API کو کیسے شامل کریں

5 منٹ کے اندر پہلی API کال کے لئے سائن اپ سے

آپ کی API کلید حاصل کریں

مفت میں رجسٹر کریں اور اپنے اکاؤنٹ کے ڈیش بورڈ سے ایک API کیج پیدا کریں۔ 15،000 حروف شامل ہیں۔

اپنا پہلا کال کریں

/v1/tts پر POST کريں متن ، ماڈل اور آواز کے ساتھ آ ڊيو با یٹز واپس لے۔ کو د کے 5 لائنوں کے تحت

اپنا ماڈل منتخب کریں

آپ کے استعمال کے معاملے کے لئے مختلف ماڈلز کا امتحان کریں. رفتار، معیار، اور ہر نسل کی قیمت کا موازنہ کریں.

پروڈکشن میں بھیجیں

پیج-آئز-آئز-گو کریڈٹ کے ساتھ پیمانہ. پیج پلانز پر کوئی شرح حدیں نہیں ہیں. اپنے ڈیش بورڈ میں استعمال کو دیکھیں.

کوڈ کی تیز شروع مثالیں

ہمارے REST API کے ساتھ کسی بھی زبان میں TTS.ai شامل کریں

Python مقبول

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL عالمی

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-مطابقت والی شکل ڈراپ-این

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

آپ کی مفت API کلید حاصل کریں

ڈیولپر TTS.ai کے ساتھ کیا بناتے ہیں

عام انٹیگریشن نمونے اور ایپلیکیشنز

AI چیٹ باٹس اور معاون

آپ کے چٹ باٹ يا AI اسسٹنٹ ميں آواز آ وٹ پائيپ LLM جوابات TTS کے ذریعے آواز فعال ائنٹر فيس کے ليے Kokoro ريئل ٽائم گفتگو کے ليے سب سیکشن ليٹنسي پيش کر تا هے Sesame CSM فطري ٽائمنگ کے ساتھ گفتگو کي آواز پيدا کر تا هے

زباني پائپ لائن کے ليے LLM جواب
Kokoro کے ساتھ سب سیکنڈ لاٹینسی
Sesame CSM کے ساتھ گفتگو کا خطاب
آڈیو خروجی

موبائل اور آواز ایپلیکیشنز

آواز سے قابل موبائل ایپلیکیشن بناؤ، رسائی کے آلات، پڑھنے کے ایپلیکیشنز، اور زبان سیکھنے کے پلیٹ فارم۔ ہمارا REST API کسی بھی موبائل فریم ورک کے ساتھ کام کرتا ہے۔ آڈیو فائلیں ڈاؤن لوڈ کریں یا کلائنٹ کو براہ راست اسٹریم کریں۔

ري ايکٹ نيچ، فلوٹر، سويفت، کوٹلين
رسائی اور پڑھنے کے ایپلیکیشنز
زبان سيکھنے کے پليٽ فارم
آڈیو مواد پیدا کرنا

SaaS مصنوعات

آپ کے SaaS مصنوعات میں وائٹ لیبل آواز کی صلاحیتیں. آپ کے پلیٹ فارم میں خصوصیات کے طور پر TTS، STT، آواز کلوننگ، اور آڈیو پروسیسنگ شامل کریں. GPU بنیادی ڈھانچے کو منیج کرنے کے بغیر آپ کی آواز کے باقائدہ کے طور پر ہماری API کا استعمال کریں.

وِيٹ ليبل ويز خصلت
کوئی GPU بنیادی ڈھانچے کی ضرورت نہیں
استعمال پر خرچ کی قیمت
آپ کے صارفين کو پیش کرنے کے لئے 20+ ماڈل

خودکار پائپ لائنز

CI/CD پائپ لائنز میں آواز کی پیداوار کو شامل کریں، مواد خودکار، اور بٹک پروسیسنگ ورک فلو. اسپریڈ شیٹ ڈیٹا سے ہزاروں آڈیو فائلیں پیدا کریں، پوڈکاسٹ پیداوار خودکار کریں، یا مواد مقامی پیپ لائنز بنائیں.

API کے ذریعے بٹک پروسیسنگ
مواد کی مقامی سازی پائپ لائنز
CI/CD انٹیگریشن
آڈیو خودکار کرنے کے لیے سپریڈ شیٹ

مکمل API دستاویزات دیکھیں

API وضاحتیں

پروڈکشن ایپلیکیشنز کے لئے بنایا گیا

20+

TTS ماڈل

100+

آوازیں

30+

زبانیں

<1s

لیٹنس (Kokoro)

مفت میں رجسٹر کریں — 15,000 حروف

بار بار پوچھے گئے سوالات

TTS.ai ڈیولپر API کے بارے میں عام سوالات

ہاں. ہمارا API OpenAI آڈیو کلام فارمیٹ کا پیرو کرتا ہے. اگر آپ OpenAI Python یا JavaScript کلائنٹ لائبریری کا استعمال کر رہے ہیں تو آپ base_url اور api_key پرائمرز کو تبدیل کر کے TTS.ai پر تبدیل کر سکتے ہیں. آپ کا موجودہ کوڈ بغیر تبدیلی کے کام کرتا ہے.

Kokoro عام جملوں کے ليے 1 سيکنڈ کے اندر او ديو پيدا کر تا هے CosyVoice2کوئي بھی کمي ليٹ نسي کے ليے سٹر يم آ وٹ پٹ کي مدد کر تا هے Chatbots اور ويز اسيسٹنٹس کے ليے کل راؤنڈ-ٹريپ وقت عام طور پر 1-3 سيکنڈ هے جس کا تعلق متن کے طول اور ماڈل کے انتخاب سے هے

فری ماڈل (Kokoro, Piper, VITS, MeloTTS) مکمل طور پر فری ہیں.سٹنڈرڈ ماڈل ہر 1K کے لیے 2x حروف استعمال کرتے ہیں.پریمیئم ماڈل ہر 1K کے لیے 4x حروف استعمال کرتے ہیں.15,000 حروف کے ساتھ فری رجسٹریشن کریں.پلان $9/مئی سے شروع ہوتے ہیں 500,000 حروف کے لئے.

جی ہاں، آواز کلوننگ انتہا پوائنٹ پر ایک حوالہ آڈیو نمونہ (5-30 سیکنڈ) اپ لوڈ کریں، پھر بعد میں TTS درخواستوں میں کلون کی گئی آواز ID استعمال کریں۔ کلوننگ کی حمایت کرنے والے ماڈلز میں CosyVoice 2، Chatterbox، Fish Speech، اور GPT-SoVITS شامل ہیں۔

فری ٹیئر میں بنیادی شرح حد بندی ہے (3 درخواستیں ہر گھنٹے ایک اکاؤنٹ کے بغیر). پیسے کے منصوبوں میں پیداوار کے ایپلیکیشنوں کے لئے مناسب وسیع شرح حدیں ہیں۔ انٹرپرائز سطح کی ٹرانسپورٹیشن ضروریات کے لئے ہمیں رابطہ کریں۔

WAV (نا دبا ہوا، اعلیٰ معیار)، MP3 ( دبا ہوا، چھوٹی فائل)، OGG (آزاد فارمیٹ)، اور FLAC (لا نقصان دباؤ). اپنی درخواست میں فارمیٹ کو بیان کریں۔ ماڈل کی اصلی نمونے کی شرح پر WAV دیفالٹ ہے۔

جی ہاں. ایک مکمل آواز معاون پائپ لائن بنانے کے لئے ایک کلام-تصویر ماڈل اور ایک LLM کے ساتھ ہماری TTS API کو جوڑیں. Kokoro ریئل-ٹائم گفتگو کے لئے سب-سیکنڈ لاٹنسی کی بہترین فراہم کرتا ہے. CosyVoice 2 بھی کم محسوس ردعمل کے وقت کے لئے اسٹریم آؤٹپوٹ کی حمایت کرتا ہے.

CosyVoice2 اور Kokoro سٹریمینگ اوڈیو آؤٹ پٹ کو مدد دیتے ہیں جہاں اوڈیو چانکس ان کے پیدا ہونے کے طور پر فراہم کیے جاتے ہیں. یہ ریئل-ٹائم ایپلیکیشنز جیسے وائٹ اسسٹنٹ اور تعاملی تجربات کے لیے وقت-سے-پہلی-بائٹ کو کم کرتا ہے.

API معیاری HTTP اسٹیٹس کوڈ واپس کرتا ہے. 5xx غلطیوں کے لیے افراطی backoff کو عمل میں لاتے ہیں اور ریت حد جوابات. مشن-کلیج ایپلیکیشنز کے لیے، ایک قطار کو دوبارہ کوشش منطق کے ساتھ شامل کریں. ہماری API میں اعلی آپٹیم ہے لیکن ہمیشگی غلطی ہینڈلنگ کی سفارش کی جاتی ہے.

ہاں. /v1/voices اور /v1/models انتہا پوائنٹ تمام دستیاب آوازوں اور ماڈلز کی JSON فهرستیں واپس کر تے ہیں انکے میٹا ڈیٹا کے ساتھ (زبان کی مدد، معیار کی درجہ بندی، رفتار کی درجہ بندی، اور قیمت کی سطح). انکو اپنے ایپلیکیشن میں متحرک ماڈل منتخب کرنے والے بنانے کے لیے استعمال کریں.

مفت ماڈل (Kokoro, Piper, VITS, MeloTTS) ایک موثر سنڈ باکس کے طور پر کام کرتے هيں کیونکہ وہ مکمل طور پر مفت هے ۔ مفت ماڈل کے ساتھ آپ کے انٽيگريشن کو ٹيسٹ کريں ، پھر ماڈل کے پيراميٹر کو تبديل کر کے پرائم ماڈل پر تبديل کريں ۔ کوئی جدا آزمائش ماحول ضروري نهيں هے

ہمارے زیادہ تر ماڈل اوپن سورس ہیں اور خود مہمان بنائے جا سکتے ہیں۔ تاہم، خود مہمان بنانے کے لئے اہم GPU وسائل کی ضرورت ہوتی ہے۔ (ہم 4x NVIDIA Tesla P40 کو 96GB VRAM کے ساتھ استعمال کرتے ہیں۔) API بنیادی ڈھانچے کے انتظام کے بغیر ایک قیمتی موثر متبادل فراہم کرتا ہے۔

5.0/5 (1)

آواز AI کے ساتھ بنانے کے لئے تیار ہیں؟

آپ کی مفت API کی کلید حاصل کریں اور تعمیر شروع کریں. 15 کریڈٹس پر سائن اپ، مفت ماڈل دستیاب، جامع دستاویزات.

مفت میں رجسٹر کریں قیمت دیکھیں

ڈیولپر کے لیے ٹیکس سے کلام API

اب کوشش کریں

TTS.ai سے محبت؟ اپنے دوستوں کو بتائیں!

ڈیولپر کے لیے API خصوصیات

سادہ REST API

OpenAI سازگار

24+ ماڈل دستیاب

سب سیکنڈ لاٹنسی

آواز کلوننگ API

متعدد فارمیٹ

ڈیولپر انٹیگریشن کے لئے بہترین ماڈل

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API کو کیسے شامل کریں

آپ کی API کلید حاصل کریں

اپنا پہلا کال کریں

اپنا ماڈل منتخب کریں

پروڈکشن میں بھیجیں

کوڈ کی تیز شروع مثالیں

ڈیولپر TTS.ai کے ساتھ کیا بناتے ہیں

AI چیٹ باٹس اور معاون

موبائل اور آواز ایپلیکیشنز

SaaS مصنوعات

خودکار پائپ لائنز

API وضاحتیں

بار بار پوچھے گئے سوالات

کیا API OpenAI TTS فارمیٹ کے ساتھ مطابقت رکھتا ہے؟

ریل-ٹائم ایپلیکیشنز کے لئے لاٹیسی کیا ہے؟

API استعمال کے لئے قیمتیں کیسے کام کرتی ہیں؟

کیا میں API کے ذریعے آواز کلوننگ استعمال کر سکتا ہوں؟

کیا ایک شرح حد ہے؟

API کیا آڈیو فارمیٹ واپس کرتا ہے؟

کیا میں آواز معاون یا چیٹ بوٹ بنانے کے لئے API کا استعمال کر سکتا ہوں؟

کیا وہاں ایک ویب ساکٹ یا اسٹریم API ہے؟

میں کس طرح غلطیوں اور پیداوار میں دوبارہ کوششوں کا انتظام کروں؟

کیا میں پروگرام کے ذریعے دستیاب آوازوں اور ماڈلز کی فہرست بنا سکتا ہوں؟

کیا کوئی سنڈ باکس یا ٹیسٹ ماحول موجود ہے؟

کیا میں API استعمال کرنے کی بجائے ماڈل خود مہمان کر سکتا ہوں؟

آواز AI کے ساتھ بنانے کے لئے تیار ہیں؟