ڈیولپر کے لیے ٹیکس سے کلام API

ہماری REST API کے ساتھ آواز سے قابل ایپلیکیشن بناؤ۔ اپنے ایپلیکیشنز، چیٹ بٹس، وائٹ اسسٹنٹ اور SaaS مصنوعات میں قدرتی متن سے بولنے، بولنے کی کلوننگ، بولنے سے بولنے اور آڈیو پروسیسنگ شامل کریں۔ اوپن اے آئی-مطابق فارمیٹ، 20+ ماڈل، سادہ انٹیگریشن۔

REST API چیٹ باٹس آواز ایپلیکیشنز SaaS مصنوعات خودکار

اب کوشش کریں

Kokoro, Piper, VITS, MeloTTS کے ساتھ مفت
آپ کی پیدا کی گئی آڈیو یہاں دکھائی دے گی
پیدا کیا گیا
ڈاؤن لوڈ
TTS.ai سے محبت؟ اپنے دوستوں کو بتائیں!

ڈیولپر کے لیے API خصوصیات

آواز فعال ایپلیکیشن بنانے کے لیے آپ کو جو کچھ بھی ضرورت ہے

سادہ REST API

ایک POST درخواست آواز پیدا کرنے کے لیے. JSON درخواست، آڈیو جواب. کسی بھی پروگرامنگ زبان کے ساتھ کام کرتا ہے جو HTTP کو مدد دیتا ہے.

OpenAI سازگار

OpenAI TTS API کے لیے ڈراپ-این متبادل. آپ کا base_url اور API کلید بدلیں - موجود کوڈ فوراً کام کرتا ہے.

24+ ماڈل دستیاب

ہر ماڈل کو ایک API کے ذریعے رسائی ملے گی. ایک پیرامیٹر کو تبدیل کرکے ماڈل بدلیں. معیار، رفتار اور قیمت کو موازنہ کریں.

سب سیکنڈ لاٹنسی

Kokoro 1 سیکنڈ کے اندر اوڈيو بناتا هے ريل-ٽائم چیٹ باٹس، وائٹ اسسٹنٹز اور تعاملی ایپلیکيشنز کے ليے پورا

آواز کلوننگ API

API کے ذریعے مختصر اوڈيو نمونے سے کوئی آواز کلون کریں. تمام بعد کی نسلوں کے لیے کلون کی گئی آوازیں استعمال کریں.

متعدد فارمیٹ

WAV, MP3, OGG, or FLAC کے طور پر خروجی. نمونہ ریت اور بٹ گہرائی منتخب کریں. ریئل ٹائم ایپلیکیشنز کے لیے سٹریمینگ آڈیو حمایت.

ڈیولپر انٹیگریشن کے لئے بہترین ماڈل

آپ کے ایپلیکیشن کی رفتار، معیار اور لاگت کی ضرورتوں کے لیے صحیح ماڈل منتخب کریں

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

بہترین: سب سے تیز ماڈل - سب-سیکنڈ لاٹینسی، ریئل-ٹائم ایپلیکیشنز اور چیٹ بٹس کے لئے ایڈیل

کوشش کریں Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 آواز کا کلوننگ

بہترین: آواز مددگار ایپلیکیشنز کے لیے آواز کلوننگ کے ساتھ TTS کی اسٹریمنگ

کوشش کریں CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

بہترین: چیٹ بوٹ اور مددگار آواز کے لئے قدرتی وقت کے ساتھ گفتگو AI

کوشش کریں Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

بہترین: صفر خرچ پر اعلی حجم ایپلیکیشنز کے لئے مفت، صرف سی پی یو ماڈل

کوشش کریں Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

بہترین: تخلیقی اور تفریحی ایپلیکیشنز کے لیے آواز کے اثرات کے ساتھ اوڈیو پیدا کرنا

کوشش کریں Bark

TTS API کو کیسے شامل کریں

5 منٹ کے اندر پہلی API کال کے لئے سائن اپ سے

1

آپ کی API کلید حاصل کریں

مفت میں رجسٹر کریں اور اپنے اکاؤنٹ کے ڈیش بورڈ سے ایک API کیج پیدا کریں۔ 15،000 حروف شامل ہیں۔

2

اپنا پہلا کال کریں

/v1/tts پر POST کريں متن ، ماڈل اور آواز کے ساتھ آ ڊيو با یٹز واپس لے۔ کو د کے 5 لائنوں کے تحت

3

اپنا ماڈل منتخب کریں

آپ کے استعمال کے معاملے کے لئے مختلف ماڈلز کا امتحان کریں. رفتار، معیار، اور ہر نسل کی قیمت کا موازنہ کریں.

4

پروڈکشن میں بھیجیں

پیج-آئز-آئز-گو کریڈٹ کے ساتھ پیمانہ. پیج پلانز پر کوئی شرح حدیں نہیں ہیں. اپنے ڈیش بورڈ میں استعمال کو دیکھیں.

کوڈ کی تیز شروع مثالیں

ہمارے REST API کے ساتھ کسی بھی زبان میں TTS.ai شامل کریں

Python مقبول
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL عالمی
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-مطابقت والی شکل ڈراپ-این
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

ڈیولپر TTS.ai کے ساتھ کیا بناتے ہیں

عام انٹیگریشن نمونے اور ایپلیکیشنز

AI چیٹ باٹس اور معاون

آپ کے چٹ باٹ يا AI اسسٹنٹ ميں آواز آ وٹ پائيپ LLM جوابات TTS کے ذریعے آواز فعال ائنٹر فيس کے ليے Kokoro ريئل ٽائم گفتگو کے ليے سب سیکشن ليٹنسي پيش کر تا هے Sesame CSM فطري ٽائمنگ کے ساتھ گفتگو کي آواز پيدا کر تا هے

  • زباني پائپ لائن کے ليے LLM جواب
  • Kokoro کے ساتھ سب سیکنڈ لاٹینسی
  • Sesame CSM کے ساتھ گفتگو کا خطاب
  • آڈیو خروجی

موبائل اور آواز ایپلیکیشنز

آواز سے قابل موبائل ایپلیکیشن بناؤ، رسائی کے آلات، پڑھنے کے ایپلیکیشنز، اور زبان سیکھنے کے پلیٹ فارم۔ ہمارا REST API کسی بھی موبائل فریم ورک کے ساتھ کام کرتا ہے۔ آڈیو فائلیں ڈاؤن لوڈ کریں یا کلائنٹ کو براہ راست اسٹریم کریں۔

  • ري ايکٹ نيچ، فلوٹر، سويفت، کوٹلين
  • رسائی اور پڑھنے کے ایپلیکیشنز
  • زبان سيکھنے کے پليٽ فارم
  • آڈیو مواد پیدا کرنا

SaaS مصنوعات

آپ کے SaaS مصنوعات میں وائٹ لیبل آواز کی صلاحیتیں. آپ کے پلیٹ فارم میں خصوصیات کے طور پر TTS، STT، آواز کلوننگ، اور آڈیو پروسیسنگ شامل کریں. GPU بنیادی ڈھانچے کو منیج کرنے کے بغیر آپ کی آواز کے باقائدہ کے طور پر ہماری API کا استعمال کریں.

  • وِيٹ ليبل ويز خصلت
  • کوئی GPU بنیادی ڈھانچے کی ضرورت نہیں
  • استعمال پر خرچ کی قیمت
  • آپ کے صارفين کو پیش کرنے کے لئے 20+ ماڈل

خودکار پائپ لائنز

CI/CD پائپ لائنز میں آواز کی پیداوار کو شامل کریں، مواد خودکار، اور بٹک پروسیسنگ ورک فلو. اسپریڈ شیٹ ڈیٹا سے ہزاروں آڈیو فائلیں پیدا کریں، پوڈکاسٹ پیداوار خودکار کریں، یا مواد مقامی پیپ لائنز بنائیں.

  • API کے ذریعے بٹک پروسیسنگ
  • مواد کی مقامی سازی پائپ لائنز
  • CI/CD انٹیگریشن
  • آڈیو خودکار کرنے کے لیے سپریڈ شیٹ

API وضاحتیں

پروڈکشن ایپلیکیشنز کے لئے بنایا گیا

20+

TTS ماڈل

100+

آوازیں

30+

زبانیں

<1s

لیٹنس (Kokoro)

بار بار پوچھے گئے سوالات

TTS.ai ڈیولپر API کے بارے میں عام سوالات

ہاں. ہمارا API OpenAI آڈیو کلام فارمیٹ کا پیرو کرتا ہے. اگر آپ OpenAI Python یا JavaScript کلائنٹ لائبریری کا استعمال کر رہے ہیں تو آپ base_url اور api_key پرائمرز کو تبدیل کر کے TTS.ai پر تبدیل کر سکتے ہیں. آپ کا موجودہ کوڈ بغیر تبدیلی کے کام کرتا ہے.

Kokoro عام جملوں کے ليے 1 سيکنڈ کے اندر او ديو پيدا کر تا هے CosyVoice2کوئي بھی کمي ليٹ نسي کے ليے سٹر يم آ وٹ پٹ کي مدد کر تا هے Chatbots اور ويز اسيسٹنٹس کے ليے کل راؤنڈ-ٹريپ وقت عام طور پر 1-3 سيکنڈ هے جس کا تعلق متن کے طول اور ماڈل کے انتخاب سے هے

فری ماڈل (Kokoro, Piper, VITS, MeloTTS) مکمل طور پر فری ہیں.سٹنڈرڈ ماڈل ہر 1K کے لیے 2x حروف استعمال کرتے ہیں.پریمیئم ماڈل ہر 1K کے لیے 4x حروف استعمال کرتے ہیں.15,000 حروف کے ساتھ فری رجسٹریشن کریں.پلان $9/مئی سے شروع ہوتے ہیں 500,000 حروف کے لئے.

جی ہاں، آواز کلوننگ انتہا پوائنٹ پر ایک حوالہ آڈیو نمونہ (5-30 سیکنڈ) اپ لوڈ کریں، پھر بعد میں TTS درخواستوں میں کلون کی گئی آواز ID استعمال کریں۔ کلوننگ کی حمایت کرنے والے ماڈلز میں CosyVoice 2، Chatterbox، Fish Speech، اور GPT-SoVITS شامل ہیں۔

فری ٹیئر میں بنیادی شرح حد بندی ہے (3 درخواستیں ہر گھنٹے ایک اکاؤنٹ کے بغیر). پیسے کے منصوبوں میں پیداوار کے ایپلیکیشنوں کے لئے مناسب وسیع شرح حدیں ہیں۔ انٹرپرائز سطح کی ٹرانسپورٹیشن ضروریات کے لئے ہمیں رابطہ کریں۔

WAV (نا دبا ہوا، اعلیٰ معیار)، MP3 ( دبا ہوا، چھوٹی فائل)، OGG (آزاد فارمیٹ)، اور FLAC (لا نقصان دباؤ). اپنی درخواست میں فارمیٹ کو بیان کریں۔ ماڈل کی اصلی نمونے کی شرح پر WAV دیفالٹ ہے۔

جی ہاں. ایک مکمل آواز معاون پائپ لائن بنانے کے لئے ایک کلام-تصویر ماڈل اور ایک LLM کے ساتھ ہماری TTS API کو جوڑیں. Kokoro ریئل-ٹائم گفتگو کے لئے سب-سیکنڈ لاٹنسی کی بہترین فراہم کرتا ہے. CosyVoice 2 بھی کم محسوس ردعمل کے وقت کے لئے اسٹریم آؤٹپوٹ کی حمایت کرتا ہے.

CosyVoice2 اور Kokoro سٹریمینگ اوڈیو آؤٹ پٹ کو مدد دیتے ہیں جہاں اوڈیو چانکس ان کے پیدا ہونے کے طور پر فراہم کیے جاتے ہیں. یہ ریئل-ٹائم ایپلیکیشنز جیسے وائٹ اسسٹنٹ اور تعاملی تجربات کے لیے وقت-سے-پہلی-بائٹ کو کم کرتا ہے.

API معیاری HTTP اسٹیٹس کوڈ واپس کرتا ہے. 5xx غلطیوں کے لیے افراطی backoff کو عمل میں لاتے ہیں اور ریت حد جوابات. مشن-کلیج ایپلیکیشنز کے لیے، ایک قطار کو دوبارہ کوشش منطق کے ساتھ شامل کریں. ہماری API میں اعلی آپٹیم ہے لیکن ہمیشگی غلطی ہینڈلنگ کی سفارش کی جاتی ہے.

ہاں. /v1/voices اور /v1/models انتہا پوائنٹ تمام دستیاب آوازوں اور ماڈلز کی JSON فهرستیں واپس کر تے ہیں انکے میٹا ڈیٹا کے ساتھ (زبان کی مدد، معیار کی درجہ بندی، رفتار کی درجہ بندی، اور قیمت کی سطح). انکو اپنے ایپلیکیشن میں متحرک ماڈل منتخب کرنے والے بنانے کے لیے استعمال کریں.

مفت ماڈل (Kokoro, Piper, VITS, MeloTTS) ایک موثر سنڈ باکس کے طور پر کام کرتے هيں کیونکہ وہ مکمل طور پر مفت هے ۔ مفت ماڈل کے ساتھ آپ کے انٽيگريشن کو ٹيسٹ کريں ، پھر ماڈل کے پيراميٹر کو تبديل کر کے پرائم ماڈل پر تبديل کريں ۔ کوئی جدا آزمائش ماحول ضروري نهيں هے

ہمارے زیادہ تر ماڈل اوپن سورس ہیں اور خود مہمان بنائے جا سکتے ہیں۔ تاہم، خود مہمان بنانے کے لئے اہم GPU وسائل کی ضرورت ہوتی ہے۔ (ہم 4x NVIDIA Tesla P40 کو 96GB VRAM کے ساتھ استعمال کرتے ہیں۔) API بنیادی ڈھانچے کے انتظام کے بغیر ایک قیمتی موثر متبادل فراہم کرتا ہے۔
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

آواز AI کے ساتھ بنانے کے لئے تیار ہیں؟

آپ کی مفت API کی کلید حاصل کریں اور تعمیر شروع کریں. 15 کریڈٹس پر سائن اپ، مفت ماڈل دستیاب، جامع دستاویزات.