ڊيولپرز لاءِ متن کان ڳالھائڻ وارو API

اسان جي REST API سان آواز جي اجازت ڏنل ايپليڪيشنون ٺاهيو. پنهنجي ايپليڪيشنن، چيٽ بوٽس، آواز جي مددگارن ۽ SaaS شين ۾ طبعي متن-to-speech، آواز جي کلوننگ، ڳالهائڻ-to-text، ۽ آڊيو پروسيسنگ شامل ڪريو. OpenAI-compatible فارميٽ، 24+ ماڊل، سادو انٽيگريشن.

REST API چيٽ بوٽ آواز جون ايپليڪيشنون SaaS مصنوعات خودڪار

هاڻي ڪوشش ڪريو

0/500
ڪوڪورو، پيپر، VITS، MeloTTS سان مفت
Your generated audio will appear here
پيدا ڪيل
0:00 0:00
ڊائون لوڊ
TTS.ai وانگر؟ پنھنجن دوستن کي چئو!

ڊيولپرن لاءِ API خاصيتون

سڀڪنھن شيءِ جو توھان کي آواز سان ڪم ڪندڙ ايپليڪيشنون ٺاهڻ جي ضرورت آھي

سادو REST API

هڪ POST درخواست ڳالهائڻ پيدا ڪرڻ لاءِ. JSON درخواست، آڊيو جواب. ڪنهن به پروگرامنگ ٻولي سان ڪم ڪري ٿي جيڪا HTTP کي سپورٽ ڪري ٿي.

OpenAI- مطابقت رکندڙ

OpenAI TTS API لاءِ ڊراپ-ان بدلو. پنھنجي base_url ۽ API کي تبديل ڪريو - موجوده ڪوڊ فوري طور ڪم ڪري ٿو.

دستياب ماڊل

هر ماڊل کي هڪ API ذريعي رسائي. هڪ ماڊل کي تبديل ڪرڻ سان ماڊل تبديل ڪريو. معيار، رفتار ۽ قيمت جو مقابلو ڪريو.

سيڪنڊ جي دير

ڪوڪورو 1 سيڪنڊ ۾ آڊيو پيدا ڪري ٿو. ريئل ٽائيم چيٽ بوٽس، آواز جي مددگارن، ۽ مقابلي وارين ايپليڪيشنن لاءِ مثالي.

آواز جي کلوننگ API

API ذريعي ڪنھن به آواز کي مختصر آڊيو نموني مان ڪلون ڪريو. سڀني پوين نسلن لاءِ ڪلون ٿيل آواز استعمال ڪريو.

گھڻيون شڪلون

WAV, MP3, OGG, يا FLAC جي صورت ۾ ٻاھر ڪڍ. نموني جي شرح ۽ بٽ جي اوچائي چونڊيو. ريئل ٽائيم ايپليڪيشنن لاءِ آڊيو اسٽريمنگ مدد.

ڊيولپر انٽيگريشن لاءِ بهترين ماڊل

پنھنجي پروگرام لاءِ صحيح ماڊل چونڊيو

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ھن لاءِ بهترين: تيزترين ماڊل - سيڪنڊ جي دير ، ريئل ٽائيم ايپليڪيشنن ۽ چيٽ بوٽس لاءِ مثالي

ڪوشش ڪريو Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 آواز جو کلون

ھن لاءِ بهترين: آواز جي مددگار ايپليڪيشنن لاءِ آواز جي ڪلوننگ سان TTS جي اسٽريمنگ

ڪوشش ڪريو CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ھن لاءِ بهترين: چٽ بوٽ ۽ مددگار آواز لاءِ قدرتي وقت سان رابطي وارو AI

ڪوشش ڪريو Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ھن لاءِ بهترين: مفت، صرف سي پي يو ماڊل وڏي حجم وارين ايپليڪيشنن لاءِ صفر ڪريڊٽ خرچن سان

ڪوشش ڪريو Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ھن لاءِ بهترين: تخليقي ۽ تفريحي ايپليڪيشنن لاءِ آواز جي اثرن سان آڊيو پيدا ڪريو

ڪوشش ڪريو Bark

TTS API کي ڪيئن شامل ڪجي

5 منٽن جي هيٺان پهرين API ڪالي ۾ رجسٽريشن کان

1

پنھنجي API ڪوڊ حاصل ڪريو

مفت ۾ رجسٽر ٿيو ۽ پنهنجي اڪائونٽ ڊيش بورڊ مان API ڪوڊ پيدا ڪريو. 50 ڪريڊٽ شامل آهن.

2

پنھنجو پھريون ڊيل ڪريو

POST to /v1/tts with text, model, and voice. آڊيو بائيٽس موٽائي وٺو. ڪوڊ جي 5 لائين هيٺ.

3

پنھنجو ماڊل چونڊيو

توهان جي استعمال جي صورت لاءِ مختلف ماڊل آزمايو. رفتار، معيار، ۽ هر نسل جي قيمت جو مقابلو ڪريو.

4

پيداوار لاءِ موڪليو

پيئڻ-جيئن-توهان-وڌيڪ ڪريڊٽس سان پيماني تي. ادا ڪيل منصوبن تي ڪو به شرح حدون نه آهن. پنهنجي ڊيش بورڊ ۾ استعمال کي نگراني ڪريو.

جلد شروع ڪوڊ جا مثال

اسان جي REST API سان ڪنهن به ٻولي ۾ TTS.ai کي شامل ڪريو

Python مشهوريون
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL عالمي
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI مطابقت رکندڙ شڪل ڊراپ- ان
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

ڊيولپرز TTS.ai سان ڇا ٺاهيندا آهن

عام انٽيگريشن نمونا ۽ ايپليڪيشنون

AI چيٽ بوٽس ۽ مددگار

پنھنجي چيٽ بوٽ يا AI مددگار کي آواز جو نتيجو شامل ڪريو. TTS ذريعي آواز جي اجازت ڏنل رابطن لاءِ LLM جا جواب پيپ ڪريو. ڪوڪورو حقيقي وقت جي گفتگو لاءِ سيڪنڊن جي دير سان پيش ڪري ٿو. Sesame CSM قدرتي وقت سان گفتگو واري ڳالهائڻ کي پيدا ڪري ٿو.

  • ڳالھائڻ جي پائيپ لائين لاءِ LLM جو جواب
  • ڪوڪورو سان سب- سيڪنڊ جي دير
  • Sesame CSM سان گفتگو وارو خطاب
  • آڊيو ٻاھر ڪڍڻ

موبائل ۽ آواز جون ايپليڪيشنون

آواز جي قابل موبائيل ايپليڪيشنون، رسائي جا اوزار، پڙهڻ جا ايپليڪيشنون ۽ ٻولي سکڻ جا پليٽ فارم ٺاهيو. اسان جو REST API ڪنهن به موبائيل فريم ورڪ سان ڪم ڪري ٿو. آڊيو فائلون ڊائون لوڊ ڪريو يا ڪلائنٽ کي سڌو سنئون منتقل ڪريو.

  • React Native, Flutter, Swift, Kotlin
  • رسائي ۽ پڙهڻ جون ايپليڪيشنون
  • ٻولي سکڻ جا پليٽ فارم
  • آڊيو مواد پيدا ڪرڻ

SaaS مصنوعات

توهان جي SaaS پيداوار ۾ ويٽ-ليبل آواز جي صلاحيت. TTS، STT، آواز کلوننگ، ۽ آڊيو پروسيسنگ کي توهان جي پليٽ فارم ۾ خاصيتن جي طور تي شامل ڪريو. اسان جي API کي توهان جي آواز بيڪ اينڊ جي طور تي استعمال ڪريو GPU جي ڍانچي کي منظم ڪرڻ کانسواءِ.

  • ويٽ-ليبل آواز جون خاصيتون
  • GPU جي بنياد جي ضرورت نه آھي
  • استعمال تي ادائگي
  • 24+ ماڊل توهان جي صارفين کي پيش ڪرڻ

خودڪار پائيپ لائين

CI / CD پائپ لائنن ۾ آواز جي پيدائش کي شامل ڪريو، مواد جي خودڪار، ۽ بيٽ پروسيسنگ ورڪ فلو. اسپيڊشيٽ ڊيٽا مان آڊيو فائلن جي هزارن کي پيدا ڪريو، پوڊ ڪاسٽ جي پيداوار کي خودڪار ڪريو، يا مواد جي مقامي پائيپ لائنن کي ٺاهيو.

  • API ذريعي بيٽ پروسيس
  • مواد جي مقامي پائيپ لائين
  • CI/CD انٽيگريشن
  • آڊيو آٽوميشن لاءِ اسپيڊشيٽ

API وضاحتون

پيداوار جي ايپليڪيشنن لاءِ ٺهيل

24+

TTS ماڊل

100+

آواز

30+

ٻوليون

<1s

ڪوڪورو

گھڻا پڇيا ويندا سوال

TTS.ai ڊيولپر API بابت عام سوال

ھائو. اسان جو API OpenAI آڊيو ڳالهائڻ جي فارميٽ تي عمل ڪندو آهي. جيڪڏھن اوھين OpenAI Python يا JavaScript ڪلينٽ لائبريري استعمال ڪري رهيا آھيو ته base_url ۽ api_key پيراميڊز کي تبديل ڪري TTS.ai تي تبديل ڪري سگھو ٿا. اوھان جو موجوده ڪوڊ بغير تبديلي جي ڪم ڪندو آھي.

ڪوڪورو عام جملن لاءِ 1 سيڪنڊ کان گهٽ ۾ آڊيو پيدا ڪري ٿو. CosyVoice 2 اڃا به گهٽ محسوس ڪيل دير لاءِ اسٽريمنگ آڪسائيٽ جي حمايت ڪري ٿو. چيٽ بوٽس ۽ آواز جي مددگارن لاءِ، مجموعي round-trip وقت عام طور تي 1-3 سيڪنڊ آهي، متن جي ڊيگهه ۽ ماڊل جي چونڊ تي منحصر آهي.

مفت ماڊل (Kokoro, Piper, VITS, MeloTTS) جي قيمت صفر ڪرنٽ آهي. معياري ماڊل جي قيمت 2 ڪرنٽ آهي هر 1,000 حروف. پريميئم ماڊل جي قيمت 4 ڪرنٽ آهي هر 1,000 حروف. 50 ڪرنٽ سان مفت ۾ رجسٽر ڪريو. منصوبا 500 ڪرنٽ لاءِ $ 9 / مهيني تي شروع ٿين ٿا.

ھائو. هڪ حوالو آڊيو نمونو (5-30 سيڪنڊ) آواز جي کلوننگ آخري نقطي تي اپ لوڊ ڪريو، پوءِ ڪلون ٿيل آواز جي ايڊريس کي آخري TTS درخواستن ۾ استعمال ڪريو. ماڊل جيڪي کلوننگ کي مدد ڏين ٿا تن ۾ CosyVoice 2، Chatterbox، Fish Speech، ۽ GPT-SoVITS شامل آهن.

مفت طبقي ۾ بنيادي شرح جي حد آهي (3 درخواستون ڪلاڪ ۾ اڪائونٽ کانسواءِ). ادا ڪيل منصوبن ۾ پيداوار جي ايپليڪيشنن لاءِ مناسب وڏيون شرحون آهن. ڪمپني جي سطح جي ضرورتن لاءِ اسان سان رابطو ڪريو.

WAV (نه ڳنڍيل، اعليٰ معيار)، MP3 ( ڳنڍيل، ننڍيون فائلون)، OGG (آزاد شڪل)، ۽ FLAC (بغير نقصان جي ڳنڍيل). پنھنجي درخواست ۾ شڪل جو نالو ڄاڻايو. ماڊل جي اصلي نموني جي شرح تي WAV ڊفالٽ آهي.

ھائو. اسان جي TTS API کي ڳالهائڻ کان متن تائين ماڊل ۽ هڪ LLM سان گڏجي هڪ مڪمل آواز جي مددگار پائپ لائن ٺاهيو. Kokoro حقيقي وقت جي گفتگو لاءِ مثالي سيڪنڊ جي دير فراهم ڪري ٿو. CosyVoice 2 اڃا به گهٽ محسوس رد عمل جي وقتن لاءِ اسٽريمنگ آڪسيجن جي حمايت ڪري ٿو.

CosyVoice 2 ۽ Kokoro اسٽريمنگ آڊيو آئوٽپوٽ جي حمايت ڪن ٿا جتي آڊيو ٽڪرا پيدا ڪيا وڃن ٿا جئين اهي پيدا ڪيا وڃن ٿا. اهو وقت-to-first-byte کي حقيقي وقت جي ايپليڪيشنن لاءِ گھٽائي ٿو جيئن ته آواز جا مددگار ۽ مقابلي وارا تجربا.

API معياري HTTP حالت ڪوڊ موٽائي ٿو. 5xx غلطين ۽ شرح حد جوابن لاءِ ايڪسپونينشل بيڪ آف کي لاڳو ڪريو. مشن-جديد ايپليڪيشنن لاءِ، ٻيهر ڪوشش منطق سان قافلو شامل ڪريو. اسان جي API ۾ اعليٰ آپٽ ٽائيم آهي پر هميشه صلاح ڏنل آهي.

ھائو. /v1/voices ۽ /v1/models انتهائي نقطا سڀني موجود آوازن ۽ ماڊلن جي JSON لسٽن کي سندن ميٽا ڊيٽا سان موٽائين ٿا (زباني مدد، معياري تصنيفون، رفتار تصنيفون، ۽ قيمتي طبقو). انھن کي پنھنجي ايپليڪيشن ۾ متحرڪ ماڊل چونڊيندڙن جي ٺاھڻ لاءِ استعمال ڪريو.

مفت ماڊل (Kokoro, Piper, VITS, MeloTTS) هڪ اثرائتي sandbox طور ڪم ڪن ٿا ڇاڪاڻ ته اهي صفر ڪريڊٽ خرچ ڪن ٿا. مفت ماڊل سان پنهنجي انٽيگريشن کي آزمايو، پوءِ ماڊل جي پيرا ميٽر کي تبديل ڪري پريميئم ماڊل ۾ تبديل ڪريو. ڪوبه الڳ ٽيسٽ ماحول جي ضرورت ناهي.

اسان جا اڪثر ماڊل اوپن سورس آهن ۽ پاڻ کي خودمختيار ڪري سگهجي ٿو. جيتوڻيڪ، پاڻ کي خودمختيار ڪرڻ جي ضرورت آهي قابل ذڪر GPU وسيلا (اسين 4x NVIDIA Tesla P40 استعمال ڪريون ٿا 96GB VRAM سان گڏ). API وسيلن جي انتظام کانسواءِ هڪ قيمتي متبادل فراهم ڪري ٿو.
5.0/5 (1)

آواز AI سان ٺاھڻ لاءِ تيار آھيو؟

پنهنجي مفت API ڪوڊ حاصل ڪريو ۽ ٺاھڻ شروع ڪريو. 50 ڪريڊٽس رجسٽريشن تي، مفت ماڊل دستياب، جامع دستاويز.