د پرمخبيونکو لپاره د ليکنې څخه د وينا API

زموږ د REST API سره د غږ فعال غوښتنلیکونه جوړ کړئ. ستاسو غوښتنلیکونو، چیټبوټونو، غږ مرستیالانو او SaaS محصولاتو ته طبیعي متن-to-talk، غږ کلونینګ، غږ-to-text، او آډیو پروسس اضافه کړئ. د OpenAI-متوافق بڼه، 24+ ماډلونه، ساده ادغام.

REST API ګپ شپ غږيز کاريالونه SaaS محصولات خپلکارې

اوس هڅه کول

0/500
د Kokoro، Piper، VITS، MeloTTS سره وړیا
Your generated audio will appear here
جوړ شوی
0:00 0:00
رالېښنې
لکه TTS.ai؟ خپل ملګرو ته ووایاست!

د پراختیا کونکو لپاره API ځانګړتیاوې

هرڅه چې تاسو ته د غږ فعالو کاريالونو جوړولو لپاره اړين دي

ساده REST API

د وینا تولید لپاره یو POST غوښتنه. د JSON غوښتنه، غږیز ځواب. د هرې پروګرام کولو ژبې سره کار کوي چې د HTTP ملاتړ کوي.

OpenAI- برابرول

د OpenAI TTS API لپاره د ځای په ځای کولو لپاره. ستاسو د base_url او API کلیدي بدل کړئ - اوسنی کوډ سمدلاسه کار کوي.

24+ ماډلونه شتون لري

د یو واحد API له لارې هر ماډل ته لاسرسی. د یو پارامتر بدلولو سره ماډلونه بدل کړئ. د کیفیت، سرعت او لګښتونو پرتله کول.

دوېم پړاو ځنډ

کوکورو په 1 ثانیه کې آډیو تولیدوي. د ریښتیني وخت چیټ بوټونو، غږ مرستیالانو او تعاملي غوښتنلیکونو لپاره مثالی.

د غږ د نقلولو API

د API له لارې د لنډ غږيز نمونې څخه کوم غږ کلون کړئ. د ټولو راتلونکو نسلونو لپاره کلون شوي غږونه وکاروئ.

ګڼ بڼې

په توګه WAV، MP3، OGG، یا FLAC محصول. د نمونې کچه او د بیت ژور انتخاب کړئ. د ریښتیني وخت غوښتنلیکونو لپاره د اوریدلو ملاتړ.

د پراختیا کونکي ادغام لپاره غوره ماډلونه

د خپل غوښتنلیک لپاره سم ماډل وټاکئ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

د: لپاره غوره ترټولو چټک ماډل - د فرعي ثانوي latency، د ریښتیني وخت غوښتنلیکونو او chatbots لپاره مثالی

هڅه Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 غږ نقلول

د: لپاره غوره د غږ مرستيال غوښتنلیکونو لپاره د غږ کلونینګ سره د TTS سټرینګ

هڅه CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

د: لپاره غوره د chatbot او مرستیال غږ لپاره د طبیعي وخت سره خبرو اترو AI

هڅه Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

د: لپاره غوره د صفر کریډیټ لګښت سره د لوړ حجم غوښتنلیکونو لپاره وړیا، CPU-only ماډل

هڅه Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

د: لپاره غوره د خلاقیت او تفریح غوښتنلیکونو لپاره د غږ اغیزو سره غږیز نسل

هڅه Bark

د TTS API څنګه یوځای کړئ

د 5 دقیقو لاندې د لومړي API زنګ څخه د ننوتلو څخه

1

خپل API کیلي ترلاسه کړئ

د وړیا لپاره نوم لیکنه وکړئ او د خپل حساب ډشبورډ څخه د API کیلي رامینځته کړئ. د 50 کریډیټونه شامل دي.

2

خپل لومړی اړيکنيو وکړﺉ

د متن ، ماډل ، او غږ سره / v1 / tts ته پوسټ کړئ. د غږ بایټونه بیرته ترلاسه کړئ. د کوډ 5 کرښو لاندې.

3

خپل ماډل وټاکئ

د خپل کار د قضیې لپاره مختلف ماډلونه ازموینه. سرعت، کیفیت، او لګښت په هر نسل پرتله.

4

تولید ته لیږدول

د تادیه شوي پلانونو په اړه هیڅ نرخ محدودیتونه نشته. ستاسو په ډشبورډ کې د کارولو څارنه وکړئ.

د چټک پېل کوډ بېلګه

زموږ د REST API سره په هر ژبه کې TTS.ai یوځای کړئ

Python مشهور
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL ټولګړی
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
تړلې بڼه OpenAI ننوتل
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

د TTS.ai سره څه جوړونکي جوړوي

عام ادغام نمونې او غوښتنلیکونه

AI Chatbots او مرستیالان

ستاسو د چیټبټ یا AI مرستیال ته د غږ غږ اضافه کړئ. د غږ فعال شوي انٹرفیسونو لپاره د TTS له لارې د LLM غبرګونونه پایپ کړئ. کوکورو د ریښتیني وخت خبرو اترو لپاره د ثانوي ثانوي لنډیز وړاندې کوي. د سیسم CSM د طبیعي وخت سره د خبرو اترو وینا تولیدوي.

  • د وینا پایپ لاین ته د LLM ځواب
  • د کوکورو سره فرعي ثانوي ځنډ
  • د Sesame CSM سره خبرو اترو وینا
  • غږيزه وتۍ لېږل

ګرځنده او غږ کاريالونه

د غږ فعال شوي ګرځنده غوښتنلیکونه، د لاسرسي وسیلې، د لوست غوښتنلیکونه او د ژبې زده کړې پلیټ فارمونه جوړ کړئ. زموږ REST API د هر ډول ګرځنده چوکاټ سره کار کوي. د آډیو فایلونه ډاونلوډ کړئ یا مستقیم پیرودونکي ته جریان ورکړئ.

  • د واکسین اصلي، فلټر، سویفټ، کوټلین
  • لاسرسي او لوست کاريالونه
  • د ژبې د زده کړې پلیټونه
  • غږيز منځپانګې توليد

SaaS محصولات

ستاسو په SaaS محصول کې د سپینې لیبل غږ وړتیاوې. د TTS، STT، غږ کلونینګ، او آډیو پروسس په توګه ستاسو په پلیټ فارم کې ځانګړتیاوې اضافه کړئ. زموږ API د GPU زیربنا مدیریت کولو پرته ستاسو د غږ backend په توګه وکاروئ.

  • د سپينې نښکې غږ ځانګړتياوې
  • هېڅ GPU زیربنا اړينه نه ده
  • د کارونې پر بنسټ لګښت
  • 24+ ماډلونه ستاسو د کاروونکو وړاندې کولو لپاره

اتومات پایپ لاینونه

د CI / CD پایپ لاینونو، د مینځپانګې اتومات کولو، او د ډله ایز پروسس کولو کاري جریانونو کې د غږ تولید یوځای کړئ. د سپیډشیټ ډاټا څخه د آډیو فایلونو زرګونه رامینځته کړئ، د پوډکاسټ تولید اتومات کړئ، یا د مینځپانګې ځایی کولو پایپ لاینونه جوړ کړئ.

  • د API له لارې ډله پروسس
  • د منځپانګې د ځایي کولو پایپ لاینونه
  • د CI / CD ادغام
  • د غږيز خودکارۍ لپاره پاڼه

API ځانګړتياوې

د تولید غوښتنلیکونو لپاره جوړ شوی

24+

بېلګه TTS

100+

غږونه

30+

ژبې

<1s

ځنډ (کوکورو)

ډېرې پوښتنې

د TTS.ai پراختیا کونکي API په اړه عام پوښتنې

هو. زموږ API د OpenAI آډیو وینا بڼه تعقیبوي. که تاسو د OpenAI Python یا JavaScript پیرودونکي کتابتون کاروئ، تاسو کولی شئ د base_url او api_key پارامترونو بدلولو سره TTS.ai ته لاړشئ. ستاسو اوسنی کوډ د بدلون پرته کار کوي.

کوکورو د معمول جملو لپاره د 1 ثانیې لاندې آډیو رامینځته کوي. CosyVoice 2 د حتی ټیټ لیدل شوي latency لپاره د جریان محصول ملاتړ کوي. د چیټ بوټونو او غږ مرستیالانو لپاره، د ټول سفر سفر وخت معمولا د متن اوږدوالي او ماډل انتخاب پورې اړه لري 1-3 ثانیې.

وړیا ماډلونه (کوکورو، پیپر، VITS، MeloTTS) صفر کریډیټونه لګښت لري. معیاري ماډلونه د 2 کریډیټونو لګښتونه د 1,000 کرکټرونو لپاره. د پریمیم ماډلونو لګښتونه د 4 کریډیټونو لګښتونه د 1,000 کرکټرونو لپاره. د 50 کریډیټونو سره وړیا راجستر کړئ. پلانونه د 500 کریډیټونو لپاره په $ 9 / میاشت کې پیل کیږي.

هو. د غږ کلونینګ پای ټکي ته د حوالې آډیو نمونې (5-30 ثانیې) پورته کړئ، بیا په راتلونکو TTS غوښتنو کې د کلون شوي غږ ID وکاروئ. د کلونینګ ملاتړ کونکي ماډلونه د CosyVoice 2، Chatterbox، د کب وینا، او GPT-SoVITS شامل دي.

وړیا کچه د اساسي نرخ محدودیت لري (د حساب پرته په ساعت کې د 3 غوښتنې). د تادیې شوي پلانونه د تولید غوښتنلیکونو لپاره د مناسب نرخ حدونه لري. د شرکت کچې اړتیاو لپاره موږ سره اړیکه ونیسئ.

WAV (uncompressed، تر ټولو لوړ کیفیت)، MP3 (compressed، کوچنۍ دوتنې)، OGG (پرانيستې بڼه)، او FLAC (lossless د فشار). په خپل غوښتنلیک کې د بڼه وټاکئ. تلواله په د ماډل د اصلي نمونې نرخ WAV ده.

هو. زموږ د TTS API د خبرو اترو لپاره د متن ماډل او د LLM سره یوځای کړئ ترڅو د بشپړ غږ مرستیال پایپ لاین جوړ کړي. کوکورو د ریښتیني وخت خبرو اترو لپاره د فرعي ثانوي لاټینسي ایډیال چمتو کوي. CosyVoice 2 د حتی ټیټ احساس شوي ځواب وختونو لپاره د جریان محصول ملاتړ کوي.

CosyVoice 2 او Kokoro د سټرینګ آډیو محصول ملاتړ کوي چیرې چې د آډیو ټوټې وړاندې کیږي لکه څنګه چې دوی رامینځته کیږي. دا د ریښتیني وخت غوښتنلیکونو لپاره د وخت څخه تر لومړي بایټ پورې کموي لکه د غږ مرستیالان او تعاملي تجربې.

API د معیاري HTTP وضعیت کوډونه بیرته راګرځوي. د 5xx غلطیو او د نرخ حد ځوابونو لپاره اغیزمن backoff پلي کړئ. د ماموریت-مهم غوښتنلیکونو لپاره، د بیا هڅې منطق سره قطار اضافه کړئ. زموږ API لوړ وخت لري، مګر د ستونزې حل کول تل سپارښتنه کیږي.

هو. د / v1 / غږونه او / v1 / ماډلونه پای ټکي د ټولو شتون لرونکو غږونو او ماډلونو JSON لیستونه د دوی د میټا ډاټا سره (د ژبې ملاتړ، د کیفیت درجه بندي، د سرعت درجه بندي، او د قیمت کچه) بیرته راولي. دا د خپل غوښتنلیک کې د متحرک ماډل انتخاب کونکي جوړولو لپاره وکاروئ.

وړیا ماډلونه (Kokoro، Piper، VITS، MeloTTS) د اغیزمن سنډبکس په توګه کار کوي ځکه چې دوی صفر کریډیټونه لګوي. د وړیا ماډلونو سره ستاسو ادغام ازموینه وکړئ، بیا د ماډل پارامتر بدلولو سره په تولید کې د پریمیم ماډلونو ته لاړ شئ. هیڅ جلا ازموینې چاپیریال ته اړتیا نشته.

زموږ ډیری ماډلونه خلاص سرچینه دي او کولی شي ځان کوربه شي. په هرصورت، ځان کوربه کول د پام وړ GPU سرچینو ته اړتیا لري (موږ د 4x NVIDIA Tesla P40 سره د 96GB VRAM سره کاروو). API د زیربنا مدیریت پرته د لګښت موثره بدیل چمتو کوي.
5.0/5 (1)

د غږ AI جوړولو لپاره چمتو؟

خپل وړیا API کیلي ترلاسه کړئ او ودانۍ پیل کړئ. د 50 کریډیټونه په راجستر کې، وړیا ماډلونه شتون لري، جامع اسناد.