Bug / Feature Request များ တင်ပြရန်

Developers များအတွက် စာသားမှစကားပြော API

ကျွန်ုပ်တို့၏ REST API နှင့်အတူ voice-enabled applications များကိုတည်ဆောက်ပါ။ သင့်ရဲ့ app များ၊ chatbots၊ voice assistants နှင့် SaaS ထုတ်ကုန်များသို့သဘာဝစာသား-to-စကားပြောခြင်း၊ စကားပြော-to-စာသားနှင့်အသံစီမံခန့်ခွဲမှုကိုထည့်သွင်းပါ။ OpenAI-ကိုက်ညီသော format, 20+ မော်ဒယ်များ၊ ရိုးရှင်းသောပေါင်းစည်းခြင်း။

REST API စကားပြောစက်များ အသံအက်ပလီကေးရှင်းများ SaaS ထုတ်ကုန်များ အလိုအလျောက်

ပြည့်စုံသော TTS တည်းဖြတ်သူ API စာရွက်စာတမ်းများ

အခုစမ်းကြည့်ပါ

0/500

Kokoro, Piper, VITS, MeloTTS နှင့်အတူအခမဲ့

သင့်ထုတ်လုပ်ထားသော အသံဖိုင်သည်ဒီနေရာတွင်ပေါ်လာမည်

TTS တည်းဖြတ်သူကို ဖွင့်ပါ

Developers များအတွက် API အင်္ဂါရပ်များ

အသံထောက်ပံ့ထားသော အက်ပလီကေးရှင်းများကို တည်ဆောက်ရန် လိုအပ်သောအရာအားလုံး

ရိုးရှင်းသော REST API ကို

စကားပြောထုတ်လုပ်ရန်တစ်ဦး POST ကိုတောင်းဆို. JSON ကိုတောင်းဆို, အသံတုံ့ပြန်မှု. HTTP ကိုထောက်ခံကြောင်းမည်သည့်ပရိုဂရမ်ရေးဆွဲဘာသာစကားနှင့်အတူအလုပ်လုပ်.

OpenAI-ကိုက်ညီ

OpenAI TTS API ကိုများအတွက် Drop-in ကိုအစားထိုး. သင့်ရဲ့ base_url နှင့် API ကိုခလုတ်ကို Switch — လက်ရှိ code ကိုချက်ချင်းအလုပ်လုပ်တယ်.

24+ မော်ဒယ်များရရှိနိုင်

တစ်ခုတည်း API ကိုမှတဆင့်တိုင်းမော်ဒယ်ကို Access. တစ်ခု parameter ကိုပြောင်းလဲခြင်းအားဖြင့်မော်ဒယ်များ Switch. အရည်အသွေး, အမြန်နှုန်းနှင့်ကုန်ကျစရိတ်နှိုင်းယှဉ်.

ဒုတိယပိုင်း နောက်ကျမှု

Kokoro တွင်အောက်တွင်အသံထုတ်လုပ် 1 စက္ကန့်. အစစ်အမှန်အချိန် chatbots, အသံအကူများအတွက်ပြီးပြည့်စုံသော, နှင့်အပြန်အလှန် application များ.

Voice Cloning API

တိုတောင်းတဲ့ အသံနမူနာကနေ API ကနေ အသံကို ကူးယူပါ။ နောက်ဆက်တွဲမျိုးဆက်များအတွက် ကူးယူထားတဲ့ အသံတွေကို အသုံးပြုပါ။

အမျိုးအစားပေါင်းစုံ

WAV အဖြစ် output ကို, MP3, OGG, သို့မဟုတ် FLAC. နမူနာနှုန်းနှင့် bit အနက်ကိုရွေးချယ်ပါ. အစစ်အမှန်အချိန် apps များများအတွက် streaming audio ကိုထောက်ခံမှု.

Developer ပေါင်းစည်းမှုအတွက်အကောင်းဆုံးမော်ဒယ်များ

သင့်ရဲ့ application ရဲ့အမြန်နှုန်း, အရည်အသွေးနှင့်ကုန်ကျစရိတ်လိုအပ်ချက်များကိုများအတွက်မှန်ကန်သောပုံစံကိုရွေးချယ်ပါ

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

အကောင်းဆုံး: အမြန်ဆုံးမော်ဒယ် - sub-စက္ကန့် latency, အစစ်အမှန်အချိန် apps များနှင့် chatbots များအတွက်အသင့်တော်ဆုံး

စမ်းကြည့်ပါ Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 အသံခိုးယူခြင်း

အကောင်းဆုံး: အသံထောက်အပံ့ အက်ပလီကေးရှင်းများအတွက် အသံခိုးယူခြင်းနှင့်အတူ TTS စီးဆင်းခြင်း

စမ်းကြည့်ပါ CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

အကောင်းဆုံး: chatbot နှင့်အကူအညီအသံများအတွက်သဘာဝအချိန်နှင့်အတူ Conversational AI

စမ်းကြည့်ပါ Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

အကောင်းဆုံး: အခမဲ့, စတုတ္ထခရက်ဒစ်ကုန်ကျစရိတ်နှင့်အတူအမြင့်-အရွယ်အစား application များအတွက် CPU-only ကိုမော်ဒယ်

စမ်းကြည့်ပါ Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

အကောင်းဆုံး: ဖန်တီးမှုနှင့်ဖျော်ဖြေရေး အက်ပလီကေးရှင်းများအတွက် အသံသက်ရောက်မှုများနှင့်အတူ အသံဖိုင်များ ထုတ်လုပ်ခြင်း

စမ်းကြည့်ပါ Bark

TTS API ကိုပေါင်းစပ်နည်း

တွင်အောက်တွင်ပထမဦးဆုံး API ကိုခေါ်ဆိုမှုမှ signup မှ5မိနစ်

သင့်ရဲ့ API ကို Key ကို Get

အခမဲ့အတွက်မှတ်ပုံတင်ပြီးသင့်အကောင့် dashboard မှ API ကို key ကို generate. 15,000 characters included.

သင်၏ပထမဦးဆုံးခေါ်ဆိုမှုလုပ်ပါ

POST to /v1/tts with text, model, and voice. audio bytes back get. Code ၏အောက်တွင်5လိုင်းများ.

သင့်ရဲ့ Model ကိုရွေးချယ်ပါ

သင့်ရဲ့အသုံးပြုမှုဖြစ်ရပ်များအတွက်ကွဲပြားခြားနားသောမော်ဒယ်များကိုစမ်းသပ်ပါ။ အမြန်နှုန်း, အရည်အသွေးနှင့်မျိုးဆက်တစ်ဆက်လျှင်ကုန်ကျစရိတ်ကိုနှိုင်းယှဉ်ပါ။

ထုတ်လုပ်မှုသို့သင်္ဘော

ပေးဆောင်-as-you-go စာလုံးများနှင့်အတူ Scale. ပေးဆောင်အစီအစဉ်များအပေါ်အနှုန်းအကန့်အသတ်မရှိ. သင့်ရဲ့ dashboard မှာအသုံးပြုမှုကိုစောင့်ကြည့်.

ချက်ချင်းစတင်ကုဒ်ဥပမာများ

ကျွန်တော်တို့ရဲ့ REST API နဲ့အတူမည်သည့်ဘာသာစကားတွင် TTS.ai ပေါင်းစပ်

Python ခေတ်စား

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL ကမ္ဘာလုံးဆိုင်ရာ

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-ကိုက်ညီသော ပုံစံ ဖြုတ်ချပါ

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

သင်၏အခမဲ့ API ကို Key ကို Get

TTS.ai ဖြင့် developer များတည်ဆောက်

ယေဘုယျပေါင်းစပ်ပုံစံများနှင့် application များ

AI Chatbots & amp; assistents

Kokoro real-time စကားပြောဆိုမှုများအတွက် sub-စက္ကန့် latency ပေးပို့. Sesame CSM သဘာဝအချိန်နှင့်အတူစကားပြောစကားကို generates.

စကားပြော pipeline ကို LLM တုံ့ပြန်မှု
Kokoro နှင့်အတူ sub-second latency
Sesame CSM နှင့် စကားပြောဆိုခြင်း
အသံထွက်ကို စီးဆင်းစေပါ

မိုဘိုင်းနှင့်အသံ Apps များ

Build voice-enabled mobile apps, accessibility tools, reading apps, and language learning platforms. Our REST API works with any mobile framework. Download audio files or stream directly to the client.

React Native, Flutter, Swift, Kotlin
အသုံးပြုနိုင်မှုနှင့် ဖတ်ရှုခြင်း အက်ပလီကေးရှင်း
ဘာသာစကားသင်ယူရေးပလက်ဖောင်း
အသံ အကြောင်းအရာ ထုတ်လုပ်ခြင်း

SaaS ထုတ်ကုန်များ

သင့်ရဲ့ SaaS ထုတ်ကုန်ထဲမှာအဖြူရောင်-label ကိုအသံစွမ်းဆောင်ရည်. add TTS, STT, အသံ cloning, နှင့်သင်၏ပလက်ဖောင်းထဲမှာ features တွေအဖြစ်အသံစီမံခန့်ခွဲမှု. GPU အခြေခံအဆောက်အအုံစီမံခန့်ခွဲခြင်းမရှိဘဲသင်၏အသံ backend အဖြစ်ကျွန်တော်တို့ရဲ့ API ကိုသုံးပါ.

White-label အသံအင်္ဂါရပ်များ
GPU အခြေခံအဆောက်အအုံ မလိုပါ
အသုံးပြုမှု-per-စျေးနှုန်းသတ်မှတ်ချက်
20+ သင့်ရဲ့အသုံးပြုသူများကိုပေးဆောင်ရန်မော်ဒယ်များ

အလိုအလျောက်ပိုက်လိုင်း

CI / CD ပို့ဆောင်ရေးလိုင်းများ, အကြောင်းအရာအလိုအလျောက်, နှင့် batch စီမံခန့်ခွဲမှုလုပ်ငန်းစဉ်များသို့အသံ generation ကိုပေါင်းစပ်။ စာရင်းဇယားဒေတာမှ audio files ထောင်ပေါင်းများစွာကို generate, podcast ထုတ်လုပ်မှုအလိုအလျောက်, သို့မဟုတ်အကြောင်းအရာဒေသခံပို့ဆောင်ရေးလိုင်းများတည်ဆောက်။

API ကိုမှတဆင့် batch စီမံခန့်ခွဲမှု
အကြောင်းအရာဒေသဆိုင်ရာပိုက်လိုင်းများ
CI / CD ကိုပေါင်းစပ်
အသံအလိုအလျောက်ဖို့ Spreadsheet

ကြည့်ရှုအပြည့်အဝ API ကိုစာရွက်စာတမ်းများ

API ကို Specifications

ထုတ်လုပ်မှု applications များများအတွက်တည်ဆောက်

20+

TTS မော်ဒယ်များ

100+

အသံများ

30+

ဘာသာစကားများ

<1s

အချိန်ကြာမြင့်မှု (Kokoro)

အခမဲ့ Sign Up — 15,000 စာလုံးများ

မေးလေ့ရှိသောမေးခွန်းများ

TTS.ai developer API အကြောင်းကိုရိုးရှင်းတဲ့မေးခွန်းများ

ဟုတ်ကဲ့. ကျွန်တော်တို့ရဲ့ API ကို OpenAI အသံစကားပြော format ကိုလိုက်နာ. သင် OpenAI Python ကိုသို့မဟုတ် JavaScript ကို client ကိုစာကြည့်တိုက်ကိုအသုံးပြုနေလျှင်, သင် base_url နှင့် api_key parameters တွေကိုပြောင်းလဲခြင်းအားဖြင့် TTS.ai သို့ switch လုပ်နိုင်ပါတယ်. သင့်ရဲ့လက်ရှိကုဒ်ကိုပြုပြင်ခြင်းမရှိဘဲအလုပ်လုပ်.

Kokoro တွင်အောက်တွင်အသံထုတ်လုပ် 1 ယေဘုယျဝါကျများအတွက်စက္ကန့်။ CosyVoice2အနည်းဆုံးပင်မြင်တွေ့ latency အတွက် streaming output ကိုထောက်ခံသည်။ chatbots နှင့်အသံအကူများအတွက်, အားလုံး round-ခရီးစဉ်အချိန်သည်ပုံမှန်အားဖြင့် 1-3 စာသားအရှည်နှင့်မော်ဒယ်ရွေးချယ်မှုပေါ် မူတည်. စက္ကန့်ဖြစ်ပါတယ်။

အခမဲ့မော်ဒယ်များ (Kokoro, Piper, VITS, MeloTTS) လုံးဝအခမဲ့ဖြစ်ကြသည်။ စံမော်ဒယ်များစာသား၏ 1K တစ်ဦးလျှင် 2x စာလုံးများကိုအသုံးပြု. စာသား၏ 1K တစ်ဦးလျှင်ပရီမီယံမော်ဒယ်များ 4x စာလုံးများကိုအသုံးပြု. 15,000 စာလုံးများနှင့်အတူအခမဲ့မှတ်ပုံတင်. 500,000 စာလုံးများအတွက်အစီအစဉ်များ $9 / လတွင်စတင်.

ဟုတ်ကဲ့. အသံ cloning endpoint ကို reference အသံနမူနာ (5-30 စက္ကန့်) ကို upload လုပ်ပါ, ထို့နောက်နောက်ဆက်တွဲ TTS တောင်းဆိုမှုများတွင် cloned အသံ ID ကိုအသုံးပြုပါ. cloning ကိုထောက်ခံတဲ့မော်ဒယ်များမှာ CosyVoice 2, Chatterbox, Fish Speech, နှင့် GPT-SoVITS တို့ပါဝင်သည်။

အခမဲ့ tier အခြေခံနှုန်းကန့်သတ် (3 အကောင့်မရှိဘဲတစ်နာရီလျှင်တောင်းဆိုချက်များ) ရှိပါတယ်. ပေးဆောင်အစီအစဉ်များထုတ်လုပ်မှု application များအတွက်သင့်လျော်သောပွင့်လင်းမြင်သာနှုန်းကန့်သတ်ရှိပါတယ်. enterprise-level ကို throughput လိုအပ်ချက်များအတွက်ကျွန်တော်တို့ကိုဆက်သွယ်ပါ.

WAV (မဖိအား, အမြင့်ဆုံးအရည်အသွေး), MP3 (ဖိအား, အသေးစားဖိုင်များ), OGG (ဖွင့်ဖိုင်ပုံစံ), နှင့် FLAC (lossless ဖိအား). သင့်ရဲ့တောင်းဆိုချက်ထဲမှာ format ကိုသတ်မှတ်ပါ။ စံက model ရဲ့ဒေသခံနမူနာနှုန်းမှာ WAV ဖြစ်ပါတယ်။

ဟုတ်ကဲ့. ကျွန်တော်တို့ရဲ့ TTS API ကိုစကားပြော-to-text ပုံစံနှင့်အပြည့်အဝအသံအကူပိုက်လိုင်းတည်ဆောက်ရန် LLM နှင့်အတူပေါင်းစပ်ပါ။ Kokoro သည်အမှန်တကယ်အချိန်စကားပြောဆိုမှုအတွက်အလွန်အမင်း sub-second latency ကိုပေးသည်။ CosyVoice2သည်အနည်းဆုံးသိမြင်တုံ့ပြန်မှုအချိန်များအတွက် streaming output ကိုထောက်ပံ့သည်။

CosyVoice 2နှင့် Kokoro ထောက်ခံမှု streaming audio output ကိုသူတို့ထုတ်လုပ်အဖြစ် audio chunks ပေးပို့ကြသည်နေရာတွင်။ ဤသည်အသံအကူများနှင့်အပြန်အလှန်အတွေ့အကြုံများကဲ့သို့အစစ်အမှန်အချိန် application များအတွက်အချိန်-to-first-byte ကိုလျှော့ချ။

API ကိုစံ HTTP ကို status codes တွေကိုပြန်လာ. 5xx အမှားများနှင့်နှုန်းအဆုံးအဖြေများအတွက် exponential backoff ကိုကျင့်သုံး. တာဝန်-အရေးကြီးသော applications များများအတွက်, retry လောဂျစ်နှင့်အတူတန်းကိုထည့်သွင်း. ကျွန်တော်တို့ရဲ့ API ကိုမြင့်မားသော uptime ရှိပါတယ်, ဒါပေမယ့် resilient error ကိုကိုင်တွယ်ဖြေရှင်းခြင်းအမြဲတမ်းအကြံပြုထားသည်။

ဟုတ်ကဲ့။ /v1/voices နှင့် /v1/models endpoints များသည်၎င်းတို့၏ metadata များနှင့်အတူရရှိနိုင်သောအသံများနှင့်မော်ဒယ်များအားလုံး၏ JSON စာရင်းများကိုပြန်ပေးသည်။ (ဘာသာစကားထောက်ခံမှု၊ အရည်အသွေးအဆင့်သတ်မှတ်ချက်၊ အမြန်နှုန်းအဆင့်သတ်မှတ်ချက်နှင့်စျေးနှုန်းအဆင့်). သင့် application တွင် dynamic model selectors များကိုတည်ဆောက်ရန်ဤအရာများကိုအသုံးပြုပါ။

အခမဲ့မော်ဒယ်များ (Kokoro, Piper, VITS, MeloTTS) သူတို့လုံးဝအခမဲ့ဖြစ်ကြသည်ကတည်းကထိရောက်သော sandbox အဖြစ်ဝန်ဆောင်မှုပေး. အခမဲ့မော်ဒယ်များနှင့်အတူသင်၏ပေါင်းစည်းမှုကိုစမ်းသပ်, ထို့နောက်မော်ဒယ် parameter ကိုပြောင်းလဲခြင်းအားဖြင့်ထုတ်လုပ်မှုမှာပရီမီယံမော်ဒယ်များသို့ switch. သီးခြားစမ်းသပ်မှုပတ်ဝန်းကျင်လိုအပ်ပါတယ်မဟုတ်.

ကျွန်ုပ်တို့၏မော်ဒယ်အများစုသည်အရင်းအမြစ်ဖွင့်လှစ်ပြီးကိုယ်ပိုင်-hosted နိုင်ပါသည်။ သို့သော်, ကိုယ်ပိုင်-hosting ထင်ရှား GPU အရင်းအမြစ်များလိုအပ် (ကျနော်တို့ 4x NVIDIA Tesla P40 အသုံးပြု 96GB VRAM စုစုပေါင်း) ။ API ကိုအခြေခံအဆောက်အအုံစီမံခန့်ခွဲမှုမရှိဘဲကုန်ကျစရိတ်-ထိရောက်သောအခြားရွေးချယ်စရာပေးသည်။

5.0/5 (1)

Voice AI ဖြင့် တည်ဆောက်ရန် အဆင်သင့်ဖြစ်ပြီလား?

သင့်ရဲ့အခမဲ့ API key ကိုရယူပါနှင့်ဆောက်လုပ်ရေးစတင်. 15 signup ကိုအပေါ်ခရက်ဒစ်, အခမဲ့မော်ဒယ်များရရှိနိုင်, စုံလင်သောစာရွက်စာတမ်းများ.

အခမဲ့ Sign Up ကြည့်ရှုစျေးနှုန်းများ

Developers များအတွက် စာသားမှစကားပြော API

အခုစမ်းကြည့်ပါ

TTS.ai ကိုချစ်ပါသလား?

Developers များအတွက် API အင်္ဂါရပ်များ

ရိုးရှင်းသော REST API ကို

OpenAI-ကိုက်ညီ

24+ မော်ဒယ်များရရှိနိုင်

ဒုတိယပိုင်း နောက်ကျမှု

Voice Cloning API

အမျိုးအစားပေါင်းစုံ

Developer ပေါင်းစည်းမှုအတွက်အကောင်းဆုံးမော်ဒယ်များ

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API ကိုပေါင်းစပ်နည်း

သင့်ရဲ့ API ကို Key ကို Get

သင်၏ပထမဦးဆုံးခေါ်ဆိုမှုလုပ်ပါ

သင့်ရဲ့ Model ကိုရွေးချယ်ပါ

ထုတ်လုပ်မှုသို့သင်္ဘော

ချက်ချင်းစတင်ကုဒ်ဥပမာများ

TTS.ai ဖြင့် developer များတည်ဆောက်

AI Chatbots & amp; assistents

မိုဘိုင်းနှင့်အသံ Apps များ

SaaS ထုတ်ကုန်များ

အလိုအလျောက်ပိုက်လိုင်း

API ကို Specifications

မေးလေ့ရှိသောမေးခွန်းများ

API ကို OpenAI TTS format နဲ့သဟဇာတဖြစ်ပါသလား?

မှန်ကန်သောအချိန် application များအတွက် latency ကဘာလဲ?

API အသုံးပြုမှုအတွက်စျေးနှုန်းဘယ်လိုအလုပ်လုပ်သလဲ?

API မှတဆင့် အသံကို ကူးယူနိုင်မလား?

အမြန်နှုန်းကန့်သတ်ချက်ရှိပါသလား။

အဘယ်အရာကို audio formats API ကပြန်လာသလဲ?

ကျွန်ုပ်သည်အသံအကူသို့မဟုတ် chatbot ကိုတည်ဆောက်ရန် API ကိုအသုံးပြုနိုင်သလား?

WebSocket သို့မဟုတ် streaming API ရှိပါသလား?

ထုတ်လုပ်မှုတွင်အမှားများနှင့်ထပ်မံကြိုးစားမှုများကိုမည်သို့ကိုင်တွယ်ရမည်နည်း။

ရရှိနိုင်သော အသံများနှင့် မော်ဒယ်များကို ပရိုဂရမ်မပါဘဲ စာရင်းပြုစုနိုင်မလား။

သဲပုံး (သို့) စမ်းသပ်မှု ပတ်ဝန်းကျင် ရှိပါသလား။

ငါ API ကိုအသုံးပြုခြင်းအစားပုံစံများကို self-host လုပ်နိုင်သလား?

Voice AI ဖြင့် တည်ဆောက်ရန် အဆင်သင့်ဖြစ်ပြီလား?