සංවර්ධකයින් සඳහා පෙළ සිට කථාව API

අපගේ REST API සමඟ හඬ-සක්‍රීය යෙදුම් ගොඩනඟන්න. ස්වභාවික පෙළ-කතා, හඬ ක්ලෝන, කථා-පෙළ, සහ ශ්රව්ය සැකසුම් ඔබේ යෙදුම්, චැට්බෝට්, හඬ සහායක, සහ SaaS නිෂ්පාදන එකතු කරන්න. OpenAI අනුකූල ආකෘතිය, 20 + ආකෘති, සරල ඒකාබද්ධ.

REST API චැට්බෝට් හඬ යෙදුම්Name SaaS නිෂ්පාදන ස්වයංක්‍රීයකරණය

සම්පූර්ණ TTS සකසනය API ලේඛන

දැන් උත්සාහ කරන්න

0/500

Kokoro සමග නිදහස්, Piper, VITS, MeloTTS

ඔබගේ ජනනය කරන ලද ශ්‍රව්‍ය මෙතනින් දිස්වේ

සම්පූර්ණ TTS සකසනය විවෘත කරන්න

සංවර්ධකයින් සඳහා API විශේෂාංග

හඬ-සක්‍රීය යෙදුම් ගොඩනැගීමට ඔබට අවශ්ය සියලු දේ

සරල REST API

කතා උත්පාදනය කිරීමට එක් POST ඉල්ලීම. JSON ඉල්ලීම, ශ්රව්ය ප්රතිචාර. HTTP සහාය වන ඕනෑම වැඩසටහන් භාෂාව සමඟ වැඩ.

OpenAI අනුකූල

OpenAI TTS API සඳහා drop-in ආදේශකයක්. ඔබේ base_url සහ API යතුර මාරු - දැනට පවතින කේතය වහාම වැඩ.

24+ ආකෘති ලබා ගත හැකිය

තනි API හරහා සෑම ආකෘතියකට ප්රවේශ වන්න. එක් පරාමිතියක් වෙනස් කිරීමෙන් ආකෘති මාරු කරන්න. ගුණාත්මකභාවය, වේගය සහ පිරිවැය සසඳන්න.

උප- තත්පර ප්‍රමාදතාව

Kokoro යටතේ ශ්රව්ය ජනනය 1 තත්පර. තත්කාලීන චැට්බෝට් සඳහා පරිපූර්ණ, හඬ සහායකයින්, සහ අන්තර්ක්රියාකාරී යෙදුම්.

හඬ ක්ලෝනිං API

API හරහා කෙටි ශ්රව්ය සාම්පලයක් සිට ඕනෑම හඬක් ක්ලෝන. සියලු ඊළඟ පරම්පරා සඳහා ක්ලෝන හඬ භාවිතා කරන්න.

බහු සංයුති

WAV ලෙස ප්රතිදානය, MP3, OGG, හෝ FLAC. සාම්පල අනුපාතය සහ බිට් ගැඹුර තෝරන්න. සත්‍ය කාලීන යෙදුම් සඳහා ශ්රව්ය සහාය.

සංවර්ධක ඒකාබද්ධ කිරීම සඳහා හොඳම ආකෘති

ඔබේ අයදුම්පත වේගය, ගුණාත්මක හා පිරිවැය අවශ්යතා සඳහා සුදුසු ආකෘතිය තෝරන්න

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

ස්ථිර 5/5

සඳහා හොඳම: වේගවත්ම ආකෘතිය - උප-තත්පර ප්රමාද, සැබෑ-කාලීන යෙදුම් සහ චැට්බෝට් සඳහා කදිම

උත්සහ කරන්න Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

මධ්‍යම 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හඬ සහායක යෙදුම් සඳහා හඬ ක්ලෝන සමඟ TTS ප් රවාහනය

උත්සහ කරන්න CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

මන්දගාමී 5/5

සඳහා හොඳම: චැට්බෝට් සහ සහායක හඬ සඳහා ස්වභාවික වේලාව සමග සංවාදාත්මක AI

උත්සහ කරන්න Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

ස්ථිර 3/5

සඳහා හොඳම: ශුන්‍ය ක්රෙඩිට් පිරිවැය සමග ඉහළ පරිමාව අයදුම්පත් සඳහා නිදහස්, CPU පමණක් ආකෘතිය

උත්සහ කරන්න Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

මන්දගාමී 4/5

සඳහා හොඳම: නිර්මාණශීලී හා විනෝදාත්මක යෙදුම් සඳහා ශබ්ද ආකෘති සමඟ ශ්රව්ය ජනනය

උත්සහ කරන්න Bark

TTS API ඒකාබද්ධ කරන ආකාරය

ලියාපදිංචි වීමේ සිට පළමු API ඇමතුම දක්වා5මිනිත්තු

ඔබේ API යතුර ලබා ගන්න

නොමිලේ ලියාපදිංචි වී ඔබේ ගිණුම දර්ශක පුවරුව සිට API යතුරක් ජනනය කරන්න. 15,000 අක්ෂර ඇතුළත්.

ඔබේ පළමු ඇමතුම කරන්න

පෙළ සමග / v1 / tts කිරීමට පෝස්ට්, ආකෘතිය, හා හඬ. ආපසු ශ්රව්ය බයිට් ලබා ගන්න. යටතේ5කේත රේඛා.

ඔබේ ආකෘතිය තෝරන්න

ඔබේ භාවිතය සඳහා විවිධ ආකෘති පරීක්ෂා කරන්න. පරම්පරාවකට වේගය, ගුණාත්මකභාවය සහ පිරිවැය සසඳන්න.

නිෂ්පාදනයට නැව

ඔබ-යාමට චරිත ගෙවීම ලෙස පරිමාණය. ගෙවන සැලසුම් මත කිසිදු අනුපාත සීමා. ඔබේ දර්ශක පුවරුව භාවිතය අධීක්ෂණය.

ක්ෂණික ආරම්භක කේත උදාහරණ

අපගේ REST API සමඟ ඕනෑම භාෂාවකින් TTS.ai ඒකාබද්ධ කරන්න

Python ජනප්‍රිය

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL විශ්වීය

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- අනුකූල සංයුතිය ඩ්‍රොප්-ඉන්

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

ඔබේ නිදහස් API යතුර ලබා ගන්න

සංවර්ධකයින් සමඟ ගොඩනඟන දේ TTS.ai

පොදු ඒකාබද්ධ රටා සහ යෙදුම්

AI චැට්බෝට්ස් සහ සහායකයින්

ඔබේ චැට්බෝට් හෝ AI සහායක හඬ ප්රතිදානය එකතු කරන්න. හඬ සකස් කළ අතුරුමුහුණත් සඳහා TTS හරහා LLM ප්රතිචාර පයිප්ප. Kokoro සැබෑ-කාලීන සංවාද සඳහා උප-තත්පර ප්රමාදයක් ලබා දෙයි. Sesame CSM ස්වභාවික කාලසටහන සමඟ සංවාදාත්මක කථාව ජනනය කරයි.

LLM ප්රතිචාරය කථාව නල මාර්ග
Kokoro සමඟ උප-තත්පර පරතරය
Sesame CSM සමග සංවාදාත්මක කථාව
ශ්‍රව්‍ය ප්‍රථිදානය

ජංගම හා හඬ යෙදුම්

හඬ-සක්‍රීය ජංගම යෙදුම්, ප් රවේශ විය හැකි මෙවලම්, කියවීමේ යෙදුම් සහ භාෂා ඉගෙනීමේ වේදිකා ගොඩනඟන්න. අපගේ REST API ඕනෑම ජංගම රාමුවක් සමඟ වැඩ කරයි. ශ් රව් ය ගොනු බාගත කරන්න හෝ සේවාදායකයාට සෘජුවම ව් යාප්ත කරන්න.

ස්වදේශීය, Flutter, Swift, Kotlin ප්රතිචාර දක්වන්න
පිවිසුම් සහ කියවීමේ යෙදුම්
භාෂා ඉගෙනුම් වේදිකා
ශ්‍රව්‍ය අන්තර්ගතය ජනනය

SaaS නිෂ්පාදන

ඔබේ SaaS නිෂ්පාදනයේ සුදු ලේබල් හඬ හැකියාවන්. ඔබේ වේදිකාවේ විශේෂාංග ලෙස TTS, STT, හඬ ක්ලෝන කිරීම සහ ශ්රව්ය සැකසීම එකතු කරන්න. GPU යටිතල පහසුකම් කළමනාකරණය නොකර ඔබේ හඬ backend ලෙස අපගේ API භාවිතා කරන්න.

සුදු-ලේබල් හඬ විශේෂාංග
GPU යටිතල පහසුකම් අවශ්ය නොවේ
භාවිතය සඳහා ගෙවීම
ඔබේ පරිශීලකයින්ට ඉදිරිපත් කිරීමට 20+ ආකෘති

ස්වයංක්රීය පයිප්ප

CI / CD නල මාර්ග, අන්තර්ගත ස්වයංක් රීයකරණය සහ කණ්ඩායම් සැකසුම් වැඩ ප් රවාහයන් තුළ හඬ ජනනය ඒකාබද්ධ කරන්න. ප් රස්ථාර දත්ත වලින් ශ් රව් ය ගොනු දහස් ගණනක් ජනනය කරන්න, පොඩ්කාස්ට් නිෂ්පාදනය ස්වයංක් රීය කරන්න හෝ අන්තර්ගතය දේශීයකරණය නල මාර්ග ගොඩනඟන්න.

API හරහා බැච් සැකසීම
අන්තර්ගතය දේශීයකරණය පයිප්ප
CI / CD ඒකාබද්ධ
ශ්රව්ය ස්වයංක්රීය කිරීමට Spreadsheet

සම්පූර්ණ API ලේඛන බලන්න

API පිරිවිතර

නිෂ්පාදන යෙදුම් සඳහා ඉදිකර ඇත

20+

TTS ආකෘති

100+

ශබ්ද

30+

භාෂාName

<1s

ප්‍රමාදය (Kokoro)

නොමිලේ ලියාපදිංචි වන්න - 15,000 අක්ෂර

නිතර අසන ප්රශ්න

TTS.ai සංවර්ධක API ගැන පොදු ප්රශ්න

ඔව්. අපගේ API OpenAI ශ්රව්ය කථා ආකෘතිය අනුගමනය කරයි. ඔබ OpenAI Python හෝ ජාවාස්ක්රිප්ට් සේවාදායක පුස්තකාලය භාවිතා කරන්නේ නම්, ඔබ base_url සහ api_key පරාමිති වෙනස් කිරීමෙන් TTS.ai මාරු කළ හැකිය. ඔබේ දැනට පවතින කේතය වෙනස් කිරීමකින් තොරව වැඩ.

Kokoro සාමාන්ය වාක්‍ය සඳහා තත්පර 1 යටතේ ශ්රව්ය ජනනය කරයි. CosyVoice2අනෙක් අඩු අවබෝධය ප්රමාණය සඳහා ප්රවාහනය ප්රතිදානය සහාය. චැට්බෝට් සහ හඬ සහායක සඳහා, මුළු වටය-චාරිකාව කාලය සාමාන්යයෙන් 1-3 තත්පර පෙළ දිග සහ ආකෘතිය තෝරා මත රඳා පවතී.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) සම්පූර්ණයෙන්ම නිදහස් වේ. සම්මත ආකෘති පෙළ 1K සඳහා 2x අක්ෂර භාවිතා. ප් රතිලාභ ආකෘති පෙළ 1K සඳහා 4x අක්ෂර භාවිතා. 15,000 අක්ෂර සමඟ නොමිලේ ලියාපදිංචි වන්න. සැලසුම් 500,000 අක්ෂර සඳහා $9/month දී ආරම්භ වේ.

ඔව්. හඬ ක්ලෝන අවසන් ස්ථානයට උපුටා දැක්වීමේ ශ් රව් ය සාම්පලයක් (5-30 තත්පර) උඩුගත කරන්න, ඉන්පසු ඊළඟ TTS ඉල්ලීම්වල ක්ලෝන හඬ ID භාවිතා කරන්න. ක්ලෝන කිරීම සඳහා සහාය දක්වන ආකෘති අතර CosyVoice2, Chatterbox, Fish Speech සහ GPT-SoVITS ඇතුළත් වේ.

නොමිලේ තට්ටුව මූලික අනුපාතය සීමා (3 ගිණුමක් නොමැතිව පැයකට ඉල්ලීම්). ගෙවන සැලසුම් නිෂ්පාදන යෙදුම් සඳහා සුදුසු දයානුකම්පිත අනුපාත සීමා ඇත. ව්යාපාර මට්ටමේ කාර්යක්ෂමතා අවශ්යතා සඳහා අප අමතන්න.

WAV (සම්බන්ධ නොකළ, ඉහළම ගුණාත්මක), MP3 (සම්බන්ධ, කුඩා ගොනු), OGG (ඔබගේ ඉල්ලීම තුළ සංයුතිය සඳහන් කරන්න. පෙරනිමියෙන් ආකෘතිය ස්වදේශීය සාම්පල අනුපාතය WAV වේ.

ඔව්. සම්පූර්ණ හඬ සහායක නල මාර්ගයක් ගොඩනැගීමට කතා-පෙළ ආකෘතිය සහ LLM සමග අපගේ TTS API එකතු කරන්න. Kokoro තත්ත්ව-කාලීන සංවාදය සඳහා උප-තත්පර පරතරය පරිපූර්ණ සපයයි. CosyVoice2පවා අඩු අවබෝධ ප්රතිචාර කාලය සඳහා ශ්රව්ය ප්රතිදානය සහාය.

CosyVoice2සහ Kokoro ඔවුන් ජනනය කරන ලෙස ශ්රව්ය චුන්ක් ලබා දෙන ශ්රව්ය ප්රතිදානය සහාය. මෙය හඬ සහායක සහ අන්තර් ක්රියාකාරී අත්දැකීම් වැනි තත්කාලීන යෙදුම් සඳහා කාලය-ට-පළමු-බයිට් අඩු කරයි.

API සම්මත HTTP තත්වය කේත ආපසු. 5xx දෝෂ සහ අනුපාත සීමා ප්රතිචාර සඳහා ගුණාත්මක backoff ක්රියාත්මක කරන්න. මෙහෙයුම-විශේෂිත යෙදුම් සඳහා, නැවත උත්සාහ තර්කනය සමග පෝලිම එකතු කරන්න. අපගේ API ඉහළ uptime නමුත් කල් පවතින දෝෂ හැසිරවීම සෑම විටම නිර්දේශ කරනු ලැබේ.

ඔව්. /v1/voices සහ /v1/models endpoints ඔවුන්ගේ මෙටා දත්ත (භාෂා සහාය, ගුණාත්මක ශ්රේණිගත කිරීම්, වේග ශ්රේණිගත කිරීම්, සහ මිල ස්ථරය) සමග සියලු ලබා ගත හැකි හඬ සහ ආකෘති JSON ලැයිස්තු ආපසු. ඔබේ යෙදුම තුළ ගතික ආකෘති තෝරන්නන් ගොඩනැගීමට මෙම භාවිතා කරන්න.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) ඔවුන් ශුන්‍ය ණය වියදම් නිසා ඵලදායී වැලි පෙට්ටියක් ලෙස සේවය කරයි. නිදහස් ආකෘති සමඟ ඔබේ ඒකාබද්ධ පරීක්ෂා, පසුව ආකෘතිය පරාමිතීන් වෙනස් කිරීමෙන් නිෂ්පාදනය වට්ටම් ආකෘති මාරු. වෙනම ටෙස්ට් පරිසරයක් අවශ්ය නොවේ.

අපගේ බොහෝ ආකෘති විවෘත මූලාශ් රය වන අතර ස්වයං-සත්කාරකත්වය දැක්විය හැකිය. කෙසේ වෙතත්, ස්වයං-සත්කාරකත්වය සැලකිය යුතු GPU සම්පත් අවශ් ය වේ (අපි 4x NVIDIA Tesla P40 භාවිතා කරමු 96GB VRAM මුළු). API යටිතල පහසුකම් කළමනාකරණය නොමැතිව පිරිවැය ඵලදායී විකල්පයක් සපයයි.

5.0/5 (1)

හඬ AI සමග ගොඩනැගීමට සූදානම්?

ඔබේ නිදහස් API යතුර ලබා ගන්න සහ ගොඩනැගිල්ල ආරම්භ. 15 ලියාපදිංචි මත ණය, නිදහස් ආකෘති ලබා ගත හැකි, පුළුල් ලේඛනගත.

නොමිලේ ලියාපදිංචි මිල දර්ශනය

සංවර්ධකයින් සඳහා පෙළ සිට කථාව API

දැන් උත්සාහ කරන්න

TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

සංවර්ධකයින් සඳහා API විශේෂාංග

සරල REST API

OpenAI අනුකූල

24+ ආකෘති ලබා ගත හැකිය

උප- තත්පර ප්‍රමාදතාව

හඬ ක්ලෝනිං API

බහු සංයුති

සංවර්ධක ඒකාබද්ධ කිරීම සඳහා හොඳම ආකෘති

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API ඒකාබද්ධ කරන ආකාරය

ඔබේ API යතුර ලබා ගන්න

ඔබේ පළමු ඇමතුම කරන්න

ඔබේ ආකෘතිය තෝරන්න

නිෂ්පාදනයට නැව

ක්ෂණික ආරම්භක කේත උදාහරණ

සංවර්ධකයින් සමඟ ගොඩනඟන දේ TTS.ai

AI චැට්බෝට්ස් සහ සහායකයින්

ජංගම හා හඬ යෙදුම්

SaaS නිෂ්පාදන

ස්වයංක්රීය පයිප්ප

API පිරිවිතර

නිතර අසන ප්රශ්න

මෙම API OpenAI TTS ආකෘතිය සමග අනුකූලද?

තත්කාලීන යෙදුම් සඳහා latency කුමක්ද?

API භාවිතය සඳහා මිල ක්රියා කරන්නේ කෙසේද?

මට API හරහා හඬ ක්ලෝන භාවිතා කළ හැකිද?

ගාස්තු සීමාවක් තියෙනවද?

කුමන ශ්රව්ය ආකෘති API ආපසු කරන්නේ?

මම හඬ සහායක හෝ චැට්බෝට් ගොඩනැගීමට API භාවිතා කළ හැකිද?

WebSocket හෝ ප්රවාහනය API තිබේද?

මම නිෂ්පාදනය දෝෂ හා නැවත උත්සාහ හැසිරවීමට කෙසේද?

මට ලබා ගත හැකි හඬ සහ ආකෘති වැඩසටහනක් ලැයිස්තුගත කළ හැකිද?

වැලි බෝක්කු හෝ පරීක්ෂණ පරිසරයක් තිබේද?

මම API භාවිතා වෙනුවට ආකෘති ස්වයං-සත්කාරක විය හැකිද?

හඬ AI සමග ගොඩනැගීමට සූදානම්?