සංවර්ධකයින් සඳහා පෙළ සිට කථාව API

අපගේ REST API සමඟ හඬ-සක්‍රීය යෙදුම් ගොඩනඟන්න. ස්වභාවික පෙළ-කතා, හඬ ක්ලෝන, කථා-පෙළ, සහ ශ්රව්ය සැකසුම් ඔබේ යෙදුම්, චැට්බෝට්, හඬ සහායක, සහ SaaS නිෂ්පාදන එකතු කරන්න. OpenAI අනුකූල ආකෘතිය, 20 + ආකෘති, සරල ඒකාබද්ධ.

REST API චැට්බෝට් හඬ යෙදුම්Name SaaS නිෂ්පාදන ස්වයංක්‍රීයකරණය

දැන් උත්සාහ කරන්න

Kokoro සමග නිදහස්, Piper, VITS, MeloTTS
ඔබගේ ජනනය කරන ලද ශ්‍රව්‍ය මෙතනින් දිස්වේ
ජනනය කලේ
බාගත කිරීම්
TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

සංවර්ධකයින් සඳහා API විශේෂාංග

හඬ-සක්‍රීය යෙදුම් ගොඩනැගීමට ඔබට අවශ්ය සියලු දේ

සරල REST API

කතා උත්පාදනය කිරීමට එක් POST ඉල්ලීම. JSON ඉල්ලීම, ශ්රව්ය ප්රතිචාර. HTTP සහාය වන ඕනෑම වැඩසටහන් භාෂාව සමඟ වැඩ.

OpenAI අනුකූල

OpenAI TTS API සඳහා drop-in ආදේශකයක්. ඔබේ base_url සහ API යතුර මාරු - දැනට පවතින කේතය වහාම වැඩ.

24+ ආකෘති ලබා ගත හැකිය

තනි API හරහා සෑම ආකෘතියකට ප්රවේශ වන්න. එක් පරාමිතියක් වෙනස් කිරීමෙන් ආකෘති මාරු කරන්න. ගුණාත්මකභාවය, වේගය සහ පිරිවැය සසඳන්න.

උප- තත්පර ප්‍රමාදතාව

Kokoro යටතේ ශ්රව්ය ජනනය 1 තත්පර. තත්කාලීන චැට්බෝට් සඳහා පරිපූර්ණ, හඬ සහායකයින්, සහ අන්තර්ක්රියාකාරී යෙදුම්.

හඬ ක්ලෝනිං API

API හරහා කෙටි ශ්රව්ය සාම්පලයක් සිට ඕනෑම හඬක් ක්ලෝන. සියලු ඊළඟ පරම්පරා සඳහා ක්ලෝන හඬ භාවිතා කරන්න.

බහු සංයුති

WAV ලෙස ප්රතිදානය, MP3, OGG, හෝ FLAC. සාම්පල අනුපාතය සහ බිට් ගැඹුර තෝරන්න. සත්‍ය කාලීන යෙදුම් සඳහා ශ්රව්ය සහාය.

සංවර්ධක ඒකාබද්ධ කිරීම සඳහා හොඳම ආකෘති

ඔබේ අයදුම්පත වේගය, ගුණාත්මක හා පිරිවැය අවශ්යතා සඳහා සුදුසු ආකෘතිය තෝරන්න

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

සඳහා හොඳම: වේගවත්ම ආකෘතිය - උප-තත්පර ප්රමාද, සැබෑ-කාලීන යෙදුම් සහ චැට්බෝට් සඳහා කදිම

උත්සහ කරන්න Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හඬ සහායක යෙදුම් සඳහා හඬ ක්ලෝන සමඟ TTS ප් රවාහනය

උත්සහ කරන්න CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

සඳහා හොඳම: චැට්බෝට් සහ සහායක හඬ සඳහා ස්වභාවික වේලාව සමග සංවාදාත්මක AI

උත්සහ කරන්න Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

සඳහා හොඳම: ශුන්‍ය ක්රෙඩිට් පිරිවැය සමග ඉහළ පරිමාව අයදුම්පත් සඳහා නිදහස්, CPU පමණක් ආකෘතිය

උත්සහ කරන්න Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

සඳහා හොඳම: නිර්මාණශීලී හා විනෝදාත්මක යෙදුම් සඳහා ශබ්ද ආකෘති සමඟ ශ්රව්ය ජනනය

උත්සහ කරන්න Bark

TTS API ඒකාබද්ධ කරන ආකාරය

ලියාපදිංචි වීමේ සිට පළමු API ඇමතුම දක්වා5මිනිත්තු

1

ඔබේ API යතුර ලබා ගන්න

නොමිලේ ලියාපදිංචි වී ඔබේ ගිණුම දර්ශක පුවරුව සිට API යතුරක් ජනනය කරන්න. 15,000 අක්ෂර ඇතුළත්.

2

ඔබේ පළමු ඇමතුම කරන්න

පෙළ සමග / v1 / tts කිරීමට පෝස්ට්, ආකෘතිය, හා හඬ. ආපසු ශ්රව්ය බයිට් ලබා ගන්න. යටතේ5කේත රේඛා.

3

ඔබේ ආකෘතිය තෝරන්න

ඔබේ භාවිතය සඳහා විවිධ ආකෘති පරීක්ෂා කරන්න. පරම්පරාවකට වේගය, ගුණාත්මකභාවය සහ පිරිවැය සසඳන්න.

4

නිෂ්පාදනයට නැව

ඔබ-යාමට චරිත ගෙවීම ලෙස පරිමාණය. ගෙවන සැලසුම් මත කිසිදු අනුපාත සීමා. ඔබේ දර්ශක පුවරුව භාවිතය අධීක්ෂණය.

ක්ෂණික ආරම්භක කේත උදාහරණ

අපගේ REST API සමඟ ඕනෑම භාෂාවකින් TTS.ai ඒකාබද්ධ කරන්න

Python ජනප්‍රිය
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL විශ්වීය
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- අනුකූල සංයුතිය ඩ්‍රොප්-ඉන්
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

සංවර්ධකයින් සමඟ ගොඩනඟන දේ TTS.ai

පොදු ඒකාබද්ධ රටා සහ යෙදුම්

AI චැට්බෝට්ස් සහ සහායකයින්

ඔබේ චැට්බෝට් හෝ AI සහායක හඬ ප්රතිදානය එකතු කරන්න. හඬ සකස් කළ අතුරුමුහුණත් සඳහා TTS හරහා LLM ප්රතිචාර පයිප්ප. Kokoro සැබෑ-කාලීන සංවාද සඳහා උප-තත්පර ප්රමාදයක් ලබා දෙයි. Sesame CSM ස්වභාවික කාලසටහන සමඟ සංවාදාත්මක කථාව ජනනය කරයි.

  • LLM ප්රතිචාරය කථාව නල මාර්ග
  • Kokoro සමඟ උප-තත්පර පරතරය
  • Sesame CSM සමග සංවාදාත්මක කථාව
  • ශ්‍රව්‍ය ප්‍රථිදානය

ජංගම හා හඬ යෙදුම්

හඬ-සක්‍රීය ජංගම යෙදුම්, ප් රවේශ විය හැකි මෙවලම්, කියවීමේ යෙදුම් සහ භාෂා ඉගෙනීමේ වේදිකා ගොඩනඟන්න. අපගේ REST API ඕනෑම ජංගම රාමුවක් සමඟ වැඩ කරයි. ශ් රව් ය ගොනු බාගත කරන්න හෝ සේවාදායකයාට සෘජුවම ව් යාප්ත කරන්න.

  • ස්වදේශීය, Flutter, Swift, Kotlin ප්රතිචාර දක්වන්න
  • පිවිසුම් සහ කියවීමේ යෙදුම්
  • භාෂා ඉගෙනුම් වේදිකා
  • ශ්‍රව්‍ය අන්තර්ගතය ජනනය

SaaS නිෂ්පාදන

ඔබේ SaaS නිෂ්පාදනයේ සුදු ලේබල් හඬ හැකියාවන්. ඔබේ වේදිකාවේ විශේෂාංග ලෙස TTS, STT, හඬ ක්ලෝන කිරීම සහ ශ්රව්ය සැකසීම එකතු කරන්න. GPU යටිතල පහසුකම් කළමනාකරණය නොකර ඔබේ හඬ backend ලෙස අපගේ API භාවිතා කරන්න.

  • සුදු-ලේබල් හඬ විශේෂාංග
  • GPU යටිතල පහසුකම් අවශ්ය නොවේ
  • භාවිතය සඳහා ගෙවීම
  • ඔබේ පරිශීලකයින්ට ඉදිරිපත් කිරීමට 20+ ආකෘති

ස්වයංක්රීය පයිප්ප

CI / CD නල මාර්ග, අන්තර්ගත ස්වයංක් රීයකරණය සහ කණ්ඩායම් සැකසුම් වැඩ ප් රවාහයන් තුළ හඬ ජනනය ඒකාබද්ධ කරන්න. ප් රස්ථාර දත්ත වලින් ශ් රව් ය ගොනු දහස් ගණනක් ජනනය කරන්න, පොඩ්කාස්ට් නිෂ්පාදනය ස්වයංක් රීය කරන්න හෝ අන්තර්ගතය දේශීයකරණය නල මාර්ග ගොඩනඟන්න.

  • API හරහා බැච් සැකසීම
  • අන්තර්ගතය දේශීයකරණය පයිප්ප
  • CI / CD ඒකාබද්ධ
  • ශ්රව්ය ස්වයංක්රීය කිරීමට Spreadsheet

API පිරිවිතර

නිෂ්පාදන යෙදුම් සඳහා ඉදිකර ඇත

20+

TTS ආකෘති

100+

ශබ්ද

30+

භාෂාName

<1s

ප්‍රමාදය (Kokoro)

නිතර අසන ප්රශ්න

TTS.ai සංවර්ධක API ගැන පොදු ප්රශ්න

ඔව්. අපගේ API OpenAI ශ්රව්ය කථා ආකෘතිය අනුගමනය කරයි. ඔබ OpenAI Python හෝ ජාවාස්ක්රිප්ට් සේවාදායක පුස්තකාලය භාවිතා කරන්නේ නම්, ඔබ base_url සහ api_key පරාමිති වෙනස් කිරීමෙන් TTS.ai මාරු කළ හැකිය. ඔබේ දැනට පවතින කේතය වෙනස් කිරීමකින් තොරව වැඩ.

Kokoro සාමාන්ය වාක්‍ය සඳහා තත්පර 1 යටතේ ශ්රව්ය ජනනය කරයි. CosyVoice2අනෙක් අඩු අවබෝධය ප්රමාණය සඳහා ප්රවාහනය ප්රතිදානය සහාය. චැට්බෝට් සහ හඬ සහායක සඳහා, මුළු වටය-චාරිකාව කාලය සාමාන්යයෙන් 1-3 තත්පර පෙළ දිග සහ ආකෘතිය තෝරා මත රඳා පවතී.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) සම්පූර්ණයෙන්ම නිදහස් වේ. සම්මත ආකෘති පෙළ 1K සඳහා 2x අක්ෂර භාවිතා. ප් රතිලාභ ආකෘති පෙළ 1K සඳහා 4x අක්ෂර භාවිතා. 15,000 අක්ෂර සමඟ නොමිලේ ලියාපදිංචි වන්න. සැලසුම් 500,000 අක්ෂර සඳහා $9/month දී ආරම්භ වේ.

ඔව්. හඬ ක්ලෝන අවසන් ස්ථානයට උපුටා දැක්වීමේ ශ් රව් ය සාම්පලයක් (5-30 තත්පර) උඩුගත කරන්න, ඉන්පසු ඊළඟ TTS ඉල්ලීම්වල ක්ලෝන හඬ ID භාවිතා කරන්න. ක්ලෝන කිරීම සඳහා සහාය දක්වන ආකෘති අතර CosyVoice2, Chatterbox, Fish Speech සහ GPT-SoVITS ඇතුළත් වේ.

නොමිලේ තට්ටුව මූලික අනුපාතය සීමා (3 ගිණුමක් නොමැතිව පැයකට ඉල්ලීම්). ගෙවන සැලසුම් නිෂ්පාදන යෙදුම් සඳහා සුදුසු දයානුකම්පිත අනුපාත සීමා ඇත. ව්යාපාර මට්ටමේ කාර්යක්ෂමතා අවශ්යතා සඳහා අප අමතන්න.

WAV (සම්බන්ධ නොකළ, ඉහළම ගුණාත්මක), MP3 (සම්බන්ධ, කුඩා ගොනු), OGG (ඔබගේ ඉල්ලීම තුළ සංයුතිය සඳහන් කරන්න. පෙරනිමියෙන් ආකෘතිය ස්වදේශීය සාම්පල අනුපාතය WAV වේ.

ඔව්. සම්පූර්ණ හඬ සහායක නල මාර්ගයක් ගොඩනැගීමට කතා-පෙළ ආකෘතිය සහ LLM සමග අපගේ TTS API එකතු කරන්න. Kokoro තත්ත්ව-කාලීන සංවාදය සඳහා උප-තත්පර පරතරය පරිපූර්ණ සපයයි. CosyVoice2පවා අඩු අවබෝධ ප්රතිචාර කාලය සඳහා ශ්රව්ය ප්රතිදානය සහාය.

CosyVoice2සහ Kokoro ඔවුන් ජනනය කරන ලෙස ශ්රව්ය චුන්ක් ලබා දෙන ශ්රව්ය ප්රතිදානය සහාය. මෙය හඬ සහායක සහ අන්තර් ක්රියාකාරී අත්දැකීම් වැනි තත්කාලීන යෙදුම් සඳහා කාලය-ට-පළමු-බයිට් අඩු කරයි.

API සම්මත HTTP තත්වය කේත ආපසු. 5xx දෝෂ සහ අනුපාත සීමා ප්රතිචාර සඳහා ගුණාත්මක backoff ක්රියාත්මක කරන්න. මෙහෙයුම-විශේෂිත යෙදුම් සඳහා, නැවත උත්සාහ තර්කනය සමග පෝලිම එකතු කරන්න. අපගේ API ඉහළ uptime නමුත් කල් පවතින දෝෂ හැසිරවීම සෑම විටම නිර්දේශ කරනු ලැබේ.

ඔව්. /v1/voices සහ /v1/models endpoints ඔවුන්ගේ මෙටා දත්ත (භාෂා සහාය, ගුණාත්මක ශ්රේණිගත කිරීම්, වේග ශ්රේණිගත කිරීම්, සහ මිල ස්ථරය) සමග සියලු ලබා ගත හැකි හඬ සහ ආකෘති JSON ලැයිස්තු ආපසු. ඔබේ යෙදුම තුළ ගතික ආකෘති තෝරන්නන් ගොඩනැගීමට මෙම භාවිතා කරන්න.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) ඔවුන් ශුන්‍ය ණය වියදම් නිසා ඵලදායී වැලි පෙට්ටියක් ලෙස සේවය කරයි. නිදහස් ආකෘති සමඟ ඔබේ ඒකාබද්ධ පරීක්ෂා, පසුව ආකෘතිය පරාමිතීන් වෙනස් කිරීමෙන් නිෂ්පාදනය වට්ටම් ආකෘති මාරු. වෙනම ටෙස්ට් පරිසරයක් අවශ්ය නොවේ.

අපගේ බොහෝ ආකෘති විවෘත මූලාශ් රය වන අතර ස්වයං-සත්කාරකත්වය දැක්විය හැකිය. කෙසේ වෙතත්, ස්වයං-සත්කාරකත්වය සැලකිය යුතු GPU සම්පත් අවශ් ය වේ (අපි 4x NVIDIA Tesla P40 භාවිතා කරමු 96GB VRAM මුළු). API යටිතල පහසුකම් කළමනාකරණය නොමැතිව පිරිවැය ඵලදායී විකල්පයක් සපයයි.
5.0/5 (1)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

හඬ AI සමග ගොඩනැගීමට සූදානම්?

ඔබේ නිදහස් API යතුර ලබා ගන්න සහ ගොඩනැගිල්ල ආරම්භ. 15 ලියාපදිංචි මත ණය, නිදහස් ආකෘති ලබා ගත හැකි, පුළුල් ලේඛනගත.