డెవలపర్లకు పాఠము

మా REST API తో అచేతనమైన అనువర్తనములను తయారు చేయండి. సహజంగా పాఠము- Text- Text, Confer- Text, మీ అప్లికేషన్లు, చాట్‌బోట్స్, సహాయకులు, సాసాఎస్ ఉత్పత్తులు. ఓపెన్ AV- అనువర్తనం, 20+ మోడల్‌లు, సాధారణ కలయికేషన్ వంటి వాటిని కలపండి.

పరీక్షా యంత్రాల చాట్బాట్స్Name స్వర ప్రమేయాలు సాసా ఉత్పత్తిలు స్వయంచాలకంగాగుర్తించు

Full TTS Editor API డాక్స్

ఇప్పుడు ప్రయత్నించండి

0/500

కోకోరో, పిపర్‌, VITS, మెలోట్జ్‌లతో ఉచితంగా

మీరు రూపొందించిన ఆడియో ఇక్కడ కనబడుతుంది

పూర్తి TTS కూర్పకం

API సౌలభ్యాలు డెవలపర్లకు

అనువర్తనం దించదగిన అనువర్తనములను నిర్మించుటకు మీరు అవసరమైన ప్రతిదీ

సాధారణ తప్పు

భాషను ఉద్భవింపచేయుటకు ఒక పోస్ట్ అభ్యర్ధన. Jons, ఆడియో స్పందన. HTTPకు మద్దతుగల ఏ ప్రోగ్రామింగ్ భాషతోనైనా పనిచేస్తుంది. Name

ఓపెన్ AI- ప్రొఫైల్

ఓపెన్ AITS API కోసం ట్రాష్‌- ఇన్‌స్టాల్. మీ బేస్_ url మరియు API కీ ను మార్చండి —⁠ ఉన్న కోడ్ వెంటనే పనిచేస్తుంది.

24+ మోడల్‌లు అందుబాటులోవున్నవి

ఒక API ద్వారా ప్రతి నమూనాను యాక్సెస్ చేయుము. ఒక యాక్సెస్‌బిలిటి మార్చుట ద్వారా మోడల్‌లను మార్చుము.

సబ్‌స్క్సెన్షన్ లేటెన్సి

కోకోరో మొదటి సెకనులో ఆడియోను ఉత్పన్నం చేస్తుంది. రియల్లీ- టైమ్ బోట్స్, స్వర సహాయకాలు, మరియు యింటరాక్టివ్ అప్లికేషన్స్ కొరకు పరిపూర్ణత.

శబ్డం క్లింగ్

API ద్వారా చిన్న చిన్న ఆడియో నమూనా నుండి ఏ స్వరమైనా ఫ్లింక్‌ చేయండి. తర్వాతి తరాలవారికి లాయిడ్‌ వేయబడిన స్వరాలను ఉపయోగించండి.

బహుళ ఆకృతులు

WAV, MP3, OGC, లేదా FLAC లాగా అవుట్‌పుట్ మాదిరి రేటు మరియు బిట్‌స్ట్రింగ్‌ను యెంచుకొనుము. నిజమైన టైమ్‌ ఆప్స్ కొరకు ఆడియో మద్దతును స్ట్రీమింగ్ చేయుము.

వికాసకుడు కోసం ఉత్తమ మోడల్‌లు

మీ కార్యక్రమపు వేగం, నాణ్యత, మరియు ఖర్చు అవసరముల కోసం కుడి మోడల్‌ను యెంచుకొనుము

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

వేగము 5/5

మీకు ఉత్తమ: వేగవంతమైన మోడల్ - వుప- రెండవ- చివరి స్థితి, నిజమైన టైమ్ ఆప్స్ మరియు చాట్‌బాట్స్‌కు అనుకూలమైనది

ప్రయత్నించు Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

మీడియం 5/5 శబ్డం క్లుంకింగ్

మీకు ఉత్తమ: థంబ్‌నెయిల్‍స్ ను సహాయక కార్యక్షేత్రాలకు కలుపుతోందిName

ప్రయత్నించు CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

నెమ్మదిగా 5/5

మీకు ఉత్తమ: చాట్‌బోట్ మరయూ సహాయ వాయిస్ కొరకు సహజముగా ఏఐComment

ప్రయత్నించు Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

వేగము 3/5

మీకు ఉత్తమ: సున్నా విలువతో అధిక- వ్యూ్యూబ్ అనువర్తనముల కొరకు ఉచిత, CPU- మాత్రమే మోడల్

ప్రయత్నించు Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

నెమ్మదిగా 4/5

మీకు ఉత్తమ: ఆర్టివ్ మరియు వినోద ആప్స్‍స్‌కు శబ్ద రీతిని ప్రభావాలతో కూడిన ఆడియో తరంName

ప్రయత్నించు Bark

టిట్సులను విభాజించడమెలా?

సంప్రదింపు నుండి మొదటి API కాల్ 5 నిమిషాల్లో

మీ API కీను పొందుము

మీ ఖాతా నకిలీ నుంచి aPI కీను అందిస్తుంది. 15,000 అక్షరాలు కలిగివుంది.

మీ మొదటి కాల్‌ చేయండి

/v1/tts కు పాఠ్యం, మాదిరి, మరియు స్వరాలకు అధికంగా. ఆడియో బైట్లు తిరిగి పొందుము. 5 కోడ్ కింద.

మీ మోడల్‌ను యెంచుకొనుము

మీ కేసుకు వివిధ మోడల్‌లను పరీక్షించండి.

ఫిలింగ్ నుండి షిప్

మీరు- Y- go అక్షరాలతో కొలత. చెల్లింపిన పథకాల్లో రేటు లేవు. మీ డాష్‌బోర్డునందు మానిటర్రింగ్ వుపయోగం.

కోడ్ ఉదాహరణలు త్వరితంగా ప్రారంభించు

మా ట్రస్ట్ ఆపిల్ తో ఏ భాషలోనైనా 88,000 క్రమపద్ధతిలో నిర్ధారించండి TTS.ai

Python ప్రజాదరణ

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL సార్వత్రిక

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

ఓపెన్ AI- అమర్చగల ఫార్మేట్ ఇన్‌లైట్

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

మీ ఉచితPI కీను పొందండి

ఏం అభివృద్ధికారులు TTS.ai తో నిర్మాణం

సాధారణ కలయిక స్కీమాలు మరియు అనువర్తనములు

II చాట్‌బాట్స్ & సహాయకులు

మీ చాట్‌బాట్ లేదా ఏ అసిస్టెంట్ కు స్వరపు అవుట్‌పుట్ చేర్చుము. వాయిస్- ఎగ్జిక్యూటివ్ ఇంటర్‌ఫేసెస్ కొరకు TTS ద్వారా సమాధానంలు చేర్చు. కోకోరో వాస్తవమైన- థాయిల సంయుక్త సంభాషణలకు ఉప మద్దతి- చివరి సేకరణను అందిస్తుంది. Secom CSM ను సహజ సమయంతో సంభాషణ ఉత్పన్నం చేస్తుంది.

WLLM సంభాషణా పైప్‌లైన్‌కు స్పందన
కొకొరొ తో Sub రెండవ చివరి సంగతిName
సెఓ సిఎమ్‌తో సంభాషణName
ఆడియో అవుట్‌పుట్ స్ట్రీమింగ్

మొబైల్ & స్వర ప్రస్తావనలు

SETAPI ఎటువంటి మొబైల్ ఫ్రేమ్‌మెంట్‌తో పనిచేస్తుంది. ఆడియో ఫైళ్ళను డౌన్‌లోడ్‌చేయండి లేదా క్లైంట్‌కు నేరుగా ప్రసారం చేయుము.

ఫాంట్రోస్, ఫ్లూటర్, స్విఫ్ట్, కొట్లిన్
అందుబాటు మరియు యాక్సెస్Name
భాష నేర్చుకోవడం ప్లాట్‌ఫాంప్‌లు
ఆడియో సారములు ఉద్భవింప వుద్భవం

సాసా ఉత్పత్తిలు

మీ సాసా ఎస్ ఉత్పత్తులో వైట్ స్వర సామర్థ్యాలు. TTS, STT, STT, క్లౌడ్ మరియు ఆడియో కార్యాలు మీ ప్లాట్‌ఫారంలో సౌలభ్యాలు సౌలభ్యాలుగా చేర్చండి. GPUUPను నిర్వహించకుండా మా వాయిస్‌ బ్యాకెండ్‌ను వాడండి.

తెలుపు- లేబుల్ సౌలభ్యాలు
GPU వుపలభ్యము అవసరం
ఎక్కువ- ప్రమేయింగ్
మీ యూజర్లను అందించుటకు 20+ మోడల్‌లు

దానంతటదే గీతలు

స్వరాన్ని CI/ CD Pictures, సారాంశం అభివృద్ది, మరియు సేకరణ పురోభివృద్ది పురోభివృద్ది. విస్మరించిన డాటా, పోడ్‌కాస్ట్ ఉత్పత్తుల నుండి వేల ఆడియో ఫైళ్ళను నిర్వర్తింపుము లేదా సారాంశంగా స్థానిక పైప్‌లను తయారుచేయుము.

API ద్వారా కోడ్ ప్రక్రియ
విషయం స్థానికీకరణ Patherfines
CI/CD సమన్వయం
ఆడియో సంవిధానానికి ట్రాష్‌ను విస్తరించుముComment

పూర్తి API పత్రికీకరణను చూడు

API నిర్ణీతలు

థంబ్‌నెయిల్‍స్ ను తయారుచెయిందిName

20+

TTS మోడల్Name

100+

శబ్డాలు

30+

భాషలుName

<1s

లాటిసేన్ (కోకోరొ)

ఉచితంగా 15,000 అక్షరాలు

తరచూ అడగబడే ప్రశ్నలు

TTS.ai డెవలపర్ API గురించి సాధారణ ప్రశ్నలు

. మా API ఓపెన్ API ఆడియో ఉపన్యాస ఫార్మాట్ను అనుసరిస్తుంది. మీరు ఓపెన్‌ఫాన్సును లేదా జావాస్క్రిప్ట్ క్లైంట్ లైబ్రరీను ఉపయోగిస్తున్నట్లయితే, మీరు TTS.ai కు మార్చవచ్చు, బేస్ url_ url మరియు ap_key గణితాలు మార్చడం ద్వారా. మీ వుడ్‌వున్న కోడ్ ని సవరించకుండానే పనిచేస్తుంది.

సమాంతర వచనానికి కోకోరో మొదటి సెకనులో ఆడియోను ఉద్భవిస్తుంది. కోసినోస్ 2 విస్కాన్‌లు మరియు స్వర సహాయకులకు, మొత్తం రిప్లేట్ సమయం పాఠము పొడవు మరియు మాదిరి ఎంపిక ఆధారంగా 1- 3 సెకనులపాటు వర్తిస్తుంది.

ఫ్రీ మోడల్ (Koಕೋరో, Piper, VITS, మెలోట్స్) పూర్తిగా స్వతంత్రంగా ఉంటుంది. పాఠముకు 1Kకు 2x అక్షరములను ఉపయోగిస్తారు. ప్రొఫైల్ మొబైల్ మొబైల్ ప్రతి 1K అక్షరానికి 4x అక్షరాలను ఉపకరిస్తుంది. 15,000 అక్షరాలకు సంతకం చేయండి. మొత్తం $9/ 00 అక్షరాలకు ప్లాన్సు ప్రారంభమౌతుంది. 5000 అక్షరాలకు ప్లాన్లు ను ప్రారంభించండి.

అవును. రిఫరెన్స్ ఆడియో మాదిరిను (5- 30 సెకనుల) చలనచిత్రానికి ఎక్కించి, వాయిస్‌ను తరువాత TTS అభ్యర్ధనలలో ఆపివేయబడిన స్వర గుర్తింపును వుపయోగించుము. క్లాన్ CCSVOS2 చాట్‌బాక్స్, చేప సంభాషణ, GPTS- SVVITS ను మద్దతుచేయు నమూనాలు.

ఫ్రీ టైకర్ ప్రాథమిక రేటు పరిమితి(ఒక గంటకు 3 అదనపు అభ్యర్ధనలు) కలిగి ఉంది. పేదీ ప్రణాళికలు ప్రొఫైల్ అప్ దరఖాస్తులకు సముచిత రేటు. మాతో ప్రొఫైల్ స్థాయిని పర్యావరణ తర్టు తర్ఫీదుల ద్వారా సంప్రదించండి.

WAV (ప్రోత్సహింపబడింది, అధిక నాణ్యత), MP3 (కొత్తము సమ్మేళనం, చిన్న దస్త్రములు), OG (పాదిత ఫార్మాట్), మరియు FLC మీ అభ్యర్ధనపై ఫార్మేట్‌ను తెలుపుము. అప్రమేయ WAV మాదిరి రేటు.

అవును. మా TTS ను ఒక భాష-వచన నమూనా తో కలపండి మరియు ఒక 0M పూర్తి స్వర సహాయక పైప్‌ను తయారు చేయడానికి. కోకోరో రియల్ నిజమైన సమయాన్ని సంభాషణకు ఉప మద్దతిస్తుంది. కోకోరో 2 ఉత్పన్నమైన ప్రతిస్పందనను ఇంకా తక్కువ ప్రతిస్పందన కోసం ఉత్పన్నం చేస్తుంది.

CosyVoice 2 మరియు కోకొరో ఆడియో ఉత్పత్తులు ఉత్పత్తి అయినట్లుగా అందించబడుతుంది. ఇది స్వర సహాయకులు మరియు యింటరద్దుల వంటి సౌలభ్యతల కోసం సమయం నుండి మొదటి వరకు తగ్గిస్తుంది.

API ప్రామాణిక HTTP స్థితి కోడ్లను చూపిస్తుంది. 5x దోషములు మరియు రేటింగ్ రీతిని పర్యవేక్షిస్తుంది. మిషన్-నేట్ అనువర్తనముల కొరకు వరుసను తిరిగిఅమర్చుము. మా API చాలా ఎక్కువ సమయం వుంటుంది అయితే రెగ్యులర్ ఇన్‌పుట్ ట్రెస్ ఎల్లప్పుడూ సిఫార్సు చేయబడుతుంది.

అవును. /v1/ images మరియు /v1s/ modules అందుబాటులోవున్న అన్ని స్వరాలు మరియు మోడల్‌జాన్‌లను Jసన్‌కు తిరిగివుంచుతుంది (భాషా మద్దతు, రేటింగు రేటింగులు, వేగం రేటింగులు మరియు ప్రత్యర్థి టైపులు). వీటిని మీ అనువర్తనమునందు యెంపికచేసుకుంటారు.

ఫ్రీ మోడల్ (Koocro, Piper, VITS, మెలోట్స్) പൂജణపు విలువల కారణంగా ఒక ఫలవంతమైన ఇసుక బాక్స్‌లా పనిచేస్తుంది. మీరు స్వతంత్ర మోడల్ తో సమన్వయం పరీక్షించి తరువాత మోడల్ వుడ్‌ను మార్చడం ద్వారా ఉత్పన్నమైన మోడల్‌లను ఉత్పన్నం చేయండి. ఏ విధమైన పరీక్షా వాతావరణం అవసరంలేదు.

మా మోడల్లో అధికభాగం ఓపెన్ సోర్సు చేయబడుతుంది మరియు స్వీయ హోస్ట్ చెయ్యాలి. అయితే, స్వీయ హ్యూట్ గణిత GPU వనరులు కోరదగిన GPUU వనరులు ( 4xITIA PSEL P40 తో 96 GGB పరిధితో మొత్తం వాడాలి) ఆ API నిర్మాణనాత్మక ప్రత్యామ్నాయం ఇవ్వడం లేదు.

5.0/5 (1)

స్వరం AIతో కట్టాలా?

మీ ఉచిత API కీ తీసుకొని నిర్మాణాన్ని ప్రారంభించండి. బిగ్ అప్, అందుబాటులోని ఉచిత మోడల్, పూర్తి పత్రాలు.

ఖాళీగాపైకు సంతకంచేయి విస్తీర్ణతను వీక్షించు

డెవలపర్లకు పాఠము

ఇప్పుడు ప్రయత్నించండి

మీ స్నేహితులను ప్రేమించడమా?

API సౌలభ్యాలు డెవలపర్లకు

సాధారణ తప్పు

ఓపెన్ AI- ప్రొఫైల్

24+ మోడల్‌లు అందుబాటులోవున్నవి

సబ్‌స్క్సెన్షన్ లేటెన్సి

శబ్డం క్లింగ్

బహుళ ఆకృతులు

వికాసకుడు కోసం ఉత్తమ మోడల్‌లు

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

టిట్సులను విభాజించడమెలా?

మీ API కీను పొందుము

మీ మొదటి కాల్‌ చేయండి

మీ మోడల్‌ను యెంచుకొనుము

ఫిలింగ్ నుండి షిప్

కోడ్ ఉదాహరణలు త్వరితంగా ప్రారంభించు

ఏం అభివృద్ధికారులు TTS.ai తో నిర్మాణం

II చాట్‌బాట్స్ & సహాయకులు

మొబైల్ & స్వర ప్రస్తావనలు

సాసా ఉత్పత్తిలు

దానంతటదే గీతలు

API నిర్ణీతలు

తరచూ అడగబడే ప్రశ్నలు

API ఓపెన్ AITTS ఫార్మేట్ తో సారూప్యంగా ఉందా?

రియల్- థీమస్- టైమ్ అనువర్తనములకు లేబుల్ పేరు ఏమిటి?

API ఉపయోగం కోసం పిక్సింగ్ ఎలా పనిచేస్తుంది?

నేను API ద్వారా వాయిస్ క్లోనింగ్ ఉపయోగించగలరా?

ఒక రేటు పరిమితి ఉందా?

API ఫార్మేట్లు తిరిగి చేరుస్తాయి?

నేను స్వర సహాయకుడు లేదా చాట్బాట్ నిర్మించడానికి API ఉపయోగించగలనా?

అక్కడ ఒక వెబ్‌ సైటుగా ఉన్నదా లేక API ప్రవాహాన్ని నడుపుతున్నారా?

నేను ఉత్పత్తిలో తప్పులు మరియు రేటింగ్లను ఎలా నిర్వహించుతాను?

అందుబాటులో ఉన్న స్వరాలు, మోడల్‌ ప్రోగ్రామును యాదృచ్ఛికంగా వ్రాయగలనా?

ఇసుక బాక్స్‌ లేక పరీక్షా వాతావరణం ఉందా?

API ఉపయోగించడానికి బదులుగా నేను స్వయంగా-హోస్టు చేయగలరా?

స్వరం AIతో కట్టాలా?