Տեղեկացնել սխալի / հատկության մասին

Տեքստ-խոսք API ծրագրավորողների համար

Ստեղծեք ձայնային ծրագրեր մեր REST API-ի միջոցով։ Ավելացրեք բնական տեքստը խոսքի, ձայնի կլոնավորումը, խոսքը տեքստի և ձայնային վերամշակումը ձեր ծրագրերին, զրուցախցիկներին, ձայնային օգնականներին և SaaS ապրանքներին։ OpenAI-ի հետ համընկնող ձևաչափ, 20+ մոդելներ, պարզ ինտեգրում։

REST API Խոսքակցային ռոբոտներ Ձայնային ծրագրեր SaaS ապրանքներ Ավտոմատացում

Պարզ TTS խմբագրիչ API փաստաթղթեր

Փորձել այժմ

0/500

Ազատ Kokoro, Piper, VITS, MeloTTS-ի հետ

Ձեր ստեղծած ձայնը կհայտնվի այստեղ

Բացել ամբողջական TTS խմբագրիչը

API ֆունկցիաներ ծրագրավորողների համար

Ամեն ինչ, ինչի կարիք ունեք ձայնային ծրագրեր ստեղծելու համար

Պարզ REST API

Ընդամենը մեկ POST խնդրանք ձայնի ստեղծման համար։ JSON խնդրանք, ձայնային պատասխան։ Աշխատում է ցանկացած ծրագրավորման լեզվով, որը աջակցում է HTTP- ին։

OpenAI- համապատասխան

OpenAI TTS API-ի փոխարինիչը։ Փոխեք base_url-ը և API-ի կոդը, և գոյություն ունեցող կոդը կաշխատի անմիջապես։

24+ հասանելի մոդելներ

Մուտք գործել յուրաքանչյուր մոդելի միջոցով մեկ API- ի միջոցով։ Մեկ պարամետր փոխելով փոխեք մոդելները։ Համեմատեք որակը, արագությունը և արժեքը։

Ընդմիջում

Kokoro-ն ձայնագրում է 1 վայրկյանից քիչ ժամանակում։ Լավագույնը իրական ժամանակի զրույցների, ձայնային օգնականների և ինտերակտիվ ծրագրերի համար։

Խոսքի կլոնավորման API

Կլոնել ցանկացած ձայն կարճ ձայնային նմուշից API-ի միջոցով։ Կիրառել կլոնված ձայները բոլոր հետագա սերունդների համար։

Բազմաթիվ ձևեր

Արտադրել WAV, MP3, OGG կամ FLAC ձևաչափերով։ Ընտրեք նմուշների հաճախականությունը և բիթային խորությունը։ Ավտոմատ ձայնագրման աջակցություն իրական ժամանակի ծրագրերի համար։

Հեղինակային իրավունք

Ընտրեք ճիշտ մոդելը Ձեր ծրագրի արագության, որակի և արժեքի պահանջների համար

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Լավագույնը ՝ Առավել արագ մոդելը` վայրկյանների ցածր տևողությամբ, իդեալական է իրական ժամանակի ծրագրերի և զրույցների համար

Փորձել Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Ձայնի կլոնավորում

Լավագույնը ՝ TTS-ի հոսք ձայնի կլոնավորմամբ ձայնային օգնական ծրագրերի համար

Փորձել CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Լավագույնը ՝ Խոսակցական արհեստական բանականություն բնական ժամանակացույցով զրույցների և օգնականի ձայնի համար

Փորձել Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Լավագույնը ՝ Ազատ, միայն պրոցեսորի վրա հիմնված մոդել մեծ ծավալի ծրագրերի համար՝ զրոյական վարկային ծախսերով

Փորձել Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Լավագույնը ՝ Աուդիո գեներացիա ձայնային էֆեկտներով ստեղծագործական և զվարճալի ծրագրերի համար

Փորձել Bark

Ինչպես ներգրավել TTS API- ն

5 րոպեից պակաս ժամանակ է պահանջվում գրանցումից մինչև առաջին API կոչը

Գրանցվել API-ում

Գրանցվեք անվճար և ստեղծեք API կոդ Ձեր հաշվի ցուցադրման վահանակից։ 15,000 կերպար ներառված է։

Առաջին զանգը

POST /v1/tts-ին տեքստի, մոդելի և ձայնի հետ։ Ավտոմատ կերպով վերադարձրեք ձայնային բայտները։ 5 տող կոդով։

Ընտրեք ձեր մոդելը

Ստուգեք տարբեր մոդելներ Ձեր օգտագործման համար։ Համեմատեք արագությունը, որակը և ծախսը յուրաքանչյուր սերնդի համար։

Գործողություն

Մակարդեք pay-as-you-go կերպարներով։ Պետք է վճարեք պլանների համար։ Նախատեսեք օգտագործումը ձեր կառավարման վահանակում։

Ճիշտ սկզբնական կոդի օրինակներ

TTS.ai-ը ցանկացած լեզվով միացնել մեր REST API-ի միջոցով

Python Համացանցում

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Համաշխարհային

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- համապատասխան ձևաչափ Ընտրեք

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ստացեք ձեր անվճար API կոդը

Ինչ են մշակողները կառուցում TTS.ai-ի հետ

Համատարած ինտեգրման մոդելներ և ծրագրեր

AI զրույցներ և օգնականներ

Ավելացնել ձայնային ելքը ձեր զրույցների ռոբոտին կամ AI օգնականին։ LLM պատասխանները ուղարկել TTS-ի միջոցով ձայնային ինտերֆեյսների համար։ Kokoro-ն ապահովում է վայրկյանների ցածր ուշացում իրական ժամանակի զրույցների համար։ Sesame CSM-ը գեներացնում է խոսակցությունը բնական ժամանակավորմամբ։

LLM- ի պատասխան ձայնային խողովակաշարին
Ցանկացած վայրկյանի ուշացում Kokoro-ի հետ
Խոսել Sesame CSM-ի միջոցով
Աուդիո ելք

Բջջային և ձայնային ծրագրեր

Ստեղծեք ձայնային աջակցությամբ բջջային ծրագրեր, հասանելիության գործիքներ, կարդալու ծրագրեր և լեզվի ուսուցման պլատֆորմներ։ Մեր REST API-ն աշխատում է ցանկացած բջջային ծրագրի հետ։ Տեղադրեք ձայնային ֆայլեր կամ ուղիղ հոսք դեպի կրեատոր։

React Native, Flutter, Swift, Kotlin
Մատչելիություն և կարդալու ծրագրեր
Լեզվի ուսուցման պլատֆորմ
Աուդիո պարունակության ստեղծում

SaaS-ի արտադրանքներ

White-label ձայնային հնարավորություններ Ձեր SaaS արտադրանքում։ Ավելացրեք TTS, STT, ձայնային կլոնավորում և ձայնային վերամշակում որպես Ձեր պլատֆորմի հատկություններ։ Կիրառեք մեր API-ն որպես Ձեր ձայնային backend առանց GPU ենթակառուցվածքի կառավարման։

White-label ձայնային հատկություններ
Գրաֆիկական պրոցեսորի ինֆրակառուցվածք չի պահանջվում
Pay-per-use գնահատական
20+ մոդելներ ձեր օգտատերերին առաջարկելու համար

Ավտոմատացման խողովակներ

Ինտեգրեք ձայնի ստեղծումը CI/CD ջրատարների մեջ, բովանդակության ավտոմատացում և բեռնվածքային աշխատանքային հոսքեր։ Գործեք հազարավոր ձայնային ֆայլեր թվային աղյուսակների տվյալներից, ավտոմատացրեք podcast-ի արտադրությունը կամ ստեղծեք բովանդակության տեղայնացման ջրատարներ։

Փաթեթային աշխատանք API-ի միջոցով
Ընդգրկվածության լեզվաբանական ջրատարներ
CI/CD միավորում
Տվյալների աղյուսակ ձայնային ավտոմատացման համար

Դիտել ամբողջական API փաստաթղթավորումը

API հատկություններ

Ծրագրեր արտադրության համար

20+

TTS մոդելներ

100+

ձայներ

30+

Լեզուներ

<1s

Լռելյայն

Գրանցվել անվճար — 15,000 քարտեր

Հաճախ տրվող հարցեր

TTS.ai ծրագրավորողի API-ի մասին հաճախակի հարցեր

Այո, մեր API-ն հետևում է OpenAI ձայնային խոսքի ձևաչափին։ Եթե դուք օգտագործում եք OpenAI Python կամ JavaScript հաճախորդի գրադարանը, կարող եք փոխել TTS.ai-ը` փոխելով base_url և api_key պարամետրերը։ Ձեր առկա կոդը աշխատում է առանց փոփոխության։

Kokoro- ն ձայնագրում է տիպիկ նախադասությունները 1 վայրկյանից ավելի քիչ ժամանակում։ CosyVoice 2- ն աջակցում է հոսող ձայնագրությանը, որպեսզի նվազեցնի ուշացումը։ Խոսակցման ռոբոտների և ձայնային օգնականների համար ընդհանուր ընթացքը տևում է 1-3 վայրկյան՝ կախված տեքստի երկարությունից և մոդելի ընտրությունից։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) ամբողջությամբ անվճար են։ Ստանդարտ մոդելները օգտագործում են 2x հերոսներ 1K տեքստի համար։ Պրեմիում մոդելները օգտագործում են 4x հերոսներ 1K տեքստի համար։ Գրանցվեք անվճար 15,000 հերոսներով։ Պլանները սկսվում են $9/ ամսվա համար 500,000 հերոսների համար։

Այո։ Տեղադրել հղման ձայնային նմուշ (5-30 վայրկյան) ձայնային կլոնավորման վերջնական կետ, ապա օգտագործել կլոնավորված ձայնային ID-ն հետագա TTS խնդրանքներում։ Կլոնավորումը աջակցող մոդելները ներառում են CosyVoice 2, Chatterbox, Fish Speech և GPT-SoVITS։

Ազատ մակարդակն ունի հիմնական արագության սահմանափակում (3 խնդրանք մեկ ժամում առանց հաշվի)։ Փոխարենը վճարովի պլանները ունեն մեծ արագության սահմանափակումներ, որոնք հարմար են արտադրական ծրագրերի համար։ Կապվեք մեզ հետ՝ enterprise- ի մակարդակի պահանջների համար։

WAV (չսեղմված, ամենաբարձր որակ), MP3 (սեղմված, փոքր ֆայլեր), OGG (բաց ֆորմատ) և FLAC (չխնայող սեղմում)։ Ձեր խնդրանքում նշեք ֆորմատը։ Լռելյայն՝ WAV մոդելի բնական նմուշների արագությամբ։

Այո։ Միացրեք մեր TTS API-ն խոսքից-տեքստի մոդելի և LLM-ի հետ՝ ստեղծելու համար լրիվ ձայնային օգնականի ջրատար։ Kokoro-ն ապահովում է վայրկյանների ցածր ուշացում, որը հարմար է իրական ժամանակի զրույցների համար։ CosyVoice 2-ը աջակցում է հոսող ելքին՝ նույնիսկ ավելի ցածր արձագանքման ժամանակի համար։

CosyVoice 2 և Kokoro- ն աջակցում են հոսող ձայնային ելքը, որտեղ ձայնային կտորները տրվում են դրանք ստեղծելիս։ Սա նվազեցնում է ժամանակը մինչև առաջին байт-ը իրական ժամանակի ծրագրերի համար, ինչպիսիք են ձայնային օգնականները և ինտերակտիվ փորձը։

API- ն ետ է տալիս ստանդարտ HTTP վիճակի կոդերը։ 5xx սխալների և արագության սահմանափակման պատասխանների դեպքում գործադրեք էքսպոնենցիալ հետադարձ կապ։ Միջոցառումների համար ավելացրեք երթևեկության ցուցակ՝ փորձելու նորից տրամաբանությամբ։ Մեր API- ն ունի բարձր գործողության ժամանակ, բայց միշտ էլ խորհուրդ է տրվում ճկուն սխալների կառավարում։

Այո։ /v1/voices և /v1/models վերջնական կետերը վերադարձնում են բոլոր հասանելի ձայների և մոդելների JSON ցուցակներ՝ իրենց մետա տվյալներով (լեզուների աջակցություն, որակի գնահատականներ, արագության գնահատականներ և գների մակարդակ)։ Կիրառեք դրանք ձեր ծրագրում դինամիկ մոդելի ընտրողներ ստեղծելու համար։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) ծառայում են որպես արդյունավետ սառցախցիկ, քանի որ դրանք արժեն զրոյական վարկ։ Ստուգեք ձեր ինտեգրումը ազատ մոդելների հետ, այնուհետև փոխեք premium մոդելները արտադրության մեջ՝ փոխելով մոդելի պարամետրը։ Ոչ մի առանձին փորձարկման միջավայր չի պահանջվում։

Մեր մոդելներից շատերը բաց կոդով են և կարող են ինքնուրույն ապահովվել։ Բայց ինքնուրույն ապահովումը պահանջում է GPU-ի ռեսուրսների մեծ քանակություն (մենք օգտագործում ենք 4x NVIDIA Tesla P40, ընդհանուր 96 ԳԲ VRAM)։ API-ն ապահովում է արդյունավետ այլընտրանք առանց ենթակառուցվածքների կառավարման։

5.0/5 (1)

Պատրաստ եք ստեղծել ձայնային AI-ով

Ստացեք ձեր անվճար API կոդը և սկսեք կառուցել։ 50 վարկ գրանցվելիս, անվճար մոդելներ, ամբողջական փաստաթղթեր։

Անվճար գրանցում Ցույց տալ գները

Տեքստ-խոսք API ծրագրավորողների համար

Փորձել այժմ

Սիրում եք TTS.ai-ն? Պատմեք ձեր ընկերներին։

API ֆունկցիաներ ծրագրավորողների համար

Պարզ REST API

OpenAI- համապատասխան

24+ հասանելի մոդելներ

Ընդմիջում

Խոսքի կլոնավորման API

Բազմաթիվ ձևեր

Հեղինակային իրավունք

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Ինչպես ներգրավել TTS API- ն

Գրանցվել API-ում

Առաջին զանգը

Ընտրեք ձեր մոդելը

Գործողություն

Ճիշտ սկզբնական կոդի օրինակներ

Ինչ են մշակողները կառուցում TTS.ai-ի հետ

AI զրույցներ և օգնականներ

Բջջային և ձայնային ծրագրեր

SaaS-ի արտադրանքներ

Ավտոմատացման խողովակներ

API հատկություններ

Հաճախ տրվող հարցեր

Արդյո՞ք API-ն համընկնում է OpenAI TTS ֆորմատի հետ։

Ո՞րն է իրական ժամանակի ծրագրերի լռության ժամանակը

Ինչպե՞ս է աշխատում API-ի օգտագործման գինը։

Կարո՞ղ եմ օգտագործել ձայնի կլոունավորումը API-ի միջոցով։

Արդյո՞ք կա արագության սահմանափակում։

Ի՞նչ ձայնային ձևաչափեր է API-ն վերադարձնում։

Կարո՞ղ եմ օգտագործել API-ն ձայնային օգնական կամ զրուցախցիկ ստեղծելու համար։

Կա՞ WebSocket կամ հոսքի API

Ինչպե՞ս պետք է վարվեմ սխալների և կրկնակի փորձերի հետ արտադրության ժամանակ։

Կարո՞ղ եմ ցուցակագրել հասանելի ձայները և մոդելները ծրագրային կերպով։

Կա՞ն արդյոք ջրային կամ փորձարկման միջավայրեր։

Կարո՞ղ եմ մոդելները ինքս ապահովել API-ն օգտագործելու փոխարեն։

Պատրաստ եք ստեղծել ձայնային AI-ով