Տեքստ-խոսք API ծրագրավորողների համար

Ստեղծեք ձայնային ծրագրեր մեր REST API-ի միջոցով։ Ավելացրեք բնական տեքստը խոսքի, ձայնի կլոնավորումը, խոսքը տեքստի և ձայնային վերամշակումը ձեր ծրագրերին, զրուցախցիկներին, ձայնային օգնականներին և SaaS ապրանքներին։ OpenAI-ի հետ համընկնող ձևաչափ, 20+ մոդելներ, պարզ ինտեգրում։

REST API Խոսքակցային ռոբոտներ Ձայնային ծրագրեր SaaS ապրանքներ Ավտոմատացում

Փորձել այժմ

Ազատ Kokoro, Piper, VITS, MeloTTS-ի հետ
Ձեր ստեղծած ձայնը կհայտնվի այստեղ
Գործողություն
Տեղադրել
Սիրում եք TTS.ai-ն? Պատմեք ձեր ընկերներին։

API ֆունկցիաներ ծրագրավորողների համար

Ամեն ինչ, ինչի կարիք ունեք ձայնային ծրագրեր ստեղծելու համար

Պարզ REST API

Ընդամենը մեկ POST խնդրանք ձայնի ստեղծման համար։ JSON խնդրանք, ձայնային պատասխան։ Աշխատում է ցանկացած ծրագրավորման լեզվով, որը աջակցում է HTTP- ին։

OpenAI- համապատասխան

OpenAI TTS API-ի փոխարինիչը։ Փոխեք base_url-ը և API-ի կոդը, և գոյություն ունեցող կոդը կաշխատի անմիջապես։

24+ հասանելի մոդելներ

Մուտք գործել յուրաքանչյուր մոդելի միջոցով մեկ API- ի միջոցով։ Մեկ պարամետր փոխելով փոխեք մոդելները։ Համեմատեք որակը, արագությունը և արժեքը։

Ընդմիջում

Kokoro-ն ձայնագրում է 1 վայրկյանից քիչ ժամանակում։ Լավագույնը իրական ժամանակի զրույցների, ձայնային օգնականների և ինտերակտիվ ծրագրերի համար։

Խոսքի կլոնավորման API

Կլոնել ցանկացած ձայն կարճ ձայնային նմուշից API-ի միջոցով։ Կիրառել կլոնված ձայները բոլոր հետագա սերունդների համար։

Բազմաթիվ ձևեր

Արտադրել WAV, MP3, OGG կամ FLAC ձևաչափերով։ Ընտրեք նմուշների հաճախականությունը և բիթային խորությունը։ Ավտոմատ ձայնագրման աջակցություն իրական ժամանակի ծրագրերի համար։

Հեղինակային իրավունք

Ընտրեք ճիշտ մոդելը Ձեր ծրագրի արագության, որակի և արժեքի պահանջների համար

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Լավագույնը ՝ Առավել արագ մոդելը` վայրկյանների ցածր տևողությամբ, իդեալական է իրական ժամանակի ծրագրերի և զրույցների համար

Փորձել Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Ձայնի կլոնավորում

Լավագույնը ՝ TTS-ի հոսք ձայնի կլոնավորմամբ ձայնային օգնական ծրագրերի համար

Փորձել CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Լավագույնը ՝ Խոսակցական արհեստական բանականություն բնական ժամանակացույցով զրույցների և օգնականի ձայնի համար

Փորձել Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Լավագույնը ՝ Ազատ, միայն պրոցեսորի վրա հիմնված մոդել մեծ ծավալի ծրագրերի համար՝ զրոյական վարկային ծախսերով

Փորձել Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Լավագույնը ՝ Աուդիո գեներացիա ձայնային էֆեկտներով ստեղծագործական և զվարճալի ծրագրերի համար

Փորձել Bark

Ինչպես ներգրավել TTS API- ն

5 րոպեից պակաս ժամանակ է պահանջվում գրանցումից մինչև առաջին API կոչը

1

Գրանցվել API-ում

Գրանցվեք անվճար և ստեղծեք API կոդ Ձեր հաշվի ցուցադրման վահանակից։ 15,000 կերպար ներառված է։

2

Առաջին զանգը

POST /v1/tts-ին տեքստի, մոդելի և ձայնի հետ։ Ավտոմատ կերպով վերադարձրեք ձայնային բայտները։ 5 տող կոդով։

3

Ընտրեք ձեր մոդելը

Ստուգեք տարբեր մոդելներ Ձեր օգտագործման համար։ Համեմատեք արագությունը, որակը և ծախսը յուրաքանչյուր սերնդի համար։

4

Գործողություն

Մակարդեք pay-as-you-go կերպարներով։ Պետք է վճարեք պլանների համար։ Նախատեսեք օգտագործումը ձեր կառավարման վահանակում։

Ճիշտ սկզբնական կոդի օրինակներ

TTS.ai-ը ցանկացած լեզվով միացնել մեր REST API-ի միջոցով

Python Համացանցում
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Համաշխարհային
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- համապատասխան ձևաչափ Ընտրեք
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ինչ են մշակողները կառուցում TTS.ai-ի հետ

Համատարած ինտեգրման մոդելներ և ծրագրեր

AI զրույցներ և օգնականներ

Ավելացնել ձայնային ելքը ձեր զրույցների ռոբոտին կամ AI օգնականին։ LLM պատասխանները ուղարկել TTS-ի միջոցով ձայնային ինտերֆեյսների համար։ Kokoro-ն ապահովում է վայրկյանների ցածր ուշացում իրական ժամանակի զրույցների համար։ Sesame CSM-ը գեներացնում է խոսակցությունը բնական ժամանակավորմամբ։

  • LLM- ի պատասխան ձայնային խողովակաշարին
  • Ցանկացած վայրկյանի ուշացում Kokoro-ի հետ
  • Խոսել Sesame CSM-ի միջոցով
  • Աուդիո ելք

Բջջային և ձայնային ծրագրեր

Ստեղծեք ձայնային աջակցությամբ բջջային ծրագրեր, հասանելիության գործիքներ, կարդալու ծրագրեր և լեզվի ուսուցման պլատֆորմներ։ Մեր REST API-ն աշխատում է ցանկացած բջջային ծրագրի հետ։ Տեղադրեք ձայնային ֆայլեր կամ ուղիղ հոսք դեպի կրեատոր։

  • React Native, Flutter, Swift, Kotlin
  • Մատչելիություն և կարդալու ծրագրեր
  • Լեզվի ուսուցման պլատֆորմ
  • Աուդիո պարունակության ստեղծում

SaaS-ի արտադրանքներ

White-label ձայնային հնարավորություններ Ձեր SaaS արտադրանքում։ Ավելացրեք TTS, STT, ձայնային կլոնավորում և ձայնային վերամշակում որպես Ձեր պլատֆորմի հատկություններ։ Կիրառեք մեր API-ն որպես Ձեր ձայնային backend առանց GPU ենթակառուցվածքի կառավարման։

  • White-label ձայնային հատկություններ
  • Գրաֆիկական պրոցեսորի ինֆրակառուցվածք չի պահանջվում
  • Pay-per-use գնահատական
  • 20+ մոդելներ ձեր օգտատերերին առաջարկելու համար

Ավտոմատացման խողովակներ

Ինտեգրեք ձայնի ստեղծումը CI/CD ջրատարների մեջ, բովանդակության ավտոմատացում և բեռնվածքային աշխատանքային հոսքեր։ Գործեք հազարավոր ձայնային ֆայլեր թվային աղյուսակների տվյալներից, ավտոմատացրեք podcast-ի արտադրությունը կամ ստեղծեք բովանդակության տեղայնացման ջրատարներ։

  • Փաթեթային աշխատանք API-ի միջոցով
  • Ընդգրկվածության լեզվաբանական ջրատարներ
  • CI/CD միավորում
  • Տվյալների աղյուսակ ձայնային ավտոմատացման համար

API հատկություններ

Ծրագրեր արտադրության համար

20+

TTS մոդելներ

100+

ձայներ

30+

Լեզուներ

<1s

Լռելյայն

Հաճախ տրվող հարցեր

TTS.ai ծրագրավորողի API-ի մասին հաճախակի հարցեր

Այո, մեր API-ն հետևում է OpenAI ձայնային խոսքի ձևաչափին։ Եթե դուք օգտագործում եք OpenAI Python կամ JavaScript հաճախորդի գրադարանը, կարող եք փոխել TTS.ai-ը` փոխելով base_url և api_key պարամետրերը։ Ձեր առկա կոդը աշխատում է առանց փոփոխության։

Kokoro- ն ձայնագրում է տիպիկ նախադասությունները 1 վայրկյանից ավելի քիչ ժամանակում։ CosyVoice 2- ն աջակցում է հոսող ձայնագրությանը, որպեսզի նվազեցնի ուշացումը։ Խոսակցման ռոբոտների և ձայնային օգնականների համար ընդհանուր ընթացքը տևում է 1-3 վայրկյան՝ կախված տեքստի երկարությունից և մոդելի ընտրությունից։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) ամբողջությամբ անվճար են։ Ստանդարտ մոդելները օգտագործում են 2x հերոսներ 1K տեքստի համար։ Պրեմիում մոդելները օգտագործում են 4x հերոսներ 1K տեքստի համար։ Գրանցվեք անվճար 15,000 հերոսներով։ Պլանները սկսվում են $9/ ամսվա համար 500,000 հերոսների համար։

Այո։ Տեղադրել հղման ձայնային նմուշ (5-30 վայրկյան) ձայնային կլոնավորման վերջնական կետ, ապա օգտագործել կլոնավորված ձայնային ID-ն հետագա TTS խնդրանքներում։ Կլոնավորումը աջակցող մոդելները ներառում են CosyVoice 2, Chatterbox, Fish Speech և GPT-SoVITS։

Ազատ մակարդակն ունի հիմնական արագության սահմանափակում (3 խնդրանք մեկ ժամում առանց հաշվի)։ Փոխարենը վճարովի պլանները ունեն մեծ արագության սահմանափակումներ, որոնք հարմար են արտադրական ծրագրերի համար։ Կապվեք մեզ հետ՝ enterprise- ի մակարդակի պահանջների համար։

WAV (չսեղմված, ամենաբարձր որակ), MP3 (սեղմված, փոքր ֆայլեր), OGG (բաց ֆորմատ) և FLAC (չխնայող սեղմում)։ Ձեր խնդրանքում նշեք ֆորմատը։ Լռելյայն՝ WAV մոդելի բնական նմուշների արագությամբ։

Այո։ Միացրեք մեր TTS API-ն խոսքից-տեքստի մոդելի և LLM-ի հետ՝ ստեղծելու համար լրիվ ձայնային օգնականի ջրատար։ Kokoro-ն ապահովում է վայրկյանների ցածր ուշացում, որը հարմար է իրական ժամանակի զրույցների համար։ CosyVoice 2-ը աջակցում է հոսող ելքին՝ նույնիսկ ավելի ցածր արձագանքման ժամանակի համար։

CosyVoice 2 և Kokoro- ն աջակցում են հոսող ձայնային ելքը, որտեղ ձայնային կտորները տրվում են դրանք ստեղծելիս։ Սա նվազեցնում է ժամանակը մինչև առաջին байт-ը իրական ժամանակի ծրագրերի համար, ինչպիսիք են ձայնային օգնականները և ինտերակտիվ փորձը։

API- ն ետ է տալիս ստանդարտ HTTP վիճակի կոդերը։ 5xx սխալների և արագության սահմանափակման պատասխանների դեպքում գործադրեք էքսպոնենցիալ հետադարձ կապ։ Միջոցառումների համար ավելացրեք երթևեկության ցուցակ՝ փորձելու նորից տրամաբանությամբ։ Մեր API- ն ունի բարձր գործողության ժամանակ, բայց միշտ էլ խորհուրդ է տրվում ճկուն սխալների կառավարում։

Այո։ /v1/voices և /v1/models վերջնական կետերը վերադարձնում են բոլոր հասանելի ձայների և մոդելների JSON ցուցակներ՝ իրենց մետա տվյալներով (լեզուների աջակցություն, որակի գնահատականներ, արագության գնահատականներ և գների մակարդակ)։ Կիրառեք դրանք ձեր ծրագրում դինամիկ մոդելի ընտրողներ ստեղծելու համար։

Ազատ մոդելները (Kokoro, Piper, VITS, MeloTTS) ծառայում են որպես արդյունավետ սառցախցիկ, քանի որ դրանք արժեն զրոյական վարկ։ Ստուգեք ձեր ինտեգրումը ազատ մոդելների հետ, այնուհետև փոխեք premium մոդելները արտադրության մեջ՝ փոխելով մոդելի պարամետրը։ Ոչ մի առանձին փորձարկման միջավայր չի պահանջվում։

Մեր մոդելներից շատերը բաց կոդով են և կարող են ինքնուրույն ապահովվել։ Բայց ինքնուրույն ապահովումը պահանջում է GPU-ի ռեսուրսների մեծ քանակություն (մենք օգտագործում ենք 4x NVIDIA Tesla P40, ընդհանուր 96 ԳԲ VRAM)։ API-ն ապահովում է արդյունավետ այլընտրանք առանց ենթակառուցվածքների կառավարման։
5.0/5 (1)

Ի՞նչ կարող ենք բարելավել: Ձեր կարծիքը օգնում է մեզ լուծել խնդիրները:

Պատրաստ եք ստեղծել ձայնային AI-ով

Ստացեք ձեր անվճար API կոդը և սկսեք կառուցել։ 50 վարկ գրանցվելիս, անվճար մոդելներ, ամբողջական փաստաթղթեր։