API Testun i Leferydd ar gyfer datblygwyrName

Adeiladu cymwysiadau galluogi llais gyda'n API REST. Ychwanegu testun-i-ganu naturiol, clonio llais, llais-i-testun, a phrosesu sain i'ch cymwysiadau, chatbots, cymorthwyr llais, a chynhyrchion SaaS. Fformat cydnaws â OpenAI, 24+ modelau, integreiddio syml.

API REST Sgwrsbots Rhaglenni Llywio Cynhyrchion Awtomatig

Ceisiwch Nawr

0/500
Am ddim gyda Kokoro, Piper, VITS, MeloTTS
Your generated audio will appear here
Creuwyd
0:00 0:00
Lawrlwytho
Ydych chi'n hoffi TTS.ai? Dywedwch wrth eich ffrindiau!

Nodweddion API ar gyfer datblygwyr

Popeth sydd ei angen arnoch i adeiladu rhaglenni galluog i siarad

API REST symlName

Un cais POST i greu llais. Cais JSON, ymateb sain. Gweithio gydag unrhyw iaith raglennu sy'n cynnal HTTP.

Cydnaws OpenAI

Amnewid sy'n syrthio i mewn ar gyfer API TTS OpenAI. Newid eich base_url ac allwedd API - mae'r cod presennol yn gweithio yn syth.

Modelau ar gael

Cyrchu pob model drwy API sengl. Newid modelau drwy newid un paramedr. Cymharu ansawdd, cyflymder, a chost.

Goramser Is- ail

Mae Kokoro yn creu sain mewn llai na 1 eiliad. Perffaith ar gyfer bots sgwrsio amser real, cynorthwywyr llais, a rhaglenni rhyngweithiol.

API Clonio LleferyddName

Cloni unrhyw lais o sampl sain byr drwy'r API. Defnyddio lais cloniedig ar gyfer pob cenedlaethau dilynol.

Amryw Fformatau

Allbwn fel WAV, MP3, OGG, neu FLAC. Dewiswch gyfradd samplu a dyfnder did. Cynhaliaeth llif sain ar gyfer cymwysiadau amser real.

Modelau Gorau ar gyfer Cyfuniad Datblygwr

Dewiswch y model cywir ar gyfer eich cymhwysiad

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Gorau ar gyfer: Model cyflymaf - cylchdroi is-eiliadau, yn berffaith ar gyfer rhaglenni amser real a bots sgwrsio

Ceisio Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Clonio Llywio

Gorau ar gyfer: Darlledu TTS gyda chlonio llais ar gyfer cymhwysiadau cymorth llais

Ceisio CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Gorau ar gyfer: AI cyfathrebu gydag amseru naturiol ar gyfer bot sgwrs a llais cynorthwyydd

Ceisio Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Gorau ar gyfer: Model am ddim, CPU-yn-unig ar gyfer cymhwysiadau o faint uchel gyda chostau credyd sero

Ceisio Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Gorau ar gyfer: Creu sain gydag effeithiau sain ar gyfer rhaglenni creadigol a hamdden

Ceisio Bark

Sut i Gyfuno'r API TTS

O gofrestru i'r galwad API cyntaf mewn llai na 5 munud

1

Cyrchu eich Allwedd API

Cofrestru am ddim a chreu allwedd API o'ch panel rheoli cyfrif. 50 credyd yn cynnwys.

2

Gwneud Eich Galwad Cyntaf

POST i /v1/tts gyda testun, model, a llais. Nôl beitiau sain. O dan 5 llinell o god.

3

Dewiswch eich Model

Profi modelau gwahanol ar gyfer eich achos defnydd. Cymharu cyflymder, ansawdd, a chost y genhedlaeth.

4

Llongau i Gynhyrchu

Scale with pay-as-you-go credits. No rate limits on paid plans. Monitor use in your dashboard.

Enghreifftiau Côd Cychwyn Cyflym

Cyfuno TTS.ai mewn unrhyw iaith gyda'n API REST

Python Poblogaidd
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Cyffredinol
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Fformat Cydnaws OpenAI Gollwng-mewn
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Beth mae datblygwyr yn ei adeiladu gyda TTS.ai

Patrymau a chymhwysiadau integreiddio cyffredin

Sgwrsbots a Chynorthwywyr AIName

Ychwanegu allbwn llais i'ch bot sgwrsio neu eich cynorthwyydd AI. Pibewch ymatebion LLM drwy TTS ar gyfer rhyngwynebau galluogi llais. Mae Kokoro yn darparu dirywiad is-eiliadau ar gyfer sgyrsiau amser real. Mae Sesame CSM yn creu llais sgwrsio gydag amseru naturiol.

  • Ymateb LLM i bibell siarad
  • Goramser is-eiliadau gyda Kokoro
  • Lleferydd cyfathrebu gyda Sesame CSM
  • Allbwn Sain Llif

Cymhwysiadau Symudol a LlywioName

Adeiladu cymwysiadau symudol galluog i siarad, offer hygyrchedd, cymwysiadau darllen, a platfformau dysgu iaith. Mae ein API REST yn gweithio gydag unrhyw ffrâmwaith symudol. Lawrlwythwch ffeiliau sain neu ffrydio'n uniongyrchol i'r cleient.

  • Flutter, Swift, KotlinName
  • Rhaglenni hygyrchedd a darllen
  • Platfformau dysgu iaith
  • Creu cynnwys sain

Cynhyrchion

Nodweddion llais label gwyn yn eich cynnyrch SaaS. Ychwanegu TTS, STT, clonio llais, a phrosesu sain fel nodweddion yn eich platfform. Defnyddiwch ein API fel eich ochr gefn llais heb reoli strwythur GPU.

  • Nodweddion llais label gwyn
  • Dim angen strwythur GPU
  • Prisiau talu-yn-ôl-i-ddefnyddio
  • 24+ modelau i gynnig i'ch defnyddwyr

Pipelines Awtomatig

Cyfuno creu llais mewn pibellau CI/CD, awtomeiddio cynnwys, a llif gwaith prosesu batch. Creu miloedd o ffeiliau sain o ddata tabl cyfrif, awtomeiddio cynhyrchu pod, neu adeiladu pibellau lleoli cynnwys.

  • Prosesu batch drwy API
  • Pibellau lleoli cynnwys
  • Cyfuniad CI/CD
  • Taenlen i awtomeiddio sain

Penodiadau API

Adeiladwyd ar gyfer rhaglenni cynhyrchu

24+

Modelau TTS

100+

Llais

30+

Ieithoedd

<1s

Goramser (Kokoro)

Cwestiynau a Ofynnir yn Aml

Cwestiynau cyffredin am API datblygwr TTS.ai

Ie. Mae ein API yn dilyn y fformat siarad sain OpenAI. Os ydych chi'n defnyddio'r rhaglengell dibynnydd OpenAI Python neu JavaScript, gallwch newid i TTS.ai drwy newid y paramedrau base_url ac api_key. Mae'ch cod cyfredol yn gweithio heb newid.

Mae Kokoro yn creu sain mewn llai na 1 eiliad ar gyfer ymadroddion arferol. Cynhelir allbwn llif CosyVoice 2 ar gyfer dirywiad hyd yn oed llai. Ar gyfer sgwrsiobots a chymorthwyr llais, mae'r amser cyfan yn 1-3 eiliad yn dibynnu ar hyd y testun a'r dewis model.

Mae modelau am ddim (Kokoro, Piper, VITS, MeloTTS) yn costio dim credydau. Mae modelau safonol yn costio 2 credyd am bob 1,000 o nodau. Mae modelau premiwm yn costio 4 credyd am bob 1,000 o nodau. Cofrestru am ddim gyda 50 credyd. Mae cynlluniau'n dechrau ar $9/mis am 500 o gredydau.

Ie. Llwytho sampl sain cyfeirio (5-30 eiliad) i'r diweddfa clonio llais, yna defnyddio'r ID llais clônedig mewn ceisiadau TTS dilynol. Mae modelau sy'n cynnal clonio yn cynnwys CosyVoice 2, Chatterbox, Fish Speech, a GPT-SoVITS.

Mae gan lefel am ddim gyfyngiad cyflymder sylfaenol (3 cais yr awr heb gyfrif). Mae gan gynlluniau talu gyfyngiadau cyflymder mawr sy'n addas ar gyfer cymwysiadau cynhyrchu. Cysylltwch â ni am ofynion cyflymder ar lefel cwmni.

WAV (ddim wedi'i gywasgu, ansawdd uchaf), MP3 (wedi'i gywasgu, ffeiliau llai), OGG (fformat agored), a FLAC (cywasgu heb golli). Penodwch y fformat yn eich cais. Rhagosodedig yw WAV ar gyfradd sampl naturiol y model.

Ie. Cyfunwch ein API TTS gyda model siarad-i-destun a LLM i adeiladu pibellau cymorth llais cyflawn. Mae Kokoro yn darparu dirywiad is-eiliadau sy'n berffaith ar gyfer sgyrsiau amser real. Mae CosyVoice 2 yn cynnal allbwn llif ar gyfer amserau ymateb hyd yn oed yn is.

Mae CosyVoice 2 a Kokoro yn cynnal allbwn sain llif lle caiff darnau sain eu dosbarthu wrth iddynt gael eu creu. Mae hyn yn lleihau'r amser i'r beitiau cyntaf ar gyfer rhaglenni amser real fel cymorthwyr llais a phrofiadau rhyngweithiol.

Mae'r API yn dychwelyd codau cyflwr HTTP safonol. Gweithredu adfer esboniadol ar gyfer gwallau 5xx ac ymatebion terfyn cyflymder. Ar gyfer cymwysiadau hanfodol, ychwanegwch ciw gyda rhesymeg ail-geisio. Mae gan ein API amser gweithredu uchel, ond argymhellir trin gwallau effeithlon o hyd.

Ie. Mae'r diweddbwyntiau /v1/voices a /v1/models yn dychwelyd rhestrau JSON o bob llais a model sydd ar gael gyda'u metadata (cynhaliaeth iaith, graddau ansawdd, graddau cyflymder, a lefel pris). Defnyddiwch y rhain i adeiladu dewiswyr model dynamig yn eich cymhwysiad.

Mae modelau am ddim (Kokoro, Piper, VITS, MeloTTS) yn gwasanaethu fel blwch tywod effeithiol gan eu bod yn costio sero o gredydau. Arbrofiwch eich integreiddio gyda modelau am ddim, ac yna newidwch i'r modelau premiwm mewn cynhyrchu gan newid y paramedr model. Nid oes angen amgylchedd prawf ar wahân.

Mae'r rhan fwyaf o'n modelau'n ffynhonnell agored a gellir eu hunan-gartrefu. Fodd bynnag, mae angen adnoddau GPU sylweddol ar hunan-gartrefu (rydym yn defnyddio 4x NVIDIA Tesla P40 gyda 96GB o VRAM yn gyfan gwbl). Mae'r API yn darparu dewis arall cost-effeithiol heb reoli strwythur.
5.0/5 (1)

Prysur i Adeiladu efo AI Lleferydd?

Cael eich allwedd API am ddim a dechrau adeiladu. 50 credyd ar gofrestru, modelau am ddim ar gael, dogfennaeth gyfan.