Adrodd Nam / Cais Nodweddion

API Testun i Leferydd ar gyfer datblygwyrName

Adeiladu cymwysiadau galluogi llais gyda'n API REST. Ychwanegu testun-i-ganu naturiol, clonio llais, llais-i-testun, a phrosesu sain i'ch cymwysiadau, chatbots, cymorthwyr llais, a chynhyrchion SaaS. Fformat cydnaws â OpenAI, mwy na 20 model, integreiddio syml.

API REST Sgwrsbots Rhaglenni Llywio Cynhyrchion Awtomatig

Golygydd TTS llawn Dogfennau API

Ceisiwch Nawr

0/500

Am ddim gyda Kokoro, Piper, VITS, MeloTTS

Bydd eich sain a gynhyrchwyd yn ymddangos yma

Agor golygydd TTS llawn

Nodweddion API ar gyfer datblygwyr

Popeth sydd ei angen arnoch i adeiladu rhaglenni galluog i siarad

API REST symlName

Un cais POST i greu llais. Cais JSON, ymateb sain. Gweithio gydag unrhyw iaith raglennu sy'n cynnal HTTP.

Cydnaws OpenAI

Amnewid sy'n syrthio i mewn ar gyfer API TTS OpenAI. Newid eich base_url ac allwedd API - mae'r cod presennol yn gweithio yn syth.

Modelau ar gael

Cyrchu pob model drwy API sengl. Newid modelau drwy newid un paramedr. Cymharu ansawdd, cyflymder, a chost.

Goramser Is- ail

Mae Kokoro yn creu sain mewn llai na 1 eiliad. Perffaith ar gyfer bots sgwrsio amser real, cynorthwywyr llais, a rhaglenni rhyngweithiol.

API Clonio LleferyddName

Cloni unrhyw lais o sampl sain byr drwy'r API. Defnyddio lais cloniedig ar gyfer pob cenedlaethau dilynol.

Amryw Fformatau

Allbwn fel WAV, MP3, OGG, neu FLAC. Dewiswch gyfradd samplu a dyfnder did. Cynhaliaeth llif sain ar gyfer cymwysiadau amser real.

Modelau Gorau ar gyfer Cyfuniad Datblygwr

Dewiswch y model cywir ar gyfer eich cymhwysiad

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Gorau ar gyfer: Model cyflymaf - cylchdroi is-eiliadau, yn berffaith ar gyfer rhaglenni amser real a bots sgwrsio

Ceisio Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Clonio Llywio

Gorau ar gyfer: Darlledu TTS gyda chlonio llais ar gyfer cymhwysiadau cymorth llais

Ceisio CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Gorau ar gyfer: AI cyfathrebu gydag amseru naturiol ar gyfer bot sgwrs a llais cynorthwyydd

Ceisio Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Gorau ar gyfer: Model am ddim, CPU-yn-unig ar gyfer cymhwysiadau o faint uchel gyda chostau credyd sero

Ceisio Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Gorau ar gyfer: Creu sain gydag effeithiau sain ar gyfer rhaglenni creadigol a hamdden

Ceisio Bark

Sut i Gyfuno'r API TTS

O gofrestru i'r galwad API cyntaf mewn llai na 5 munud

Cyrchu eich Allwedd API

Cofrestru am ddim a chreu allwedd API o'ch panel rheoli cyfrif. 50 credyd yn cynnwys.

Gwneud Eich Galwad Cyntaf

POST i /v1/tts gyda testun, model, a llais. Nôl beitiau sain. O dan 5 llinell o god.

Dewiswch eich Model

Profi modelau gwahanol ar gyfer eich achos defnydd. Cymharu cyflymder, ansawdd, a chost y genhedlaeth.

Llongau i Gynhyrchu

Graddio gyda nodau talu-fel-y-defnyddir. Dim terfyniadau cyfradd ar gynlluniau talu. Monitrwch y defnydd yn eich panel rheoli.

Enghreifftiau Côd Cychwyn Cyflym

Cyfuno TTS.ai mewn unrhyw iaith gyda'n API REST

Python Poblogaidd

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Cyffredinol

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

Fformat Cydnaws OpenAI Gollwng-mewn

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Cyrchu'ch Allwedd API Am Ddim

Beth mae datblygwyr yn ei adeiladu gyda TTS.ai

Patrymau a chymhwysiadau integreiddio cyffredin

Sgwrsbots a Chynorthwywyr AIName

Ychwanegu allbwn llais i'ch bot sgwrsio neu eich cynorthwyydd AI. Pibewch ymatebion LLM drwy TTS ar gyfer rhyngwynebau galluogi llais. Mae Kokoro yn darparu dirywiad is-eiliadau ar gyfer sgyrsiau amser real. Mae Sesame CSM yn creu llais sgwrsio gydag amseru naturiol.

Ymateb LLM i bibell siarad
Goramser is-eiliadau gyda Kokoro
Lleferydd cyfathrebu gyda Sesame CSM
Allbwn Sain Llif

Cymhwysiadau Symudol a LlywioName

Adeiladu cymwysiadau symudol galluog i siarad, offer hygyrchedd, cymwysiadau darllen, a platfformau dysgu iaith. Mae ein API REST yn gweithio gydag unrhyw ffrâmwaith symudol. Lawrlwythwch ffeiliau sain neu ffrydio'n uniongyrchol i'r cleient.

Flutter, Swift, KotlinName
Rhaglenni hygyrchedd a darllen
Platfformau dysgu iaith
Creu cynnwys sain

Cynhyrchion

Nodweddion llais label gwyn yn eich cynnyrch SaaS. Ychwanegu TTS, STT, clonio llais, a phrosesu sain fel nodweddion yn eich platfform. Defnyddiwch ein API fel eich ochr gefn llais heb reoli strwythur GPU.

Nodweddion llais label gwyn
Dim angen strwythur GPU
Prisiau talu-yn-ôl-i-ddefnyddio
20+ modelau i gynnig i'ch defnyddwyr

Pipelines Awtomatig

Cyfuno creu llais mewn pibellau CI/CD, awtomeiddio cynnwys, a llif gwaith prosesu batch. Creu miloedd o ffeiliau sain o ddata tabl cyfrif, awtomeiddio cynhyrchu pod, neu adeiladu pibellau lleoli cynnwys.

Prosesu batch drwy API
Pibellau lleoli cynnwys
Cyfuniad CI/CD
Taenlen i awtomeiddio sain

Gweld dogfennaeth API lawn

Penodiadau API

Adeiladwyd ar gyfer rhaglenni cynhyrchu

20+

Modelau TTS

100+

Llais

30+

Ieithoedd

<1s

Goramser (Kokoro)

Cofrestru Am Ddim — 15,000 Nod

Cwestiynau a Ofynnir yn Aml

Cwestiynau cyffredin am API datblygwr TTS.ai

Ie. Mae ein API yn dilyn y fformat siarad sain OpenAI. Os ydych chi'n defnyddio'r rhaglengell dibynnydd OpenAI Python neu JavaScript, gallwch newid i TTS.ai drwy newid y paramedrau base_url ac api_key. Mae'ch cod cyfredol yn gweithio heb newid.

Mae Kokoro yn creu sain mewn llai na 1 eiliad ar gyfer ymadroddion arferol. Cynhelir allbwn llif CosyVoice 2 ar gyfer dirywiad hyd yn oed llai. Ar gyfer sgwrsiobots a chymorthwyr llais, mae'r amser cyfan yn 1-3 eiliad yn dibynnu ar hyd y testun a'r dewis model.

Mae modelau am ddim (Kokoro, Piper, VITS, MeloTTS) yn costio dim credydau. Mae modelau safonol yn costio 2 credyd am bob 1,000 o nodau. Mae modelau premiwm yn costio 4 credyd am bob 1,000 o nodau. Cofrestru am ddim gyda 50 credyd. Mae cynlluniau'n dechrau ar $9/mis am 500 o gredydau.

Ie. Llwytho sampl sain cyfeirio (5-30 eiliad) i'r diweddfa clonio llais, yna defnyddio'r ID llais clônedig mewn ceisiadau TTS dilynol. Mae modelau sy'n cynnal clonio yn cynnwys CosyVoice 2, Chatterbox, Fish Speech, a GPT-SoVITS.

Mae gan lefel am ddim gyfyngiad cyflymder sylfaenol (3 cais yr awr heb gyfrif). Mae gan gynlluniau talu gyfyngiadau cyflymder mawr sy'n addas ar gyfer cymwysiadau cynhyrchu. Cysylltwch â ni am ofynion cyflymder ar lefel cwmni.

WAV (ddim wedi'i gywasgu, ansawdd uchaf), MP3 (wedi'i gywasgu, ffeiliau llai), OGG (fformat agored), a FLAC (cywasgu heb golli). Penodwch y fformat yn eich cais. Rhagosodedig yw WAV ar gyfradd sampl naturiol y model.

Ie. Cyfunwch ein API TTS gyda model siarad-i-destun a LLM i adeiladu pibellau cymorth llais cyflawn. Mae Kokoro yn darparu dirywiad is-eiliadau sy'n berffaith ar gyfer sgyrsiau amser real. Mae CosyVoice 2 yn cynnal allbwn llif ar gyfer amserau ymateb hyd yn oed yn is.

Mae CosyVoice 2 a Kokoro yn cynnal allbwn sain llif lle caiff darnau sain eu dosbarthu wrth iddynt gael eu creu. Mae hyn yn lleihau'r amser i'r beitiau cyntaf ar gyfer rhaglenni amser real fel cymorthwyr llais a phrofiadau rhyngweithiol.

Mae'r API yn dychwelyd codau cyflwr HTTP safonol. Gweithredu adfer esboniadol ar gyfer gwallau 5xx ac ymatebion terfyn cyflymder. Ar gyfer cymwysiadau hanfodol, ychwanegwch ciw gyda rhesymeg ail-geisio. Mae gan ein API amser gweithredu uchel, ond argymhellir trin gwallau effeithlon o hyd.

Ie. Mae'r diweddbwyntiau /v1/voices a /v1/models yn dychwelyd rhestrau JSON o bob llais a model sydd ar gael gyda'u metadata (cynhaliaeth iaith, graddau ansawdd, graddau cyflymder, a lefel pris). Defnyddiwch y rhain i adeiladu dewiswyr model dynamig yn eich cymhwysiad.

Mae modelau am ddim (Kokoro, Piper, VITS, MeloTTS) yn gwasanaethu fel blwch tywod effeithiol gan eu bod yn costio sero o gredydau. Arbrofiwch eich integreiddio gyda modelau am ddim, ac yna newidwch i'r modelau premiwm mewn cynhyrchu gan newid y paramedr model. Nid oes angen amgylchedd prawf ar wahân.

Mae'r rhan fwyaf o'n modelau'n ffynhonnell agored a gellir eu hunan-gartrefu. Fodd bynnag, mae angen adnoddau GPU sylweddol ar hunan-gartrefu (rydym yn defnyddio 4x NVIDIA Tesla P40 gyda 96GB o VRAM yn gyfan gwbl). Mae'r API yn darparu dewis arall cost-effeithiol heb reoli strwythur.

5.0/5 (1)

Prysur i Adeiladu efo AI Lleferydd?

Cael eich allwedd API am ddim a dechrau adeiladu. 50 credyd ar gofrestru, modelau am ddim ar gael, dogfennaeth gyfan.

Cofrestru Gweld Prisiau

API Testun i Leferydd ar gyfer datblygwyrName

Ceisiwch Nawr

Hoffwch TTS.ai? Meddwl am eich ffrindiau!

Nodweddion API ar gyfer datblygwyr

API REST symlName

Cydnaws OpenAI

Modelau ar gael

Goramser Is- ail

API Clonio LleferyddName

Amryw Fformatau

Modelau Gorau ar gyfer Cyfuniad Datblygwr

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Sut i Gyfuno'r API TTS

Cyrchu eich Allwedd API

Gwneud Eich Galwad Cyntaf

Dewiswch eich Model

Llongau i Gynhyrchu

Enghreifftiau Côd Cychwyn Cyflym

Beth mae datblygwyr yn ei adeiladu gyda TTS.ai

Sgwrsbots a Chynorthwywyr AIName

Cymhwysiadau Symudol a LlywioName

Cynhyrchion

Pipelines Awtomatig

Penodiadau API

Cwestiynau a Ofynnir yn Aml

A yw'r API yn gydnaws â'r fformat TTS OpenAI?

Beth yw'r goramser ar gyfer rhaglenni gwir-amser?

Sut mae prisiau'n gweithio ar gyfer defnydd API?

A allaf ddefnyddio clonio llais drwy'r API?

A oes terfyn cyflymder?

Pa fformatau sain mae'r API yn eu dychwelyd?

A allaf ddefnyddio'r API i adeiladu cynorthwyydd llais neu sgwrsiobot?

A oes WebSocket neu API llif?

Sut ydw i'n trin gwallau ac ail-geisiadau mewn cynhyrchu?

A allaf rhestru'r lleisiau a'r modelau sydd ar gael yn raglennol?

A oes blwch tywod neu amgylchedd prawf?

A allaf hunan-gartrefu'r modelau yn hytrach na defnyddio'r API?

Prysur i Adeiladu efo AI Lleferydd?