Tilkynna villu / Feature Request

Texti í tal API fyrir forritara

Bættu náttúrulegum texta-til-tal, raddklónun, tal-til-texta og hljóðvinnslu við forritin þín, spjallrásir, raddaðstoðarmenn og SaaS vörur. OpenAI-samhæft snið, 20+ módel, einföld samþætting.

REST API Spjallþjarkar RaddforritName SaaS vörur Sjálfvirkni

Fullur TTS ritstjóri API skjölun

Prófaðu núna

Texti
Skrár

0/500

Frjáls með Kokoro, Piper, VITS, MeloTTS

Hljóðin þín birtast hér

Opna TTS ritil

API Lögun fyrir forritara

Allt sem þú þarft til að byggja upp raddvirk forrit

Einföld REST API

Ein POST beiðni til að búa til tal. JSON beiðni, hljóð svar. Virkar með hvaða forritunarmál sem styður HTTP.

OpenAI- samhæft

Skipta um OpenAI TTS API. Skipta base_url og API lykill - núverandi kóða virkar strax.

24+ gerðir í boði

Fáðu aðgang að öllum líkanum í gegnum eitt API. Skiptu um módel með því að breyta einni breytu. Berðu saman gæði, hraða og kostnað.

Undir- sekúnda leynd

Kokoro býr til hljóð á undir 1 sekúndu.Perfect fyrir rauntíma chatbots, radd aðstoðarmenn og gagnvirk forrit.

Voice Cloning API

Klóna hvaða rödd sem er úr stuttu hljóðsýni í gegnum API. Notaðu klónaðar raddir fyrir allar síðari kynslóðir.

Mörg snið

Output sem WAV, MP3, OGG, eða FLAC. Veldu sýnishorn hlutfall og bita dýpt. Streaming hljóð stuðning fyrir rauntíma apps.

Bestu módel fyrir Developer Integration

Veldu rétta gerð fyrir hraða, gæði og kostnaðarkröfur forritsins

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Best fyrir: Hraðasta líkanið - undir sekúndu leynd, tilvalið fyrir rauntímaforrit og spjallforrit

Reyndu Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Miðlungs 5/5 Raddklónun

Best fyrir: Straumspilun TTS með raddklónun fyrir raddaðstoðarforrit

Reyndu CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Hægur 5/5

Best fyrir: Samtals AI með náttúrulegum tímasetningu fyrir chatbot og aðstoðarmaður rödd

Reyndu Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Best fyrir: Free, CPU-aðeins líkan fyrir mikið magn forrit með núll lánsfé kostnaður

Reyndu Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Hægur 4/5

Best fyrir: Hljóð kynslóð með hljóð áhrif fyrir skapandi og skemmtun forrit

Reyndu Bark

Hvernig á að samþætta TTS API

Frá skráningu til fyrsta API símtals á innan við 5 mínútum

Fáðu API lykilinn þinn

Skráðu þig ókeypis og búðu til API lykil frá reikningsborðinu þínu. 15.000 stafir innifaldir.

Fyrsta símtalið þitt

POST til /v1/tts með texta, líkan, og rödd. Fá hljóð bæti aftur. Undir 5 línur af kóða.

Veldu líkanið þitt

Prófaðu mismunandi gerðir fyrir notkunartilfellið þitt. Berðu saman hraða, gæði og kostnað á kynslóð.

Skip til framleiðslu

Scale með borga-eins og-þú-far stafi. Engin takmörk á greiddum áætlunum. Fylgjast með notkun í mælaborðinu þínu.

Quick Start Code Dæmi

Samþætta TTS.ai á hvaða tungumáli sem er með REST API okkar

Python Vinsælt

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Alhliða

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-samhæft snið Sleppa inn

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Fáðu ókeypis API lykilinn þinn

Hvað verktaki byggja með TTS.ai

Algengar samþættingarmynstur og forrit

AI Chatbots og aðstoðarmenn

Bættu raddbúnaði við spjallþráðinn þinn eða AI aðstoðarmann. Pípa LLM svör í gegnum TTS fyrir raddvirkar tengi. Kokoro skilar undir sekúndu leynd fyrir rauntíma samtöl. Sesame CSM býr til samtalsræðu með náttúrulegum tímasetningu.

LLM svar við ræðu leiðslum
Sub-sekúndna leynd með Kokoro
Samtals ræða með Sesame CSM
Straumspilun hljóðúttaks

Mobile & Voice forrit

Búðu til raddvirk farsímaforrit, aðgengisverkfæri, lesforrit og tungumálanám. REST API okkar virkar með hvaða farsímaramma sem er.Sækja hljóðskrár eða streyma beint til viðskiptavinarins.

React Native, Flutter, Swift og Kotlin
Aðgengi og lestur apps
Tungumálanám vettvangur
Hljóðefnis kynslóð

SaaS vörur

White-label rödd getu í SaaS vörunni þinni. Bæta TTS, STT, rödd klónun, og hljóð vinnslu sem eiginleika í vettvang þinn.Nota API okkar sem rödd bakenda án þess að stjórna GPU innviði.

White-label rödd lögun
Engin GPU innviði þarf
Verðlagning á notkun
20+ módel til að bjóða notendum þínum

Automation PipelinesComment

Samþættu talsköpun í CI/CD-leiðslur, sjálfvirkni í efni og vinnsluferli fyrir hópa.Búa til þúsundir hljóðskráa úr töflureiknagögn, gera sjálfvirka podcast-framleiðslu eða byggja upp leiðslur fyrir staðfærslu efnisins.

Hópur vinnsla í gegnum API
Content localization pipelines
CI / CD samþætting
Töflureikni til hljóð sjálfvirkni

Skoða fulla API skjölun

API forskriftir

Byggð fyrir framleiðsluforrit

20+

TTS módel

100+

Raddir

30+

Tungumál

<1s

Leynd (Kokoro)

Skráðu þig ókeypis — 15,000 stafir

Algengar spurningar (FAQ)

Algengar spurningar um TTS.ai Developer API

Já. API okkar fylgir OpenAI hljóð- og talsniðinu. Ef þú notar OpenAI Python eða JavaScript biðlarasafnið geturðu skipt yfir í TTS.ai með því að breyta base_url og api_key breytunum. Núverandi kóði þinn virkar án breytinga.

Kokoro býr til hljóð á innan við 1 sekúndu fyrir dæmigerða setningar.CosyVoice 2 styður straumspilun fyrir jafnvel lægri skynjuð leynd. Fyrir spjallþjóna og raddaðstoðarmenn er heildarferðartími venjulega 1-3 sekúndur eftir lengd texta og val á líkani.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) eru alveg ókeypis. Standard módel nota 2x stafi á 1K texta. Premium módel nota 4x stafi á 1K texta. Skráðu þig ókeypis með 15.000 stafi. Áætlanir byrja á $ 9 / mánuði fyrir 500.000 stafi.

Já. Hladdu upp tilvísunarhljóðsýni (5-30 sekúndur) á endapunkt raddklónunar og notaðu síðan klónaða raddauðkennið í síðari TTS-beiðnum. Gerðir sem styðja klónun eru CosyVoice 2, Chatterbox, Fish Speech og GPT-SoVITS.

Ókeypis stigið hefur grunntakmörkun (3 beiðnir á klukkustund án reiknings). Greiddar áætlanir hafa örlátur takmörk sem henta fyrir framleiðsluforrit.Hafðu samband við okkur fyrir kröfur um framleiðni á fyrirtækjastigi.

WAV (óþjappað, hæsta gæði), MP3 (þjappað, minni skrár), OGG (opið snið) og FLAC (taplaus þjöppun). Tilgreindu snið í beiðninni þinni. Sjálfgefið er WAV á innbyggðu sýndartíðni líkansins.

Sameina TTS API okkar með tal-til-texta líkan og LLM til að byggja upp heill radd aðstoðarmaður leiðsla.Kokoro veitir undir-sekúndna leynd tilvalið fyrir rauntíma samtal.CosyVoice 2 styður straumspilun fyrir jafnvel lægri skynjaðar viðbrögð.

CosyVoice 2 og Kokoro styðja straumspilun þar sem hljóðhlutar eru afhentir þegar þeir eru búnir til.Þetta dregur úr tíma til fyrsta bætis fyrir rauntímaforrit eins og raddaðstoðarmenn og gagnvirka reynslu.

API skilar venjulegum HTTP stöðukóðum. Framkvæma veldisvísa bakslag fyrir 5xx villur og hraða takmörk svör. Fyrir verkefni- mikilvæg forrit, bæta við biðröð með endurtaka rökfræði. API okkar hefur mikla upptíma en sveigjanleg villu meðhöndlun er alltaf mælt með því.

Já. Endapunktarnir /v1/voices og /v1/models skila JSON listum yfir allar tiltækar raddir og módel með lýsigögnunum (tungumálastuðningur, gæðaeinkunnir, hraðaeinkunnir og verðflokkar). Notaðu þessa til að búa til kvikna módelveljara í forritinu þínu.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þjóna sem áhrifarík sandkassi þar sem þau kosta núll einingar. Prófaðu samþættingu þína með ókeypis módelum, skiptu síðan yfir í hágæða módel í framleiðslu með því að breyta módelbreytunni. Engin sérstök prófunarumhverfi þarf.

Flestar gerðir okkar eru opnar og hægt er að hýsa sjálfan sig. Hins vegar krefst sjálfshýsing verulega GPU auðlindir (við notum 4x NVIDIA Tesla P40 með 96GB VRAM samtals).

5.0/5 (1)

Tilbúinn til að byggja með Voice AI?

Fáðu ókeypis API lykilinn þinn og byrjaðu að byggja.15 einingar við skráningu, ókeypis módel í boði, alhliða skjöl.

Skráðu þig ókeypis Skoða verðlag

Texti í tal API fyrir forritara

Prófaðu núna

Elska TTS.ai? Segðu vinum þínum!

API Lögun fyrir forritara

Einföld REST API

OpenAI- samhæft

24+ gerðir í boði

Undir- sekúnda leynd

Voice Cloning API

Mörg snið

Bestu módel fyrir Developer Integration

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Hvernig á að samþætta TTS API

Fáðu API lykilinn þinn

Fyrsta símtalið þitt

Veldu líkanið þitt

Skip til framleiðslu

Quick Start Code Dæmi

Hvað verktaki byggja með TTS.ai

AI Chatbots og aðstoðarmenn

Mobile & Voice forrit

SaaS vörur

Automation PipelinesComment

API forskriftir

Algengar spurningar (FAQ)

Er API samhæft við OpenAI TTS snið?

Hvað er leynd fyrir rauntíma forrit?

Hvernig virkar verðlagning fyrir API notkun?

Get ég notað raddklónun í gegnum API?

Er það takmörk á hraða?

Hvaða hljóð snið skilar API?

Get ég notað API til að byggja upp radd aðstoðarmaður eða chatbot?

Er til WebSocket eða straumspilunarforrit?

Hvernig meðhöndla ég villur og endurtekningar í framleiðslu?

Get ég skráð tiltækar raddir og módel forritunarlega?

Er til sandkassi eða prófunarumhverfi?

Get ég sjálfur hýst módelin í stað þess að nota API?

Tilbúinn til að byggja með Voice AI?