Texti í tal API fyrir forritara

Bættu náttúrulegum texta-til-tal, raddklónun, tal-til-texta og hljóðvinnslu við forritin þín, spjallrásir, raddaðstoðarmenn og SaaS vörur. OpenAI-samhæft snið, 20+ módel, einföld samþætting.

REST API Spjallþjarkar RaddforritName SaaS vörur Sjálfvirkni

Prófaðu núna

Frjáls með Kokoro, Piper, VITS, MeloTTS
Hljóðin þín birtast hér
Búið til
Sækja
Elska TTS.ai? Segðu vinum þínum!

API Lögun fyrir forritara

Allt sem þú þarft til að byggja upp raddvirk forrit

Einföld REST API

Ein POST beiðni til að búa til tal. JSON beiðni, hljóð svar. Virkar með hvaða forritunarmál sem styður HTTP.

OpenAI- samhæft

Skipta um OpenAI TTS API. Skipta base_url og API lykill - núverandi kóða virkar strax.

24+ gerðir í boði

Fáðu aðgang að öllum líkanum í gegnum eitt API. Skiptu um módel með því að breyta einni breytu. Berðu saman gæði, hraða og kostnað.

Undir- sekúnda leynd

Kokoro býr til hljóð á undir 1 sekúndu.Perfect fyrir rauntíma chatbots, radd aðstoðarmenn og gagnvirk forrit.

Voice Cloning API

Klóna hvaða rödd sem er úr stuttu hljóðsýni í gegnum API. Notaðu klónaðar raddir fyrir allar síðari kynslóðir.

Mörg snið

Output sem WAV, MP3, OGG, eða FLAC. Veldu sýnishorn hlutfall og bita dýpt. Streaming hljóð stuðning fyrir rauntíma apps.

Bestu módel fyrir Developer Integration

Veldu rétta gerð fyrir hraða, gæði og kostnaðarkröfur forritsins

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Best fyrir: Hraðasta líkanið - undir sekúndu leynd, tilvalið fyrir rauntímaforrit og spjallforrit

Reyndu Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Raddklónun

Best fyrir: Straumspilun TTS með raddklónun fyrir raddaðstoðarforrit

Reyndu CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Best fyrir: Samtals AI með náttúrulegum tímasetningu fyrir chatbot og aðstoðarmaður rödd

Reyndu Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Best fyrir: Free, CPU-aðeins líkan fyrir mikið magn forrit með núll lánsfé kostnaður

Reyndu Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Best fyrir: Hljóð kynslóð með hljóð áhrif fyrir skapandi og skemmtun forrit

Reyndu Bark

Hvernig á að samþætta TTS API

Frá skráningu til fyrsta API símtals á innan við 5 mínútum

1

Fáðu API lykilinn þinn

Skráðu þig ókeypis og búðu til API lykil frá reikningsborðinu þínu. 15.000 stafir innifaldir.

2

Fyrsta símtalið þitt

POST til /v1/tts með texta, líkan, og rödd. Fá hljóð bæti aftur. Undir 5 línur af kóða.

3

Veldu líkanið þitt

Prófaðu mismunandi gerðir fyrir notkunartilfellið þitt. Berðu saman hraða, gæði og kostnað á kynslóð.

4

Skip til framleiðslu

Scale með borga-eins og-þú-far stafi. Engin takmörk á greiddum áætlunum. Fylgjast með notkun í mælaborðinu þínu.

Quick Start Code Dæmi

Samþætta TTS.ai á hvaða tungumáli sem er með REST API okkar

Python Vinsælt
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Alhliða
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-samhæft snið Sleppa inn
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Hvað verktaki byggja með TTS.ai

Algengar samþættingarmynstur og forrit

AI Chatbots og aðstoðarmenn

Bættu raddbúnaði við spjallþráðinn þinn eða AI aðstoðarmann. Pípa LLM svör í gegnum TTS fyrir raddvirkar tengi. Kokoro skilar undir sekúndu leynd fyrir rauntíma samtöl. Sesame CSM býr til samtalsræðu með náttúrulegum tímasetningu.

  • LLM svar við ræðu leiðslum
  • Sub-sekúndna leynd með Kokoro
  • Samtals ræða með Sesame CSM
  • Straumspilun hljóðúttaks

Mobile & Voice forrit

Búðu til raddvirk farsímaforrit, aðgengisverkfæri, lesforrit og tungumálanám. REST API okkar virkar með hvaða farsímaramma sem er.Sækja hljóðskrár eða streyma beint til viðskiptavinarins.

  • React Native, Flutter, Swift og Kotlin
  • Aðgengi og lestur apps
  • Tungumálanám vettvangur
  • Hljóðefnis kynslóð

SaaS vörur

White-label rödd getu í SaaS vörunni þinni. Bæta TTS, STT, rödd klónun, og hljóð vinnslu sem eiginleika í vettvang þinn.Nota API okkar sem rödd bakenda án þess að stjórna GPU innviði.

  • White-label rödd lögun
  • Engin GPU innviði þarf
  • Verðlagning á notkun
  • 20+ módel til að bjóða notendum þínum

Automation PipelinesComment

Samþættu talsköpun í CI/CD-leiðslur, sjálfvirkni í efni og vinnsluferli fyrir hópa.Búa til þúsundir hljóðskráa úr töflureiknagögn, gera sjálfvirka podcast-framleiðslu eða byggja upp leiðslur fyrir staðfærslu efnisins.

  • Hópur vinnsla í gegnum API
  • Content localization pipelines
  • CI / CD samþætting
  • Töflureikni til hljóð sjálfvirkni

API forskriftir

Byggð fyrir framleiðsluforrit

20+

TTS módel

100+

Raddir

30+

Tungumál

<1s

Leynd (Kokoro)

Algengar spurningar (FAQ)

Algengar spurningar um TTS.ai Developer API

Já. API okkar fylgir OpenAI hljóð- og talsniðinu. Ef þú notar OpenAI Python eða JavaScript biðlarasafnið geturðu skipt yfir í TTS.ai með því að breyta base_url og api_key breytunum. Núverandi kóði þinn virkar án breytinga.

Kokoro býr til hljóð á innan við 1 sekúndu fyrir dæmigerða setningar.CosyVoice 2 styður straumspilun fyrir jafnvel lægri skynjuð leynd. Fyrir spjallþjóna og raddaðstoðarmenn er heildarferðartími venjulega 1-3 sekúndur eftir lengd texta og val á líkani.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) eru alveg ókeypis. Standard módel nota 2x stafi á 1K texta. Premium módel nota 4x stafi á 1K texta. Skráðu þig ókeypis með 15.000 stafi. Áætlanir byrja á $ 9 / mánuði fyrir 500.000 stafi.

Já. Hladdu upp tilvísunarhljóðsýni (5-30 sekúndur) á endapunkt raddklónunar og notaðu síðan klónaða raddauðkennið í síðari TTS-beiðnum. Gerðir sem styðja klónun eru CosyVoice 2, Chatterbox, Fish Speech og GPT-SoVITS.

Ókeypis stigið hefur grunntakmörkun (3 beiðnir á klukkustund án reiknings). Greiddar áætlanir hafa örlátur takmörk sem henta fyrir framleiðsluforrit.Hafðu samband við okkur fyrir kröfur um framleiðni á fyrirtækjastigi.

WAV (óþjappað, hæsta gæði), MP3 (þjappað, minni skrár), OGG (opið snið) og FLAC (taplaus þjöppun). Tilgreindu snið í beiðninni þinni. Sjálfgefið er WAV á innbyggðu sýndartíðni líkansins.

Sameina TTS API okkar með tal-til-texta líkan og LLM til að byggja upp heill radd aðstoðarmaður leiðsla.Kokoro veitir undir-sekúndna leynd tilvalið fyrir rauntíma samtal.CosyVoice 2 styður straumspilun fyrir jafnvel lægri skynjaðar viðbrögð.

CosyVoice 2 og Kokoro styðja straumspilun þar sem hljóðhlutar eru afhentir þegar þeir eru búnir til.Þetta dregur úr tíma til fyrsta bætis fyrir rauntímaforrit eins og raddaðstoðarmenn og gagnvirka reynslu.

API skilar venjulegum HTTP stöðukóðum. Framkvæma veldisvísa bakslag fyrir 5xx villur og hraða takmörk svör. Fyrir verkefni- mikilvæg forrit, bæta við biðröð með endurtaka rökfræði. API okkar hefur mikla upptíma en sveigjanleg villu meðhöndlun er alltaf mælt með því.

Já. Endapunktarnir /v1/voices og /v1/models skila JSON listum yfir allar tiltækar raddir og módel með lýsigögnunum (tungumálastuðningur, gæðaeinkunnir, hraðaeinkunnir og verðflokkar). Notaðu þessa til að búa til kvikna módelveljara í forritinu þínu.

Frjáls módel (Kokoro, Piper, VITS, MeloTTS) þjóna sem áhrifarík sandkassi þar sem þau kosta núll einingar. Prófaðu samþættingu þína með ókeypis módelum, skiptu síðan yfir í hágæða módel í framleiðslu með því að breyta módelbreytunni. Engin sérstök prófunarumhverfi þarf.

Flestar gerðir okkar eru opnar og hægt er að hýsa sjálfan sig. Hins vegar krefst sjálfshýsing verulega GPU auðlindir (við notum 4x NVIDIA Tesla P40 með 96GB VRAM samtals).
5.0/5 (1)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Tilbúinn til að byggja með Voice AI?

Fáðu ókeypis API lykilinn þinn og byrjaðu að byggja.15 einingar við skráningu, ókeypis módel í boði, alhliða skjöl.