Teks vir spraak API vir Ontwikkelaars

Bou stem-enabled programme met ons REST API. Voeg natuurlike teks-na-sech, stemkloning, spraak-to-teks en klank verwerking na jou apps, geselsbotte, stemassistente en SaaS-produkte by. OpenAI- Compatible formaat, 20+ modelle, eenvoudige integrasie.

Constellation name (optional) Chatbots Stemore Saa'sprodukte Outomatisering

Probeer dit nou

Vry met Kokoro, Piper, VITS, MetoTTS
Jou opgewekte oudio sal hier verskyn
Genereer
Aflaai hervat
Liefde TTS.ai, vertel jou vriende!

API-bronne vir ontwikkelaars

Alles wat jy nodig het om 'n stem-aanpasbare aansoeke te bou

Eenvoudige REST API

Een POS versoek om spraak op te wek. JSON versoek, oudio-reaksie. Werk met enige programmering taal wat HTTP ondersteun.

OpenAI- Compatible

Laat val- in plaasvervanger vir OpenAI TTS API. Skakel jou basis_url en API-sleutel url en API bestaande kode werk onmiddellik.

24+ Models beskikbaar

Verkry toegang tot elke model deur 'n enkele API. Wissel modelle deur een parameter te verander. Vergelyk kwaliteit, spoed en koste.

Sub- Sekond Ondergang

Kokoro genereer klank in onder 1 sekonde. Perfeksioneel vir ware-tyd kletsbotte, stemassistente en interaktiewe programme.

Stemverkleuring'nPI

Rig enige stem van 'n kort oudiomonster via die API. Gebruik gekloonde stemme vir al die daaropvolgende geslagte.

Veelvuldige Formate

Uitset as WAV, MP3, OG, of FLAC. Kies voorbeeld tempo en bietjie diepte. Stroomende oudio ondersteun vir werklike tyd apps.

Beste modelle vir ontwikkelaars Integrasie

Kies die regte model vir jou program se spoed, gehalte en koste vereistes

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Beste vir: Vinnigeste model 19 subsekonde latency, ideaal vir werklike-tyd apps en geselsbotte

Probeer Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Stemverkleuring

Beste vir: Stroom TTS met stem kloning vir stemassistent-toepassings

Probeer CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Beste vir: Talkale KI met natuurlike tydsberekening vir geselsbot en assistentstem

Probeer Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Beste vir: Vry, Sve- alleen model vir hoÃ"- volum programme met zero krediet koste

Probeer Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Beste vir: Oudiogeslag met klankeffekte vir skeppende en vermaaklikheidsaansoeke

Probeer Bark

Hoe om die TTS API in te meng

Van ondertekening tot eerste API-roep in onder 5 minute

1

Kry jou API-sleutel

Teken op vir gratis en genereer 'n API sleutel van jou rekening paneelbord. 15 000 karakters ingesluit.

2

Maak jou eerste besoek

POS na /v1/ts met teks, model en stem. Kry oudio grepe terug. Onder 5 reëls van kode.

3

Kies jou model

Toets verskillende modelle vir jou gebruik. Vergelyk spoed, gehalte en koste per geslag.

4

Skep na Produksie

Skaal met betaal-as- jy-go karakters. Nee tempo beperk op betaalde planne. Monitor gebruik in jou paneelbord.

Vinnige Begin Kode Voorbeelde

Integrate TTS.ai in enige taal met ons REST API

Python Gewild
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Universele
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Advanced URLs: description or category Val-in
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Wat Ontwikkelaars bou met TTS.ai

Algemene integrasiepatrone en toepassings

Aol Oombliklike Boodskapper KliÃ"ntName

Voeg stem uitset by jou geselsbot of Kunsmatige assistent. Pyp LM antwoord deur TTS vir stem-enabled koppelvlaks. Kokoro lewer sub-second latency vir regte-tyd gesprekke. Sesame CSM genereer gesprek met natuurlike tydsberekening.

  • LML antwoord op spraakleiding
  • Sub- second latency met Kokoro
  • Gesprekvoering met Sesame CSM
  • Stroom oudioafvoer

Selfoonstem App's

Bou stem-enabled mobiele programme, toeganklikheidsgereedskap, leesprogramme en taal aanleerplatforms. Ons REST API werk met enige mobiele raamwerk. Laai oudiolêers af of stroom direk na die kliënt.

  • Reaktive, Ftter, Swift, Kotlin
  • Toeganklikheid en leesprogramme
  • Taal aanleerplatforms
  • Oudioinhoud-geslag

Saa'sprodukte

Wit- label stem vermoÃ" in jou SaaS produk. Voeg TTS, STT, stemkloning en klank verwerk as eienskappe in jou verhoog. Gebruik ons API as jou stem agterkant sonder om die GPU-U-U-U-U-U-U-ring te bestuur.

  • Wit-label stem kenmerke
  • Geen GPU - infrastruktuur nodig nie
  • Pay-per- use prision
  • 20+ modelle om jou gebruikers aan te bied

Outomatisering Pyplyne

Integrasie stem geslag na CI/CD-pyplyne, inhoud outomatisering en klomp verwerking werkflows. Genereer duisende van oudio lêers van spreibladdata, outomate poste produksie of bou inhoud lokalisering pypleidings.

  • Bang verwerk deur middel van API
  • InhoudsensiÃ"le pypleidings
  • CI/CD integrasie
  • Sigblad na klank outomatisering

API Sspesifikasies

Gebou vir produksietoepassings

20+

TTS - modele

100+

Stemme

30+

Tale

<1s

Onderhandeling (Kokoro)

Vrae wat dikwels gevra word

Algemene vrae oor die TTS.ai ontwikkelaar API

Ja. Ons API volg die OpenAI klankrede formaat. As jy gebruik die OpenAI Python of JavaScript kliënt biblioteek, jy kan wissel na TTS.ai deur die basis_url en api_ key parameters te verander. jou bestaande kode werk sonder om te verander.

Kokoro genereer klank in onder 1 sekonde vir tipiese sinne. KosyVoice 2 ondersteun stroom uitset vir selfs laer waargeneemde laatncy. Vir kletsbotte en stemassistente, totaal rond-turip tyd is tipies 1-3 sekondes afhangende van teks lengte en model keuse.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) is heeltemal vry. Standaard modelle gebruik 2x karakters per 1K van teks. Premium modelle gebruik 4x karakters per 1K van teks. Teken vry met 15 000 karakters. Planne begin by $9/month vir 500 000 karakters.

Ja. Oplaai 'n verwysing oudiomonster (5-30 sekondes) na die stem Cloning eindpunt, gebruik dan die gekloonde stem-ID in daaropvolgende TTS versoeke. Modelle wat kloning ondersteun, sluit in KosyVoice 2, Chaterbox, Fish Spech en GPT-SoVITS.

Vry vlak het basiese tempo beperk (3 versoeke per uur sonder 'n rekening). Paid planne het groot tempo beperkings geskik vir produksie aansoeke. Kontak ons vir ondernemings-vlak deur stel benodighede.

WAV (onsaamgepersde, hoogste kwaliteit), MP3 (saamgepersde, kleiner lêers), OG (oop formaat) en FLAC (losslose saampersing). Spesifiseer die formaat in jou versoek. Verstek is WAV by die model se inheemse monster tempo.

Ja. Kombineer ons TTS API met 'n spraak - to- text model en' n LMMM om 'n volledige stemassistent pyp te bou. Kokoro voorsien subtweede laatncy ideaal vir regte-tyd gesprek. KosyVoice 2 ondersteun stroom uitset vir selfs laer waargeneemde reaksie tye.

CosyVoice 2 en Kokoro ondersteun stroomende oudio-afvoer waar oudiobrokke afgelewer word as wat hulle gegenereer word. Dit verminder tyd-aan-eerste-byte vir werklike-tyd programme soos stemassistente en interaktiewe ondervindinge.

Die API gee terug standaard Http status kodes. Implementissionele terugoff vir 5x foute en tempo beperk reaksies. Vir sending- krities programme, voeg by 'n wagtou met weer logika. Ons API het hoogtyd maar herstelbare fout hantering word altyd aanbeveel.

Ja. Die /v1/stemme en /v1/modelse keer JSON se lyste terug van alle beskikbare stemme en modelle met hulle metadata (taal ondersteun, kwaliteitsgraderings, spoedgraderings en pruting vlak). Gebruik hierdie om dinamiese model kiesers in jou program te bou.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) dien as 'n doeltreffende sandboks sedert hulle kos nul krediete. Toets jou integrasie met gratis modelle, wissel dan na premiese modelle in produksie deur die model parameter te verander. Geen aparte toets omgewing is nodig nie.

Die meeste van ons modelle is oop-onsource en kan self-hosted wees. Maar self-hosting vereis belangrike GPU hulpbronne (ons gebruik 4x NVIDIA Tesla P40 met 96GB VRAM totaal). Die API verskaf 'n koste-effektiewe alternatief sonder infrastruktuurbeheer.
5.0/5 (1)

U terugvoer help ons om geskille reg te stel.

Gereed om met stemKI te bou?

Kry jou gratis API-sleutel en begin bou. 50 krediete op ondertekening, gratis modelle beskikbaar, omvattende dokumentasie.