Raporteer Fout / eienskap Versoek

Teks vir spraak API vir Ontwikkelaars

Bou stem-enabled programme met ons REST API. Voeg natuurlike teks-na-sech, stemkloning, spraak-to-teks en klank verwerking na jou apps, geselsbotte, stemassistente en SaaS-produkte by. OpenAI- Compatible formaat, 20+ modelle, eenvoudige integrasie.

Constellation name (optional) Chatbots Stemore Saa'sprodukte Outomatisering

Volgrote TTS RedigeerderName API Docs

Probeer dit nou

Teks
Lêers

0/500

Vry met Kokoro, Piper, VITS, MetoTTS

Jou opgewekte oudio sal hier verskyn

Open volle TTS-redigeerder

API-bronne vir ontwikkelaars

Alles wat jy nodig het om 'n stem-aanpasbare aansoeke te bou

Eenvoudige REST API

Een POS versoek om spraak op te wek. JSON versoek, oudio-reaksie. Werk met enige programmering taal wat HTTP ondersteun.

OpenAI- Compatible

Laat val- in plaasvervanger vir OpenAI TTS API. Skakel jou basis_url en API-sleutel url en API bestaande kode werk onmiddellik.

24+ Models beskikbaar

Verkry toegang tot elke model deur 'n enkele API. Wissel modelle deur een parameter te verander. Vergelyk kwaliteit, spoed en koste.

Sub- Sekond Ondergang

Kokoro genereer klank in onder 1 sekonde. Perfeksioneel vir ware-tyd kletsbotte, stemassistente en interaktiewe programme.

Stemverkleuring'nPI

Rig enige stem van 'n kort oudiomonster via die API. Gebruik gekloonde stemme vir al die daaropvolgende geslagte.

Veelvuldige Formate

Uitset as WAV, MP3, OG, of FLAC. Kies voorbeeld tempo en bietjie diepte. Stroomende oudio ondersteun vir werklike tyd apps.

Beste modelle vir ontwikkelaars Integrasie

Kies die regte model vir jou program se spoed, gehalte en koste vereistes

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Vinniggame speed 5/5

Beste vir: Vinnigeste model 19 subsekonde latency, ideaal vir werklike-tyd apps en geselsbotte

Probeer Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Stemverkleuring

Beste vir: Stroom TTS met stem kloning vir stemassistent-toepassings

Probeer CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Stadiggame speed 5/5

Beste vir: Talkale KI met natuurlike tydsberekening vir geselsbot en assistentstem

Probeer Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Vinniggame speed 3/5

Beste vir: Vry, Sve- alleen model vir hoÃ"- volum programme na nul koste

Probeer Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Stadiggame speed 4/5

Beste vir: Oudiogeslag met klankeffekte vir skeppende en vermaaklikheidsaansoeke

Probeer Bark

Hoe om die TTS API in te meng

Van ondertekening tot eerste API-roep in onder 5 minute

Kry jou API-sleutel

Teken op vir gratis en genereer 'n API sleutel van jou rekening paneelbord. 15 000 karakters ingesluit.

Maak jou eerste besoek

POS na /v1/ts met teks, model en stem. Kry oudio grepe terug. Onder 5 reëls van kode.

Kies jou model

Toets verskillende modelle vir jou gebruik. Vergelyk spoed, gehalte en koste per geslag.

Skep na Produksie

Skaal met betaal-as- jy-go karakters. Nee tempo beperk op betaalde planne. Monitor gebruik in jou paneelbord.

Vinnige Begin Kode Voorbeelde

Integrate TTS.ai in enige taal met ons REST API

Python Gewild

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Universele

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

Advanced URLs: description or category Val-in

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Kry jou gratis'nPI-sleutel

Wat Ontwikkelaars bou met TTS.ai

Algemene integrasiepatrone en toepassings

Aol Oombliklike Boodskapper KliÃ"ntName

Voeg stem uitset by jou geselsbot of Kunsmatige assistent. Pyp LM antwoord deur TTS vir stem-enabled koppelvlaks. Kokoro lewer sub-second latency vir regte-tyd gesprekke. Sesame CSM genereer gesprek met natuurlike tydsberekening.

LML antwoord op spraakleiding
Sub- second latency met Kokoro
Gesprekvoering met Sesame CSM
Stroom oudioafvoer

Selfoonstem App's

Bou stem-enabled mobiele programme, toeganklikheidsgereedskap, leesprogramme en taal aanleerplatforms. Ons REST API werk met enige mobiele raamwerk. Laai oudiolêers af of stroom direk na die kliënt.

Reaktive, Ftter, Swift, Kotlin
Toeganklikheid en leesprogramme
Taal aanleerplatforms
Oudioinhoud-geslag

Saa'sprodukte

Wit- label stem vermoÃ" in jou SaaS produk. Voeg TTS, STT, stemkloning en klank verwerk as eienskappe in jou verhoog. Gebruik ons API as jou stem agterkant sonder om die GPU-ring te bestuur.

Wit-label stem kenmerke
Geen GPU - infrastruktuur nodig nie
Pay-per- use prision
20+ modelle om jou gebruikers aan te bied

Outomatisering Pyplyne

Integrasie stem geslag na CI/CD-pyplyne, inhoud outomatisering en klomp verwerking werkflows. Genereer duisende van oudio lêers van spreibladdata, outomate poste produksie of bou inhoud lokalisering pypleidings.

Bang verwerk deur middel van API
InhoudsensiÃ"le pypleidings
CI/CD integrasie
Sigblad na klank outomatisering

Bekyk volle 'nPI- Dokumentasie

API Sspesifikasies

Gebou vir produksietoepassings

20+

TTS - modele

100+

Stemme

30+

Tale

<1s

Onderhandeling (Kokoro)

Teken gratis op 539 15 000 karakters

Vrae wat dikwels gevra word

Algemene vrae oor die TTS.ai ontwikkelaar API

Ja. Ons API volg die OpenAI klankrede formaat. As jy gebruik die OpenAI Python of JavaScript kliënt biblioteek, jy kan wissel na TTS.ai deur die basis_url en api_ key parameters te verander. jou bestaande kode werk sonder om te verander.

Kokoro genereer klank in onder 1 sekonde vir tipiese sinne. KosyVoice 2 ondersteun stroom uitset vir selfs laer waargeneemde laatncy. Vir kletsbotte en stemassistente, totaal rond-turip tyd is tipies 1-3 sekondes afhangende van teks lengte en model keuse.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) is heeltemal vry. Standaard modelle gebruik 2x karakters per 1K van teks. Premium modelle gebruik 4x karakters per 1K van teks. Teken vry met 15 000 karakters. Planne begin by $9/month vir 500 000 karakters.

Ja. Oplaai 'n verwysing oudiomonster (5-30 sekondes) na die stem Cloning eindpunt, gebruik dan die gekloonde stem-ID in daaropvolgende TTS versoeke. Modelle wat kloning ondersteun, sluit in KosyVoice 2, Chaterbox, Fish Spech en GPT-SoVITS.

Vry vlak het basiese tempo beperk (3 versoeke per uur sonder 'n rekening). Paid planne het groot tempo beperkings geskik vir produksie aansoeke. Kontak ons vir ondernemings-vlak deur stel benodighede.

WAV (onsaamgepersde, hoogste kwaliteit), MP3 (saamgepersde, kleiner lêers), OG (oop formaat) en FLAC (losslose saampersing). Spesifiseer die formaat in jou versoek. Verstek is WAV by die model se inheemse monster tempo.

Ja. Kombineer ons TTS API met 'n spraak - to- text model en' n LMMM om 'n volledige stemassistent pyp te bou. Kokoro voorsien subtweede laatncy ideaal vir regte-tyd gesprek. KosyVoice 2 ondersteun stroom uitset vir selfs laer waargeneemde reaksie tye.

CosyVoice 2 en Kokoro ondersteun stroomende oudio-afvoer waar oudiobrokke afgelewer word as wat hulle gegenereer word. Dit verminder tyd-aan-eerste-byte vir werklike-tyd programme soos stemassistente en interaktiewe ondervindinge.

Die API gee terug standaard Http status kodes. Implementissionele terugoff vir 5x foute en tempo beperk reaksies. Vir sending- krities programme, voeg by 'n wagtou met weer logika. Ons API het hoogtyd maar herstelbare fout hantering word altyd aanbeveel.

Ja. Die /v1/stemme en /v1/modelse keer JSON se lyste terug van alle beskikbare stemme en modelle met hulle metadata (taal ondersteun, kwaliteitsgraderings, spoedgraderings en pruting vlak). Gebruik hierdie om dinamiese model kiesers in jou program te bou.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) dien as 'n doeltreffende sandboks sedert hulle kos nul krediete. Toets jou integrasie met gratis modelle, wissel dan na premiese modelle in produksie deur die model parameter te verander. Geen aparte toets omgewing is nodig nie.

Die meeste van ons modelle is oop-onsource en kan self-hosted wees. Maar self-hosting vereis belangrike GPU hulpbronne (ons gebruik 4x NVIDIA Tesla P40 met 96GB VRAM totaal). Die API verskaf 'n koste-effektiewe alternatief sonder infrastruktuurbeheer.

5.0/5 (1)

Gereed om met stemKI te bou?

Kry jou gratis API-sleutel en begin bou. 50 krediete op ondertekening, gratis modelle beskikbaar, omvattende dokumentasie.

Meld aan om vry te wees Besigtig Pen Program

Teks vir spraak API vir Ontwikkelaars

Probeer dit nou

Liefde TTS.ai, vertel jou vriende!

API-bronne vir ontwikkelaars

Eenvoudige REST API

OpenAI- Compatible

24+ Models beskikbaar

Sub- Sekond Ondergang

Stemverkleuring'nPI

Veelvuldige Formate

Beste modelle vir ontwikkelaars Integrasie

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Hoe om die TTS API in te meng

Kry jou API-sleutel

Maak jou eerste besoek

Kies jou model

Skep na Produksie

Vinnige Begin Kode Voorbeelde

Wat Ontwikkelaars bou met TTS.ai

Aol Oombliklike Boodskapper KliÃ"ntName

Selfoonstem App's

Saa'sprodukte

Outomatisering Pyplyne

API Sspesifikasies

Vrae wat dikwels gevra word

Is die API versoenbaar met die OpenAI TTS-formaat?

Wat is die laatkommering vir werklike programme?

Hoe werk priking vir API gebruik?

Kan ek die stem deur die API gebruik?

Is daar'n tempogrens?

Watter oudioformaat keer die API terug?

Kan ek die API gebruik om'n stemassistent of - geselskunde te bou?

Is daar 'n websak of strooming API?

Hoe hanteer ek foute en asemhalings in produksie?

Kan ek die beskikbare stemme en modelle programmaties opnoem?

Is daar'n sandboks of'n toetsomgewing?

Kan ek self-host die modelle in plaas van die API te gebruik?

Gereed om met stemKI te bou?