Teksti kõne API arendajatele

Loo häälega rakendusi meie REST API. Lisa loomulik tekst kõneks, hääl kloonimine, kõne tekstiks, ja audio töötlemine oma rakendused, jutubotid, hääl assistendid, ja SaaS tooted. OpenAI-ühilduv formaat, 20+ mudelid, lihtne integratsioon.

REST API Chatbotidunit synonyms for matching user input Häälerakendused SaaS tooted Automaatika

Proovi seda nüüd.

Tasuta Kokoro, Piper, VITS, MeloTTS
Sinu loodud heli ilmub siia
Genereeritud
Allalaadimine
Armastus TTS.ai?

API omadused arendajatele

Kõik, mida vajate häälepõhiste rakenduste loomiseks

Lihtne REST API

Üks POST päringu luua kõne. JSON palve, audio vastus. Töötab mis tahes programmeerimiskeel, mis toetab HTTP.

OpenAI- ga ühilduv

OpenAI TTS API väljavahetamine. Lülitage oma baas_url ja API võti ~ olemasolev kood töötab kohe.

24+ mudelid saadaval

Ligipääs iga mudeli kaudu ühe API. Vahetage mudeleid muutes ühe parameetri. Võrdle kvaliteeti, kiirust ja maksumust.

Teise taseme korrektsioon

Kokoro toodab heli alla 1 sekundi. Ideaalne reaalajas jutubotid, hääl assistendid ja interaktiivsed rakendused.

Hääle kloonimise API

Kloon tahes hääl lühikese audio proovi kaudu API. Kasuta kloonitud hääled kõik järgmised põlvkonnad.

Mitu vormingut

Väljund WAV, MP3, OGG või FLAC. Valige proovisagedus ja bitisügavus.

Arendaja integratsiooni parimad mudelid

Valige õige mudel oma taotluse kiiruse, kvaliteedi ja kulu nõuded

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Parim: Kiireim mudel, mis sobib reaalaja rakendustele ja jutubotidele

Proovi Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Hääle kloonimine

Parim: Trimmimine TTS koos hääl kloonimine hääl assistent rakendused

Proovi CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Parim: Vestlus tehisintellekti loomuliku ajastusega jutubotile ja abihäälele

Proovi Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Parim: Tasuta, ainult CPU mudel suuremahulistele rakendustele, mille krediidikulu on null

Proovi Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Parim: Heliefektidega heli genereerimine loomingulistele ja meelelahutusrakendustele

Proovi Bark

Kuidas integreerida TTS API

Alates registreerimisest kuni esimese API kõneni 5 minuti jooksul

1

Hangi API võti

Registreeru tasuta ja genereerida API võti oma konto armatuurlaud. 15,000 tähemärki lisada.

2

Tee oma esimene kõne

POST / v1/tts teksti, mudeli ja häälega. Hangi heli baiti tagasi. Alla 5 rea koodi.

3

Vali oma mudel

Testi erinevaid mudeleid oma kasutamise puhul. Võrdle kiirust, kvaliteeti ja maksumust põlvkonna kohta.

4

Laev tootmisse

Skaleerimine koos tasuliste tegelastega. Tasuliste plaanide puhul ei ole intressimäära piiranguid. Jälgige kasutust armatuurlaual.

Kiirkäivituskoodi näited

Integreerida TTS.ai mis tahes keeles meie REST API

Python Populaarne
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Universaalne
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- Sobiv vorming Sisseviimine
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Mida arendajad ehitada TTS.ai

Ühised integratsioonimudelid ja -rakendused

AI Chatbots & Assistents

Lisage hääleväljund oma jututuba või AI assistent. Pipe LLM vastused TTS häälega varustatud liidesed. Kokoro pakub sub-teise latency reaalajas vestlused. Seesami CSM tekitab vestluskõne loomuliku ajastus.

  • LLM vastus kõnetorule
  • Sekundaarne latentsus Kokoroga
  • Vestluskõne Seesami CSM-iga
  • Audioväljundi voog

Mobiilsed ja häälrakendused

Ehita häältoitega mobiilirakendusi, ligipääsetavuse tööriistu, lugemise rakendusi ja keeleõppeplatvorme. Meie REST API töötab mis tahes mobiilse raamistikuga. Lae audiofaile või vooge otse kliendile.

  • React Native, Flutter, Swift, Kotlin
  • Ligipääsetavus ja lugemisrakendused
  • Keeleõppeplatvormid
  • Audiosisu genereerimine

SaaS tooted

White-label hääl võimeid oma SaaS toode. Lisa TTS, STT, hääl kloonimine ja audio töötlemine funktsioone oma platvormi. Kasuta meie API oma hääl backend ilma hallata GPU infrastruktuuri.

  • Valge märgisega hääle omadused
  • GPU infrastruktuuri ei ole vaja
  • Tasuline hinnakujundus
  • 20+ mudelid kasutajatele

Automaatikajuhtmed

Integreerida hääl genereerimine CI / CD torujuhtmed, sisu automaatika ja partii töötlemise töövood. Genereeri tuhandeid helifaile tabeli andmed, automate podcast tootmine, või ehitada sisu lokaliseerimine torujuhtmed.

  • Partii töötlemine API kaudu
  • Sisu lokaliseerimistorustikud
  • CI/CD integratsioon
  • Leht audioautomaatikale

API spetsifikatsioonid

Ehitatud tootmisrakenduste jaoks

20+

TTS mudelid

100+

Hääled

30+

Keeled

<1s

Euroopa Parlamendi ja nõukogu määrus (EL) nr 182/2011, 25. oktoober 2011, millega kehtestatakse eeskirjad ja üldpõhimõtted, mis käsitlevad liikmesriikide läbiviidava kontrolli mehhanisme, mida kohaldatakse komisjoni rakendamisvolituste teostamise suhtes (ELT L 55, 28.2.2011, lk 13).

Korduma kippuvad küsimused

Üldised küsimused TTS.ai arendaja API kohta

Jah. Meie API järgib OpenAI audio kõnevormingut. Kui kasutad OpenAI Pythoni või JavaScripti kliendiraamatukogu, saad lülituda TTS.ai- le, muutes baas- ja API- võtmeparameetreid. Olemasolev kood töötab muutmata.

Kokoro tekitab audio vähem kui 1 sekund tüüpiliste lausete jaoks. CosyVoice 2 toetab striimiväljundit isegi madalama tajutava latentsi jaoks. Jutubottide ja hääleassistentide puhul on ümardamise koguaeg tavaliselt 1-3 sekundit, sõltuvalt teksti pikkusest ja mudeli valikust.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) on täiesti tasuta. Standardmudelid kasutavad 2x tähemärki 1K teksti kohta. Premium mudelid kasutavad 4x tähemärki 1K teksti kohta. Liitu tasuta 15 000 tähemärgiga. Plaanid algavad $9/kuus 500 000 tähemärgi kohta.

Jah. Laadida viitehelinäidis (5:30 sekundit) hääle kloonimise tulemusnäitajasse, seejärel kasutada kloonitud hääl ID järgnevates TTS taotlustes. Kloonimist toetavad mudelid hõlmavad CosyVoice 2, Chatterbox, Fish Speech ja GPT-SoviTS.

Tasuta tasand on baasmäära piirav (3 taotlust tunnis ilma kontota). Tasulised plaanid on helde hinnaga piirangud sobivad tootmise taotlused. Võtke meiega ühendust ettevõtte tasandil jõudluse nõuded.

WAV (kokkusurumata, kõrgeima kvaliteediga), MP3 (kokkusurutud, väiksemad failid), OGG (avatud formaat) ja FLAC (kadudeta tihendus). Määra oma päringus vorming. Vaikimisi on WAV mudeli kohaliku valimikiirusega.

Jah. Ühendage meie TTS API kõne-teksti mudeliga ja LLM-iga, et ehitada täielik hääleassistentjuhe. Kokoro pakub reaalajas vestluseks teisejärgulist latentsi. CosyVoice 2 toetab striimiväljundit isegi madalamal tajutaval reaktsiooniajal.

CosyVoice 2 ja Kokoro toetus streaming audio väljund, kus audio tükid on tarnitud, kui nad on loodud. See vähendab aega-esi-baidi reaalajas rakendusi nagu hääl assistendid ja interaktiivseid kogemusi.

API tagastab standardse HTTP staatuse koodid. Rakendada eksponentsiaalne backoff 5xx vigu ja määr piirvastused. Missioon-kriitilised rakendused, lisada järjekord uuesti proovimise loogika. Meie API on high uptime kuid vastupidav viga käitlemise on alati soovitatav.

Yes. The /v1/voices and /v1/models endings return JSON nimekirjad kõik vabad hääled ja mudelid koos oma metaandmeid (keele toetus, kvaliteedi hinnangud, kiirus hinnanguid ja hinnakujunduse tase). Kasutage neid ehitada dünaamiline mudel valijad oma taotluse.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) on tõhus liivakast, sest need maksavad null krediiti. Test oma integratsiooni tasuta mudelid, siis minna premium mudelid tootmise muutes mudeli parameeter. Ei eraldi katsekeskkonna on vaja.

Enamik meie mudeleid on avatud lähtekoodiga ja võib olla isehostitud. Kuid isehostimine nõuab märkimisväärseid GPU ressursse (me kasutame 4x NVIDIA Tesla P40 koos 96GB VRAM kokku). API pakub kulutõhusat alternatiivi ilma infrastruktuuri haldamise.
5.0/5 (1)

Mida me võiks parandada? Teie tagasiside aitab meil lahendada küsimusi.

Oled valmis häälega tehisintellekti ehitama?

Hangi oma tasuta API võti ja alustada ehitamist. 50 krediiti sisselogimisel, tasuta mudelid saadaval, põhjalik dokumentatsioon.