Teata veast / Omaduse päring

Teksti kõne API arendajatele

Loo häälega rakendusi meie REST API. Lisa loomulik tekst kõneks, hääl kloonimine, kõne tekstiks, ja audio töötlemine oma rakendused, jutubotid, hääl assistendid, ja SaaS tooted. OpenAI-ühilduv formaat, 20+ mudelid, lihtne integratsioon.

REST API Chatbotidunit synonyms for matching user input Häälerakendused SaaS tooted Automaatika

Täielik TTS redaktor API Docs

Proovi seda nüüd.

Tekst
Failid

0/500

Tasuta Kokoro, Piper, VITS, MeloTTS

Sinu loodud heli ilmub siia

Ava täielik TTS redaktor

API omadused arendajatele

Kõik, mida vajate häälepõhiste rakenduste loomiseks

Lihtne REST API

Üks POST päringu luua kõne. JSON palve, audio vastus. Töötab mis tahes programmeerimiskeel, mis toetab HTTP.

OpenAI- ga ühilduv

OpenAI TTS API väljavahetamine. Lülitage oma baas_url ja API võti ~ olemasolev kood töötab kohe.

24+ mudelid saadaval

Ligipääs iga mudeli kaudu ühe API. Vahetage mudeleid muutes ühe parameetri. Võrdle kvaliteeti, kiirust ja maksumust.

Teise taseme korrektsioon

Kokoro toodab heli alla 1 sekundi. Ideaalne reaalajas jutubotid, hääl assistendid ja interaktiivsed rakendused.

Hääle kloonimise API

Kloon tahes hääl lühikese audio proovi kaudu API. Kasuta kloonitud hääled kõik järgmised põlvkonnad.

Mitu vormingut

Väljund WAV, MP3, OGG või FLAC. Valige proovisagedus ja bitisügavus.

Arendaja integratsiooni parimad mudelid

Valige õige mudel oma taotluse kiiruse, kvaliteedi ja kulu nõuded

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Kiire 5/5

Parim: Kiireim mudel, mis sobib reaalaja rakendustele ja jutubotidele

Proovi Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Keskmine 5/5 Hääle kloonimine

Parim: Trimmimine TTS koos hääl kloonimine hääl assistent rakendused

Proovi CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Aeglane 5/5

Parim: Vestlus tehisintellekti loomuliku ajastusega jutubotile ja abihäälele

Proovi Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Kiire 3/5

Parim: Tasuta, ainult CPU mudel suuremahulistele rakendustele, mille krediidikulu on null

Proovi Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Aeglane 4/5

Parim: Heliefektidega heli genereerimine loomingulistele ja meelelahutusrakendustele

Proovi Bark

Kuidas integreerida TTS API

Alates registreerimisest kuni esimese API kõneni 5 minuti jooksul

Hangi API võti

Registreeru tasuta ja genereerida API võti oma konto armatuurlaud. 15,000 tähemärki lisada.

Tee oma esimene kõne

POST / v1/tts teksti, mudeli ja häälega. Hangi heli baiti tagasi. Alla 5 rea koodi.

Vali oma mudel

Testi erinevaid mudeleid oma kasutamise puhul. Võrdle kiirust, kvaliteeti ja maksumust põlvkonna kohta.

Laev tootmisse

Skaleerimine koos tasuliste tegelastega. Tasuliste plaanide puhul ei ole intressimäära piiranguid. Jälgige kasutust armatuurlaual.

Kiirkäivituskoodi näited

Integreerida TTS.ai mis tahes keeles meie REST API

Python Populaarne

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Universaalne

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- Sobiv vorming Sisseviimine

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Hangi oma tasuta API võti

Mida arendajad ehitada TTS.ai

Ühised integratsioonimudelid ja -rakendused

AI Chatbots & Assistents

Lisage hääleväljund oma jututuba või AI assistent. Pipe LLM vastused TTS häälega varustatud liidesed. Kokoro pakub sub-teise latency reaalajas vestlused. Seesami CSM tekitab vestluskõne loomuliku ajastus.

LLM vastus kõnetorule
Sekundaarne latentsus Kokoroga
Vestluskõne Seesami CSM-iga
Audioväljundi voog

Mobiilsed ja häälrakendused

Ehita häältoitega mobiilirakendusi, ligipääsetavuse tööriistu, lugemise rakendusi ja keeleõppeplatvorme. Meie REST API töötab mis tahes mobiilse raamistikuga. Lae audiofaile või vooge otse kliendile.

React Native, Flutter, Swift, Kotlin
Ligipääsetavus ja lugemisrakendused
Keeleõppeplatvormid
Audiosisu genereerimine

SaaS tooted

White-label hääl võimeid oma SaaS toode. Lisa TTS, STT, hääl kloonimine ja audio töötlemine funktsioone oma platvormi. Kasuta meie API oma hääl backend ilma hallata GPU infrastruktuuri.

Valge märgisega hääle omadused
GPU infrastruktuuri ei ole vaja
Tasuline hinnakujundus
20+ mudelid kasutajatele

Automaatikajuhtmed

Integreerida hääl genereerimine CI / CD torujuhtmed, sisu automaatika ja partii töötlemise töövood. Genereeri tuhandeid helifaile tabeli andmed, automate podcast tootmine, või ehitada sisu lokaliseerimine torujuhtmed.

Partii töötlemine API kaudu
Sisu lokaliseerimistorustikud
CI/CD integratsioon
Leht audioautomaatikale

Vaade Täielik API dokumentatsioon

API spetsifikatsioonid

Ehitatud tootmisrakenduste jaoks

20+

TTS mudelid

100+

Hääled

30+

Keeled

<1s

Euroopa Parlamendi ja nõukogu määrus (EL) nr 182/2011, 25. oktoober 2011, millega kehtestatakse eeskirjad ja üldpõhimõtted, mis käsitlevad liikmesriikide läbiviidava kontrolli mehhanisme, mida kohaldatakse komisjoni rakendamisvolituste teostamise suhtes (ELT L 55, 28.2.2011, lk 13).

Registreeru tasuta 15 000 märki

Korduma kippuvad küsimused

Üldised küsimused TTS.ai arendaja API kohta

Jah. Meie API järgib OpenAI audio kõnevormingut. Kui kasutad OpenAI Pythoni või JavaScripti kliendiraamatukogu, saad lülituda TTS.ai- le, muutes baas- ja API- võtmeparameetreid. Olemasolev kood töötab muutmata.

Kokoro tekitab audio vähem kui 1 sekund tüüpiliste lausete jaoks. CosyVoice 2 toetab striimiväljundit isegi madalama tajutava latentsi jaoks. Jutubottide ja hääleassistentide puhul on ümardamise koguaeg tavaliselt 1-3 sekundit, sõltuvalt teksti pikkusest ja mudeli valikust.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) on täiesti tasuta. Standardmudelid kasutavad 2x tähemärki 1K teksti kohta. Premium mudelid kasutavad 4x tähemärki 1K teksti kohta. Liitu tasuta 15 000 tähemärgiga. Plaanid algavad $9/kuus 500 000 tähemärgi kohta.

Jah. Laadida viitehelinäidis (5:30 sekundit) hääle kloonimise tulemusnäitajasse, seejärel kasutada kloonitud hääl ID järgnevates TTS taotlustes. Kloonimist toetavad mudelid hõlmavad CosyVoice 2, Chatterbox, Fish Speech ja GPT-SoviTS.

Tasuta tasand on baasmäära piirav (3 taotlust tunnis ilma kontota). Tasulised plaanid on helde hinnaga piirangud sobivad tootmise taotlused. Võtke meiega ühendust ettevõtte tasandil jõudluse nõuded.

WAV (kokkusurumata, kõrgeima kvaliteediga), MP3 (kokkusurutud, väiksemad failid), OGG (avatud formaat) ja FLAC (kadudeta tihendus). Määra oma päringus vorming. Vaikimisi on WAV mudeli kohaliku valimikiirusega.

Jah. Ühendage meie TTS API kõne-teksti mudeliga ja LLM-iga, et ehitada täielik hääleassistentjuhe. Kokoro pakub reaalajas vestluseks teisejärgulist latentsi. CosyVoice 2 toetab striimiväljundit isegi madalamal tajutaval reaktsiooniajal.

CosyVoice 2 ja Kokoro toetus streaming audio väljund, kus audio tükid on tarnitud, kui nad on loodud. See vähendab aega-esi-baidi reaalajas rakendusi nagu hääl assistendid ja interaktiivseid kogemusi.

API tagastab standardse HTTP staatuse koodid. Rakendada eksponentsiaalne backoff 5xx vigu ja määr piirvastused. Missioon-kriitilised rakendused, lisada järjekord uuesti proovimise loogika. Meie API on high uptime kuid vastupidav viga käitlemise on alati soovitatav.

Yes. The /v1/voices and /v1/models endings return JSON nimekirjad kõik vabad hääled ja mudelid koos oma metaandmeid (keele toetus, kvaliteedi hinnangud, kiirus hinnanguid ja hinnakujunduse tase). Kasutage neid ehitada dünaamiline mudel valijad oma taotluse.

Tasuta mudelid (Kokoro, Piper, VITS, MeloTTS) on tõhus liivakast, sest need maksavad null krediiti. Test oma integratsiooni tasuta mudelid, siis minna premium mudelid tootmise muutes mudeli parameeter. Ei eraldi katsekeskkonna on vaja.

Enamik meie mudeleid on avatud lähtekoodiga ja võib olla isehostitud. Kuid isehostimine nõuab märkimisväärseid GPU ressursse (me kasutame 4x NVIDIA Tesla P40 koos 96GB VRAM kokku). API pakub kulutõhusat alternatiivi ilma infrastruktuuri haldamise.

5.0/5 (1)

Oled valmis häälega tehisintellekti ehitama?

Hangi oma tasuta API võti ja alustada ehitamist. 50 krediiti sisselogimisel, tasuta mudelid saadaval, põhjalik dokumentatsioon.

Registreeru tasuta Vaade Hinnakujundus

Teksti kõne API arendajatele

Proovi seda nüüd.

Armastus TTS.ai?

API omadused arendajatele

Lihtne REST API

OpenAI- ga ühilduv

24+ mudelid saadaval

Teise taseme korrektsioon

Hääle kloonimise API

Mitu vormingut

Arendaja integratsiooni parimad mudelid

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Kuidas integreerida TTS API

Hangi API võti

Tee oma esimene kõne

Vali oma mudel

Laev tootmisse

Kiirkäivituskoodi näited

Mida arendajad ehitada TTS.ai

AI Chatbots & Assistents

Mobiilsed ja häälrakendused

SaaS tooted

Automaatikajuhtmed

API spetsifikatsioonid

Korduma kippuvad küsimused

Kas API sobib OpenAI TTS-vorminguga?

Milline on latentsus reaalajas rakendusi?

Kuidas API kasutamine hind toimib?

Kas ma saan kasutada hääle kloonimist läbi API?

Kas määr on piiratud?

Mis audiovormingud API tagastab?

Kas ma saan kasutada API ehitada hääl assistent või chatbot?

Kas on olemas WebSocket või streaming API?

Kuidas käsitleda vigu ja retries tootmises?

Kas ma saan loetleda saadaolevaid hääli ja mudeleid programmiliselt?

Kas liivakast või katsekeskkond on olemas?

Kas ma saan ise võõrustada mudeleid API kasutamise asemel?

Oled valmis häälega tehisintellekti ehitama?