Ilmoita vika / Ominaisuuspyyntö

Kehittäjien puherajapintaan teksti

Rakenna REST API:n avulla ääniohjattavia sovelluksia. Lisää sovelluksiin, chatbotteihin, ääniavustajiin ja SaaS-tuotteisiin luonnollinen teksti-puhe-äänikloonaus, äänentoisto- ja äänenkäsittely. OpenAI-yhteensopiva formaatti, 20+-mallit, yksinkertainen integraatio.

REST API Chatbotit Äänisovellukset SaaS-tuotteet Automaatio

Täysi TTS-muokkain API-lääkärit

Kokeile nyt

0/500

Vapaa Kokoron, Piperin, VITS:n, MeloTTS:n kanssa

Luomasi ääni näkyy tässä

Avaa täysi TTS-muokkain

API-ominaisuuksia kehittäjille

Kaikki, mitä tarvitset ääniohjattavien sovellusten rakentamiseen

Yksinkertainen REST API

Yksi POST-pyyntö puheen tuottamiseksi. JSON-pyyntö, äänivastaus. Toimii millä tahansa ohjelmakielellä, joka tukee HTTP:tä.

OpenAI-yhteensopiva

OpenAI TTS API:n vaihtoon. Vaihda perus_url- ja API-avain – olemassa oleva koodi toimii välittömästi.

24+-mallit saatavilla

Käytä kaikkia malleja yhden API:n kautta. Vaihda malleja vaihtamalla yhtä parametria. Vertaa laatua, nopeutta ja kustannuksia.

Subsekunninen latenssi

Kokoro tuottaa äänen alle sekunnissa. Täydellinen reaaliaikaisille chatboteille, ääniavustajille ja vuorovaikutteisille sovelluksille.

Äänien kloonausrajapinta

Kloonaaa minkä tahansa äänen lyhyestä ääninäytteestä API:n kautta. Käytä kloonattuja ääniä kaikille tuleville sukupolville.

Useita muotoja

WAV, MP3, OGG tai FLAC. Valitse näytenopeus ja bittisyvyys. Virrataan äänitukea reaaliaikaisiin sovelluksiin.

Kehittäjien integraation parhaat mallit

Valitse sovelluksesi nopeus-, laatu- ja kustannusvaatimuksiin sopiva malli

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Paras: Nopein malli – alisekunnin latenssi, ihanteellinen reaaliaikaisiin sovelluksiin ja chatbotteihin

Kokeile Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Äänien kloonaus

Paras: TTS:n virtaviivaistaminen ääniassistenttisovelluksia varten äänen kloonauksella

Kokeile CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Paras: Keskustelullinen tekoäly luontainen ajoitus chatbotille ja avustajaäänelle

Kokeile Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Paras: Maksuton, vain CPU-malli suurille sovelluksille ilman luottokuluja

Kokeile Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Paras: Audiogeneraation äänitehosteet luoviin ja viihdesovelluksiin

Kokeile Bark

Miten TTS-rajapinta integroidaan

Ilmoittautumisesta ensimmäiseen API-puheluun alle viidessä minuutissa

Hanki API-avain

Rekisteröidy ilmaiseksi ja luo API-avain tilisi kojelaudalta. Mukana 15 000 merkkiä.

Tee ensimmäinen puhelusi

Post to /v1/tts tekstillä, mallilla ja äänellä. Saat äänitavut takaisin. Alle 5 riviä koodia.

Valitse mallisi

Testaa eri malleja käyttökoteloosi. Vertaa nopeutta, laatua ja kustannuksia sukupolvea kohti.

Laiva tuotantoon

Scale with pay-as-yo-go -hahmot. Ei korkorajoituksia maksullisille suunnitelmille. Seuraa käyttöä kojelaudassasi.

Pikakäynnistyskoodiesimerkkejä

Integroi TTS.ai kaikilla kielillä REST-rajapintaamme

Python Suosittu

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Yleismaailmallinen

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-yhteensopiva muoto Pudotus

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Hanki ilmainen API-avain

Mitä kehittäjät rakentavat TTS.ai:lla

Yhteiset integraatiomallit ja sovellukset

AI Chatbots & Assistants

Lisää äänilähtö chatbottiisi tai tekoälyavustajaasi. Pipe LLM vastaa TTS:n kautta äänikäyttöisiin rajapintoihin. Kokoro tuo sub-sekunnin viiveen reaaliaikaisiin keskusteluihin. Sesame CSM synnyttää keskustelupuhetta luonnollisella ajoituksella.

LLM:n vastaus puheputkeen
Sub-second latenssi Kokoron kanssa
Keskustelupuhe Seesamin CSM:n kanssa
Virroitetaan äänilähtöä

Mobiili- ja äänisovellukset

Rakenna ääniohjattuja mobiilisovelluksia, saavutettavuustyökaluja, lukusovelluksia ja kielenoppimisalustoja. REST API toimii minkä tahansa mobiilijärjestelmän kanssa. Lataa äänitiedostoja tai streamia suoraan asiakkaalle.

Reaktio Native, Futter, Swift, Kotlin
Esteettömyys- ja lukusovellukset
Kieltenoppimisalustat
Äänisisällön tuottaminen

SaaS-tuotteet

Valkoisen merkin ääniominaisuudet SaaS-tuotteessa. Lisää TTS, STT, äänikloonaus ja äänenkäsittely ominaisuuksiksi alustaasi. Käytä API:tä äänitaustanasi ilman GPU-infrastruktuurin hallintaa.

Valkoisen merkin ääniominaisuudet
GPU-infrastruktuuria ei tarvita
Käyttäytymiskohtainen hinnoittelu
20+-mallia tarjota käyttäjillesi

Automaatioputkistot

Integroi äänentuotanto CI/CD-putkistoihin, sisällön automaatioon ja eränkäsittelyyn. Luo tuhansia äänitiedostoja laskentataulukon tiedoista, automatisoi podcast-tuotannon tai rakentaa sisällön lokalisointiputkistoja.

Erän käsittely API:n kautta
Sisällön lokalisointiputkistot
CI/CD-integraatio
Laskentataulukko audioautomaatioon

Näytä koko API-dokumentaatio

API-erittelyt

Rakennettu tuotantosovelluksia varten

20+

TTS-mallit

100+

Ääniä

30+

Kielet

<1s

Latenssi (Kokoro)

Rekisteröidy ilmaiseksi – 15 000 merkkiä

Usein kysyttyjä kysymyksiä

Yleisiä kysymyksiä TTS.ai kehittäjän API:sta

Kyllä. API seuraa OpenAI-äänipuheformaattia. Jos käytät OpenAI Python - tai JavaScript-asiakaskirjastoa, voit vaihtaa TTS.ai:een muuttamalla base_url- ja api_key-parametrit. Olemassa oleva koodisi toimii ilman muutoksia.

Kokoro tuottaa äänen alle sekunnissa tyypillisille lauseille. CosyVoice 2 tukee suoratoistotulosta vielä pienemmällä latenssilla. Chatboteille ja ääniavustajille kokonaiskierrosaika on tyypillisesti 1-3 sekuntia tekstin pituudesta ja mallivalinnasta riippuen.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) ovat täysin ilmaisia. Vakiomallit käyttävät 2x merkkiä 1K:ta kohti. Premium-mallit käyttävät 4x merkkiä 1K:ta kohti. Rekisteröidy ilmaiseksi 15 000 kirjaimella. Suunnitelmat alkavat 500 000 kirjaimella.

Kyllä. Lataa ääninäytteen viitekappale (5-30 sekuntia) äänen kloonauksen päätetapahtumaan ja käytä sitä seuraavissa TTS-pyynnöissä. Kloonausta tukevia malleja ovat CosyVoice 2, Chatterbox, Fish Speech ja GPT-Sovits.

Vapaalla tasolla on perushintarajoitus (3 pyyntöä tunnissa ilman tiliä). Maksetuissa suunnitelmissa on tuotantosovelluksiin sopivat runsaat korkorajat. Ota yhteyttä yritystason läpimenovaatimuksiin.

WAV (paineeton, korkealaatuinen), MP3 (pakatut, pienemmät tiedostot), OGG (avoin formaatti) ja FLAC (häviötön pakkaus). Määritä formaatti pyynnössäsi. Oletus on WAV mallin alkuperäisellä näytteenottonopeudella.

Kyllä. Yhdistä TTS API puheesta tekstiin -malli ja LLM täydellisen ääniapuputken rakentamiseen. Kokoro tarjoaa sub-sekunnin latenssin, joka on ihanteellinen reaaliaikaiseen keskusteluun. CosyVoice 2 tukee suoratoistotulosta vielä matalammilla reaktioajoilla.

CosyVoice 2 ja Kokoro tukevat suoratoistoääntä, jossa äänisäikeet välittyvät sitä mukaa kuin ne syntyvät. Tämä lyhentää reaaliaikaisten sovellusten, kuten ääniavustajien ja vuorovaikutteisten elämysten aikaa.

API palauttaa normaalit HTTP-tilakoodit. Toteuta eksponentiaalinen varmuuskopio 5xx-virheistä ja nopeusrajoituksista. Tehtäväkriittisissä sovelluksissa jonoon lisätään uusintalogiikka. API:ssä on korkea käyttöaika, mutta häiriöiden käsittely on aina suositeltavaa.

Kyllä. /v1/äänet ja /v1/mallit -päätteet palauttavat JSON-listat kaikista käytettävissä olevista äänistä ja malleista metatietoineen (kielituki, laatuluokitukset, nopeusluokitukset ja hinnoittelutaso). Käytä näitä dynaamisen mallivalitsimen rakentamiseen sovelluksessasi.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) toimivat tehokkaana hiekkalaatikkona, koska ne maksavat nollapistettä. Testaa integroitumistasi ilmaisilla malleilla, vaihda premium-malleihin tuotannossa muuttamalla malliparametria. Erillistä testiympäristöä ei tarvita.

Suurin osa malleistamme on avoimia, ja niitä voidaan isännöidä itse. Itseohjautuvuus edellyttää kuitenkin merkittäviä GPU-resursseja (käytämme 4x NVIDIA Tesla P40:tä 96GB VRAM:lla). API tarjoaa kustannustehokkaan vaihtoehdon ilman infrastruktuurin hallintaa.

5.0/5 (1)

Oletko valmis rakentamaan ääniaallon avulla?

Hanki ilmainen API-avain ja ala rakentaa. 50 krediittiä ilmoittautumisesta, ilmaisia malleja saatavilla, kattava dokumentointi.

Rekisteröidy ilmaiseksi Näkymän hinnoittelu

Kehittäjien puherajapintaan teksti

Kokeile nyt

Rakasta TTS.aita, kerro ystävillesi!

API-ominaisuuksia kehittäjille

Yksinkertainen REST API

OpenAI-yhteensopiva

24+-mallit saatavilla

Subsekunninen latenssi

Äänien kloonausrajapinta

Useita muotoja

Kehittäjien integraation parhaat mallit

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Miten TTS-rajapinta integroidaan

Hanki API-avain

Tee ensimmäinen puhelusi

Valitse mallisi

Laiva tuotantoon

Pikakäynnistyskoodiesimerkkejä

Mitä kehittäjät rakentavat TTS.ai:lla

AI Chatbots & Assistants

Mobiili- ja äänisovellukset

SaaS-tuotteet

Automaatioputkistot

API-erittelyt

Usein kysyttyjä kysymyksiä

Onko API yhteensopiva OpenAI TTS -formaatin kanssa?

Mikä on reaaliaikaisten sovellusten viivästys?

Miten hinnoittelu toimii API:n käytössä?

Voinko käyttää äänikloonausta API:n kautta?

Onko verorajaa?

Mitä ääniformaatteja API palauttaa?

Voinko käyttää API:tä ääniavustajan tai chatbotin rakentamiseen?

Onko olemassa verkkosocket- tai suoratoistorajapintaa?

Miten käsittelen virheitä ja retriikkejä tuotannossa?

Voinko luetella käytettävissä olevat äänet ja mallit ohjelmallisesti?

Onko olemassa hiekkalaatikkoa tai testausympäristöä?

Voinko itse isännöidä malleja sen sijaan, että käyttäisin API:tä?

Oletko valmis rakentamaan ääniaallon avulla?