Kehittäjien puherajapintaan teksti

Rakenna REST API:n avulla ääniohjattavia sovelluksia. Lisää sovelluksiin, chatbotteihin, ääniavustajiin ja SaaS-tuotteisiin luonnollinen teksti-puhe-äänikloonaus, äänentoisto- ja äänenkäsittely. OpenAI-yhteensopiva formaatti, 20+-mallit, yksinkertainen integraatio.

REST API Chatbotit Äänisovellukset SaaS-tuotteet Automaatio

Kokeile nyt

Vapaa Kokoron, Piperin, VITS:n, MeloTTS:n kanssa
Luomasi ääni näkyy tässä
Luotu
Lataa
Rakasta TTS.aita, kerro ystävillesi!

API-ominaisuuksia kehittäjille

Kaikki, mitä tarvitset ääniohjattavien sovellusten rakentamiseen

Yksinkertainen REST API

Yksi POST-pyyntö puheen tuottamiseksi. JSON-pyyntö, äänivastaus. Toimii millä tahansa ohjelmakielellä, joka tukee HTTP:tä.

OpenAI-yhteensopiva

OpenAI TTS API:n vaihtoon. Vaihda perus_url- ja API-avain – olemassa oleva koodi toimii välittömästi.

24+-mallit saatavilla

Käytä kaikkia malleja yhden API:n kautta. Vaihda malleja vaihtamalla yhtä parametria. Vertaa laatua, nopeutta ja kustannuksia.

Subsekunninen latenssi

Kokoro tuottaa äänen alle sekunnissa. Täydellinen reaaliaikaisille chatboteille, ääniavustajille ja vuorovaikutteisille sovelluksille.

Äänien kloonausrajapinta

Kloonaaa minkä tahansa äänen lyhyestä ääninäytteestä API:n kautta. Käytä kloonattuja ääniä kaikille tuleville sukupolville.

Useita muotoja

WAV, MP3, OGG tai FLAC. Valitse näytenopeus ja bittisyvyys. Virrataan äänitukea reaaliaikaisiin sovelluksiin.

Kehittäjien integraation parhaat mallit

Valitse sovelluksesi nopeus-, laatu- ja kustannusvaatimuksiin sopiva malli

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Paras: Nopein malli – alisekunnin latenssi, ihanteellinen reaaliaikaisiin sovelluksiin ja chatbotteihin

Kokeile Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Äänien kloonaus

Paras: TTS:n virtaviivaistaminen ääniassistenttisovelluksia varten äänen kloonauksella

Kokeile CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Paras: Keskustelullinen tekoäly luontainen ajoitus chatbotille ja avustajaäänelle

Kokeile Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Paras: Maksuton, vain CPU-malli suurille sovelluksille ilman luottokuluja

Kokeile Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Paras: Audiogeneraation äänitehosteet luoviin ja viihdesovelluksiin

Kokeile Bark

Miten TTS-rajapinta integroidaan

Ilmoittautumisesta ensimmäiseen API-puheluun alle viidessä minuutissa

1

Hanki API-avain

Rekisteröidy ilmaiseksi ja luo API-avain tilisi kojelaudalta. Mukana 15 000 merkkiä.

2

Tee ensimmäinen puhelusi

Post to /v1/tts tekstillä, mallilla ja äänellä. Saat äänitavut takaisin. Alle 5 riviä koodia.

3

Valitse mallisi

Testaa eri malleja käyttökoteloosi. Vertaa nopeutta, laatua ja kustannuksia sukupolvea kohti.

4

Laiva tuotantoon

Scale with pay-as-yo-go -hahmot. Ei korkorajoituksia maksullisille suunnitelmille. Seuraa käyttöä kojelaudassasi.

Pikakäynnistyskoodiesimerkkejä

Integroi TTS.ai kaikilla kielillä REST-rajapintaamme

Python Suosittu
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Yleismaailmallinen
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-yhteensopiva muoto Pudotus
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Mitä kehittäjät rakentavat TTS.ai:lla

Yhteiset integraatiomallit ja sovellukset

AI Chatbots & Assistants

Lisää äänilähtö chatbottiisi tai tekoälyavustajaasi. Pipe LLM vastaa TTS:n kautta äänikäyttöisiin rajapintoihin. Kokoro tuo sub-sekunnin viiveen reaaliaikaisiin keskusteluihin. Sesame CSM synnyttää keskustelupuhetta luonnollisella ajoituksella.

  • LLM:n vastaus puheputkeen
  • Sub-second latenssi Kokoron kanssa
  • Keskustelupuhe Seesamin CSM:n kanssa
  • Virroitetaan äänilähtöä

Mobiili- ja äänisovellukset

Rakenna ääniohjattuja mobiilisovelluksia, saavutettavuustyökaluja, lukusovelluksia ja kielenoppimisalustoja. REST API toimii minkä tahansa mobiilijärjestelmän kanssa. Lataa äänitiedostoja tai streamia suoraan asiakkaalle.

  • Reaktio Native, Futter, Swift, Kotlin
  • Esteettömyys- ja lukusovellukset
  • Kieltenoppimisalustat
  • Äänisisällön tuottaminen

SaaS-tuotteet

Valkoisen merkin ääniominaisuudet SaaS-tuotteessa. Lisää TTS, STT, äänikloonaus ja äänenkäsittely ominaisuuksiksi alustaasi. Käytä API:tä äänitaustanasi ilman GPU-infrastruktuurin hallintaa.

  • Valkoisen merkin ääniominaisuudet
  • GPU-infrastruktuuria ei tarvita
  • Käyttäytymiskohtainen hinnoittelu
  • 20+-mallia tarjota käyttäjillesi

Automaatioputkistot

Integroi äänentuotanto CI/CD-putkistoihin, sisällön automaatioon ja eränkäsittelyyn. Luo tuhansia äänitiedostoja laskentataulukon tiedoista, automatisoi podcast-tuotannon tai rakentaa sisällön lokalisointiputkistoja.

  • Erän käsittely API:n kautta
  • Sisällön lokalisointiputkistot
  • CI/CD-integraatio
  • Laskentataulukko audioautomaatioon

API-erittelyt

Rakennettu tuotantosovelluksia varten

20+

TTS-mallit

100+

Ääniä

30+

Kielet

<1s

Latenssi (Kokoro)

Usein kysyttyjä kysymyksiä

Yleisiä kysymyksiä TTS.ai kehittäjän API:sta

Kyllä. API seuraa OpenAI-äänipuheformaattia. Jos käytät OpenAI Python - tai JavaScript-asiakaskirjastoa, voit vaihtaa TTS.ai:een muuttamalla base_url- ja api_key-parametrit. Olemassa oleva koodisi toimii ilman muutoksia.

Kokoro tuottaa äänen alle sekunnissa tyypillisille lauseille. CosyVoice 2 tukee suoratoistotulosta vielä pienemmällä latenssilla. Chatboteille ja ääniavustajille kokonaiskierrosaika on tyypillisesti 1-3 sekuntia tekstin pituudesta ja mallivalinnasta riippuen.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) ovat täysin ilmaisia. Vakiomallit käyttävät 2x merkkiä 1K:ta kohti. Premium-mallit käyttävät 4x merkkiä 1K:ta kohti. Rekisteröidy ilmaiseksi 15 000 kirjaimella. Suunnitelmat alkavat 500 000 kirjaimella.

Kyllä. Lataa ääninäytteen viitekappale (5-30 sekuntia) äänen kloonauksen päätetapahtumaan ja käytä sitä seuraavissa TTS-pyynnöissä. Kloonausta tukevia malleja ovat CosyVoice 2, Chatterbox, Fish Speech ja GPT-Sovits.

Vapaalla tasolla on perushintarajoitus (3 pyyntöä tunnissa ilman tiliä). Maksetuissa suunnitelmissa on tuotantosovelluksiin sopivat runsaat korkorajat. Ota yhteyttä yritystason läpimenovaatimuksiin.

WAV (paineeton, korkealaatuinen), MP3 (pakatut, pienemmät tiedostot), OGG (avoin formaatti) ja FLAC (häviötön pakkaus). Määritä formaatti pyynnössäsi. Oletus on WAV mallin alkuperäisellä näytteenottonopeudella.

Kyllä. Yhdistä TTS API puheesta tekstiin -malli ja LLM täydellisen ääniapuputken rakentamiseen. Kokoro tarjoaa sub-sekunnin latenssin, joka on ihanteellinen reaaliaikaiseen keskusteluun. CosyVoice 2 tukee suoratoistotulosta vielä matalammilla reaktioajoilla.

CosyVoice 2 ja Kokoro tukevat suoratoistoääntä, jossa äänisäikeet välittyvät sitä mukaa kuin ne syntyvät. Tämä lyhentää reaaliaikaisten sovellusten, kuten ääniavustajien ja vuorovaikutteisten elämysten aikaa.

API palauttaa normaalit HTTP-tilakoodit. Toteuta eksponentiaalinen varmuuskopio 5xx-virheistä ja nopeusrajoituksista. Tehtäväkriittisissä sovelluksissa jonoon lisätään uusintalogiikka. API:ssä on korkea käyttöaika, mutta häiriöiden käsittely on aina suositeltavaa.

Kyllä. /v1/äänet ja /v1/mallit -päätteet palauttavat JSON-listat kaikista käytettävissä olevista äänistä ja malleista metatietoineen (kielituki, laatuluokitukset, nopeusluokitukset ja hinnoittelutaso). Käytä näitä dynaamisen mallivalitsimen rakentamiseen sovelluksessasi.

Vapaat mallit (Kokoro, Piper, VITS, MeloTTS) toimivat tehokkaana hiekkalaatikkona, koska ne maksavat nollapistettä. Testaa integroitumistasi ilmaisilla malleilla, vaihda premium-malleihin tuotannossa muuttamalla malliparametria. Erillistä testiympäristöä ei tarvita.

Suurin osa malleistamme on avoimia, ja niitä voidaan isännöidä itse. Itseohjautuvuus edellyttää kuitenkin merkittäviä GPU-resursseja (käytämme 4x NVIDIA Tesla P40:tä 96GB VRAM:lla). API tarjoaa kustannustehokkaan vaihtoehdon ilman infrastruktuurin hallintaa.
5.0/5 (1)

Mitä voisimme parantaa? Palautteesi auttaa meitä korjaamaan ongelmia.

Oletko valmis rakentamaan ääniaallon avulla?

Hanki ilmainen API-avain ja ala rakentaa. 50 krediittiä ilmoittautumisesta, ilmaisia malleja saatavilla, kattava dokumentointi.