Testu-hizketa APIa garatzaileentzat

Sortu ahots-gaitutako aplikazioak gure REST APIarekin. Gehitu testu-hizketa naturala, ahots-klonazioa, hizketa-testua eta audio-prozesaketa zure aplikazioei, txat-bot-ei, ahots-laguntzaileei eta SaaS produktuei. OpenAI-rekin bateragarria den formatua, 24+ modelo, integrazio erraza.

REST APIa Chatbot-ak Ahots aplikazioak SaaS produktuak Automatizazioa

Saiatu orain

0/500
Librea Kokoro, Piper, VITS, MeloTTS-ekin
Your generated audio will appear here
Sortua
0:00 0:00
Deskargatu
TTS.ai gustatzen zaizu? Esaiozu zure lagunei!

API ezaugarriak garatzaileentzat

Ahotsa gaitutako aplikazioak sortzeko behar duzun guztia

REST API sinplea

Hizketa sortzeko POST eskaera bat. JSON eskaera, audio erantzuna. HTTP onartzen duen edozein programazio-lengoaiarekin funtzionatzen du.

OpenAI-rekin bateragarria

OpenAI TTS APIaren ordezkapen goitibeherakoa. Aldatu base_url eta API gakoa — lehendik dagoen kodeak berehala funtzionatuko du.

24+ modelo erabilgarri

Atzitu eredu guztiak API bakar baten bidez. Aldatu modeloak parametro bat aldatuz. Konparatu kalitatea, abiadura eta kostua.

Bigarren azpiko atzerapena

Kokoro-k audioa segundo batean sortzen du. Bikaina denbora errealeko chatbot-entzat, ahots-laguntzaileentzat eta aplikazio interaktiboentzat.

Ahotsa klonatzeko APIa

Klonatu edozein ahots audio-lagin laburretik APIaren bidez. Erabili ahots klonatuak hurrengo belaunaldi guztietan.

Formatu anitzak

Irteera WAV, MP3, OGG edo FLAC gisa. Aukeratu laginketa-tasa eta bit-sakonera. Denbora errealeko aplikazioentzako audio-transmisiorako euskarria.

Eredu onenak garatzaileen integraziorako

Aukeratu zure aplikaziorako egokia den modeloa

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Honako hauentzako onena: Modelo azkarrena — segundo azpiko latentzia, egokia denbora errealeko aplikazio eta chatbot-entzat

Saiatu Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Ahots klonaketa

Honako hauentzako onena: TTS streaming-a ahotsaren klonatzearekin ahots-laguntzaileen aplikazioetarako

Saiatu CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Honako hauentzako onena: AI elkarrizketarako, denbora naturalarekin chatbot eta ahots laguntzailearentzat

Saiatu Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Honako hauentzako onena: Modelo librea, PUZ soilarekin, bolumen handiko aplikazioetarako, kreditu kosturik gabe

Saiatu Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Honako hauentzako onena: Audio-sorkuntza soinu-efektuekin aplikazio sortzaile eta entretenigarrientzat

Saiatu Bark

Nola txertatu TTS APIa

Izena ematetik lehen API deiera arte 5 minutu baino gutxiago

1

Eskuratu zure API gakoa

Izena eman doan eta sortu API gako bat zure kontu-paneletik. 50 kreditu barne.

2

Egin zure lehen deia

POST /v1/tts-ra testuarekin, modeloarekin eta ahotsarekin. Audio-byteak itzultzen ditu. 5 kode-lerrotan.

3

Aukeratu zure modeloa

Probatu modelo desberdinak zure kasurako. Konparatu abiadura, kalitatea eta belaunaldiko kostua.

4

Bidali produkziora

Eskalatu erabili ahala ordaintzen diren kredituekin. Tarifa-mugarik ez ordaindutako planetan. Monitorizatu erabilera zure kontrol-panelean.

Hasiera azkarreko kodearen adibideak

Integratu TTS.ai edozein hizkuntzatan gure REST APIarekin

Python Popularra
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Unibertsala
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-rekin bateragarria den formatua Goitibeherakoa
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Zer garatzen duten garatzaileek TTS.ai-rekin

Integrazio eredu eta aplikazio arruntak

AI Chatbots & Assistants

Gehitu ahots-irteera zure chatbot-ari edo AI laguntzaileari. Bidal itzazu LLM erantzunak TTS bidez ahots-gaitutako interfazeetarako. Kokoro-k segundo azpiko latentzia eskaintzen du denbora errealeko elkarrizketetan. Sesame CSM-k elkarrizketa-hizketa sortzen du denbora naturalarekin.

  • LLM erantzuna hizketa-kanalari
  • Segundo azpiko atzerapena Kokororekin
  • Sesame CSM-rekin elkarrizketa-hizketa
  • Audio-irteera zuzenean

Mugikorra eta ahots aplikazioak

Ahotsa onartzen duten aplikazio mugikorrak, irisgarritasun-tresnak, irakurketa-aplikazioak eta hizkuntzak ikasteko plataformak eraiki. Gure REST APIak edozein mugikor-markorekin funtzionatzen du. Deskargatu audio-fitxategiak edo igorri zuzenean bezerora.

  • React Native, Flutter, Swift, Kotlin
  • Erabilerraztasun eta irakurketa aplikazioak
  • Hizkuntza ikasteko plataformak
  • Audio-edukiaren sorkuntza

SaaS produktuak

Etiketa zuriko ahots-gaitasunak zure SaaS produktuan. Gehitu TTS, STT, ahots-klonazioa eta audio-prozesatzea zure plataformako ezaugarri gisa. Erabili gure APIa zure ahots-backend gisa GPU azpiegitura kudeatu gabe.

  • White-label ahots-ezaugarriak
  • Ez da GPU azpiegiturarik behar
  • Erabilera bakoitzeko ordainketa
  • 24+ modelo zure erabiltzaileei eskaintzeko

Automatizatutako hodiak

Integratu ahots-sorkuntza CI/CD hodietan, edukien automatizazioan eta lan-fluxuen prozesaketa batch-ean. Sortu milaka audio-fitxategi kalkulu-orrien datuetatik, automatizatu podcasten ekoizpena edo eraiki edukien lokalizazioaren hodiak.

  • Batch prozesamendua API bidez
  • Edukiaren lokalizazioaren hodiak
  • CI/CD integrazioa
  • Kalkulu-orria audioaren automatizaziorako

API zehaztapenak

Produkzio-aplikazioetarako eraikia

24+

TTS modeloak

100+

Ahotsak

30+

Hizkuntzak

<1s

Atzerapena (Kokoro)

Maiz egiten diren galderak

TTS.ai garatzailearen APIari buruzko galdera ohikoenak

Bai. Gure APIak OpenAI audio-hizketaren formatua jarraitzen du. OpenAI Python edo JavaScript bezero-liburutegia erabiltzen baduzu, TTS.ai-ra aldatu dezakezu base_url eta api_key parametroak aldatuz. Zure lehendik dagoen kodeak aldaketarik gabe funtzionatzen du.

Kokorok segundo batean baino gutxiagotan sortzen du audioa esaldi arruntetarako. CosyVoice 2k streaming irteera onartzen du, gero eta latentzia txikiagoa lortzeko. Berriketa-botentzat eta ahots-laguntzaileentzat, itzulerako denbora orokorra 1-3 segundokoa izaten da, testuaren luzeraren eta modeloaren aukeraren arabera.

Doako modeloek (Kokoro, Piper, VITS, MeloTTS) zero kreditu balio dute. Modelo estandarrek 2 kreditu balio dute 1.000 karaktere bakoitzeko. Premium modeloek 4 kreditu balio dute 1.000 karaktere bakoitzeko. Izena eman doan 50 krediturekin. Planak $9/hilean hasten dira 500 krediturekin.

Bai. Kargatu erreferentziazko audio-lagin bat (5-30 segundo) ahots-klonatze-amaierako puntura, eta erabili klonatutako ahots-IDa hurrengo TTS eskaeretan. Klonatzea onartzen duten modeloak hauek dira: CosyVoice 2, Chatterbox, Fish Speech eta GPT-SoVITS.

Doako mailak oinarrizko tasa-mugak ditu (3 eskaera orduko konturik gabe). Ordaindutako planek tasa-muga handiak dituzte, ekoizpen-aplikazioetarako egokiak. Jarri gurekin harremanetan enpresa-mailako transferentzia-eskakizunetarako.

WAV (konprimitu gabea, kalitate handiena), MP3 (konprimitua, fitxategi txikiagoak), OGG (formatu irekia) eta FLAC (galdu gabeko konpresioa). Zehaztu formatua zure eskaeran. Lehenetsia WAV da, modeloaren laginketa-tasa natiboarekin.

Bai. Konbinatu gure TTS APIa hizketa-testurako eredu batekin eta LLM batekin ahots-laguntzailearen hoditegi osoa eraikitzeko. Kokorok segundo azpiko latentzia eskaintzen du, denbora errealeko elkarrizketetan ezin hobea. CosyVoice 2k streaming irteera onartzen du, erantzun-denbora txikiagoak lortzeko.

CosyVoice 2-k eta Kokoro-k audio-irteera zuzena onartzen dute, non audio-zatiak sortzen diren heinean entregatzen diren. Horrek lehen byteko denbora murrizten du denbora errealeko aplikazioetan, hala nola ahots-laguntzaileetan eta esperientzia interaktiboetan.

APIak HTTP egoera-kodeak itzultzen ditu. Inplementatu atzerapen esponentziala 5xx erroreetarako eta abiadura-mugako erantzunetarako. Misio-kritikoak diren aplikazioetarako, gehitu ilara bat berriro saiatzeko logikarekin. Gure APIak funtzionamendu-denbora luzea du, baina errore-kudeaketa erresilientea gomendatzen da beti.

Bai. /v1/voices eta /v1/models amaierako puntuek ahots eta modelo erabilgarri guztien JSON zerrendak itzultzen dituzte metadatuekin batera (hizkuntzaren euskarria, kalitatearen balorazioak, abiaduraren balorazioak eta prezioen maila). Erabili hauek zure aplikazioan modelo-hautatzaile dinamikoak sortzeko.

Eredu libreak (Kokoro, Piper, VITS, MeloTTS) sandbox eraginkor gisa balio dute, zero kreditu kostatzen baitituzte. Probatu zure integrazioa eredu libreekin, eta gero aldatu ekoizpenean premium ereduetara ereduaren parametroa aldatuz. Ez da proba-ingurune berezirik behar.

Gure modelo gehienak kode irekikoak dira eta norberak ostatatu daitezke. Hala ere, norberak ostatatzeak GPU baliabide handiak behar ditu (4x NVIDIA Tesla P40 erabiltzen dugu, guztira 96 GB VRAM). APIak alternatiba merkea eskaintzen du azpiegitura kudeatu gabe.
5.0/5 (1)

Prest zaude ahots-AIarekin eraikitzeko?

Eskuratu zure doako API gakoa eta hasi eraikitzen. 50 kreditu izena ematean, doako ereduak eskuragarri, dokumentazioa osoa.