Txostendu programa- errorea / Eskaera

Testu-hizketa APIa garatzaileentzat

Sortu ahots-gaitutako aplikazioak gure REST APIarekin. Gehitu testu-hizketa naturala, ahots-klonazioa, hizketa-testua eta audio-prozesaketa zure aplikazioei, txat-bot-ei, ahots-laguntzaileei eta SaaS produktuei. OpenAI-rekin bateragarria den formatua, 20 modelo baino gehiago, integrazio erraza.

REST APIa Chatbot-ak Ahots aplikazioak SaaS produktuak Automatizazioa

TTS editore osoa API dokumentazioa

Saiatu orain

0/500

Librea Kokoro, Piper, VITS, MeloTTS-ekin

Sortu duzun audioa hemen agertuko da

Ireki TTS editore osoa

API ezaugarriak garatzaileentzat

Ahotsa gaitutako aplikazioak sortzeko behar duzun guztia

REST API sinplea

Hizketa sortzeko POST eskaera bat. JSON eskaera, audio erantzuna. HTTP onartzen duen edozein programazio-lengoaiarekin funtzionatzen du.

OpenAI-rekin bateragarria

OpenAI TTS APIaren ordezkapen goitibeherakoa. Aldatu base_url eta API gakoa — lehendik dagoen kodeak berehala funtzionatuko du.

24+ modelo erabilgarri

Atzitu eredu guztiak API bakar baten bidez. Aldatu modeloak parametro bat aldatuz. Konparatu kalitatea, abiadura eta kostua.

Bigarren azpiko atzerapena

Kokoro-k audioa segundo batean sortzen du. Bikaina denbora errealeko chatbot-entzat, ahots-laguntzaileentzat eta aplikazio interaktiboentzat.

Ahotsa klonatzeko APIa

Klonatu edozein ahots audio-lagin laburretik APIaren bidez. Erabili ahots klonatuak hurrengo belaunaldi guztietan.

Formatu anitzak

Irteera WAV, MP3, OGG edo FLAC gisa. Aukeratu laginketa-tasa eta bit-sakonera. Denbora errealeko aplikazioentzako audio-transmisiorako euskarria.

Eredu onenak garatzaileen integraziorako

Aukeratu zure aplikaziorako egokia den modeloa

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Azkarra 5/5

Honako hauentzako onena: Modelo azkarrena — segundo azpiko latentzia, egokia denbora errealeko aplikazio eta chatbot-entzat

Saiatu Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Ertaina 5/5 Ahots klonaketa

Honako hauentzako onena: TTS streaming-a ahotsaren klonatzearekin ahots-laguntzaileen aplikazioetarako

Saiatu CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Motela 5/5

Honako hauentzako onena: AI elkarrizketarako, denbora naturalarekin chatbot eta ahots laguntzailearentzat

Saiatu Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Azkarra 3/5

Honako hauentzako onena: Modelo librea, PUZ soilarekin, bolumen handiko aplikazioetarako, kreditu kosturik gabe

Saiatu Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Motela 4/5

Honako hauentzako onena: Audio-sorkuntza soinu-efektuekin aplikazio sortzaile eta entretenigarrientzat

Saiatu Bark

Nola txertatu TTS APIa

Izena ematetik lehen API deiera arte 5 minutu baino gutxiago

Eskuratu zure API gakoa

Doan eman izena eta sortu API gako bat zure kontuaren paneletik. 15.000 karaktere barne.

Egin zure lehen deia

POST /v1/tts-ra testuarekin, modeloarekin eta ahotsarekin. Audio-byteak itzultzen ditu. 5 kode-lerrotan.

Aukeratu zure modeloa

Probatu modelo desberdinak zure kasurako. Konparatu abiadura, kalitatea eta belaunaldiko kostua.

Bidali produkziora

Eskalatu erabili ahala ordaintzen diren kredituekin. Tarifa-mugarik ez ordaindutako planetan. Monitorizatu erabilera zure kontrol-panelean.

Hasiera azkarreko kodearen adibideak

Integratu TTS.ai edozein hizkuntzatan gure REST APIarekin

Python Popularra

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Unibertsala

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-rekin bateragarria den formatua Goitibeherakoa

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Eskuratu zure API doako gakoa

Zer garatzen duten garatzaileek TTS.ai-rekin

Integrazio eredu eta aplikazio arruntak

AI Chatbots & Assistants

Gehitu ahots-irteera zure chatbot-ari edo AI laguntzaileari. Bidal itzazu LLM erantzunak TTS bidez ahots-gaitutako interfazeetarako. Kokoro-k segundo azpiko latentzia eskaintzen du denbora errealeko elkarrizketetan. Sesame CSM-k elkarrizketa-hizketa sortzen du denbora naturalarekin.

LLM erantzuna hizketa-kanalari
Segundo azpiko atzerapena Kokororekin
Sesame CSM-rekin elkarrizketa-hizketa
Audio-irteera zuzenean

Mugikorra eta ahots aplikazioak

Ahotsa onartzen duten aplikazio mugikorrak, irisgarritasun-tresnak, irakurketa-aplikazioak eta hizkuntzak ikasteko plataformak eraiki. Gure REST APIak edozein mugikor-markorekin funtzionatzen du. Deskargatu audio-fitxategiak edo igorri zuzenean bezerora.

React Native, Flutter, Swift, Kotlin
Erabilerraztasun eta irakurketa aplikazioak
Hizkuntza ikasteko plataformak
Audio-edukiaren sorkuntza

SaaS produktuak

Etiketa zuriko ahots-gaitasunak zure SaaS produktuan. Gehitu TTS, STT, ahots-klonazioa eta audio-prozesatzea zure plataformako ezaugarri gisa. Erabili gure APIa zure ahots-backend gisa GPU azpiegitura kudeatu gabe.

White-label ahots-ezaugarriak
Ez da GPU azpiegiturarik behar
Erabilera bakoitzeko ordainketa
20+ modelo zure erabiltzaileei eskaintzeko

Automatizatutako hodiak

Integratu ahots-sorkuntza CI/CD hodietan, edukien automatizazioan eta lan-fluxuen prozesaketa batch-ean. Sortu milaka audio-fitxategi kalkulu-orrien datuetatik, automatizatu podcasten ekoizpena edo eraiki edukien lokalizazioaren hodiak.

Batch prozesamendua API bidez
Edukiaren lokalizazioaren hodiak
CI/CD integrazioa
Kalkulu-orria audioaren automatizaziorako

Ikusi APIaren dokumentazioa osorik

API zehaztapenak

Produkzio-aplikazioetarako eraikia

20+

TTS modeloak

100+

Ahotsak

30+

Hizkuntzak

<1s

Atzerapena (Kokoro)

Izena eman doan — 15.000 karaktere

Maiz egiten diren galderak

TTS.ai garatzailearen APIari buruzko galdera ohikoenak

Bai. Gure APIak OpenAI audio-hizketaren formatua jarraitzen du. OpenAI Python edo JavaScript bezero-liburutegia erabiltzen baduzu, TTS.ai-ra aldatu dezakezu base_url eta api_key parametroak aldatuz. Zure lehendik dagoen kodeak aldaketarik gabe funtzionatzen du.

Kokorok segundo batean baino gutxiagotan sortzen du audioa esaldi arruntetarako. CosyVoice 2k streaming irteera onartzen du, gero eta latentzia txikiagoa lortzeko. Berriketa-botentzat eta ahots-laguntzaileentzat, itzulerako denbora orokorra 1-3 segundokoa izaten da, testuaren luzeraren eta modeloaren aukeraren arabera.

Libreko modeloak (Kokoro, Piper, VITS, MeloTTS) erabat doakoak dira. Modelo estandarrek 2x karaktere erabiltzen dituzte testuko 1K bakoitzeko. Premium modeloek 4x karaktere erabiltzen dituzte testuko 1K bakoitzeko. Doan erregistratu 15.000 karaktererekin. Planak $9/hilean hasten dira 500.000 karaktererekin.

Bai. Kargatu erreferentziazko audio-lagin bat (5-30 segundo) ahots-klonatze-amaierako puntura, eta erabili klonatutako ahots-IDa hurrengo TTS eskaeretan. Klonatzea onartzen duten modeloak hauek dira: CosyVoice 2, Chatterbox, Fish Speech eta GPT-SoVITS.

Doako mailak oinarrizko tasa-mugak ditu (3 eskaera orduko konturik gabe). Ordaindutako planek tasa-muga handiak dituzte, ekoizpen-aplikazioetarako egokiak. Jarri gurekin harremanetan enpresa-mailako transferentzia-eskakizunetarako.

WAV (konprimitu gabea, kalitate handiena), MP3 (konprimitua, fitxategi txikiagoak), OGG (formatu irekia) eta FLAC (galdu gabeko konpresioa). Zehaztu formatua zure eskaeran. Lehenetsia WAV da, modeloaren laginketa-tasa natiboarekin.

Bai. Konbinatu gure TTS APIa hizketa-testurako eredu batekin eta LLM batekin ahots-laguntzailearen hoditegi osoa eraikitzeko. Kokorok segundo azpiko latentzia eskaintzen du, denbora errealeko elkarrizketetan ezin hobea. CosyVoice 2k streaming irteera onartzen du, erantzun-denbora txikiagoak lortzeko.

CosyVoice 2-k eta Kokoro-k audio-irteera zuzena onartzen dute, non audio-zatiak sortzen diren heinean entregatzen diren. Horrek lehen byteko denbora murrizten du denbora errealeko aplikazioetan, hala nola ahots-laguntzaileetan eta esperientzia interaktiboetan.

APIak HTTP egoera-kodeak itzultzen ditu. Inplementatu atzerapen esponentziala 5xx erroreetarako eta abiadura-mugako erantzunetarako. Misio-kritikoak diren aplikazioetarako, gehitu ilara bat berriro saiatzeko logikarekin. Gure APIak funtzionamendu-denbora luzea du, baina errore-kudeaketa erresilientea gomendatzen da beti.

Bai. /v1/voices eta /v1/models amaierako puntuek ahots eta modelo erabilgarri guztien JSON zerrendak itzultzen dituzte metadatuekin batera (hizkuntzaren euskarria, kalitatearen balorazioak, abiaduraren balorazioak eta prezioen maila). Erabili hauek zure aplikazioan modelo-hautatzaile dinamikoak sortzeko.

Eredu libreak (Kokoro, Piper, VITS, MeloTTS) sandbox eraginkor gisa balio dute, zero kreditu kostatzen baitituzte. Probatu zure integrazioa eredu libreekin, eta gero aldatu ekoizpenean premium ereduetara ereduaren parametroa aldatuz. Ez da proba-ingurune berezirik behar.

Gure modelo gehienak kode irekikoak dira eta norberak ostatatu daitezke. Hala ere, norberak ostatatzeak GPU baliabide handiak behar ditu (4x NVIDIA Tesla P40 erabiltzen dugu, guztira 96 GB VRAM). APIak alternatiba merkea eskaintzen du azpiegitura kudeatu gabe.

5.0/5 (1)

Prest zaude ahots-AIarekin eraikitzeko?

Eskuratu zure API gakoa doan eta hasi eraikitzen. 15.000 karaktere erregistratu ondoren, doako ereduak eskuragarri, dokumentazioa osoa.

Izena eman doan Ikusi prezioa

Testu-hizketa APIa garatzaileentzat

Saiatu orain

Maite TTS.ai? Esan zure lagunei!

API ezaugarriak garatzaileentzat

REST API sinplea

OpenAI-rekin bateragarria

24+ modelo erabilgarri

Bigarren azpiko atzerapena

Ahotsa klonatzeko APIa

Formatu anitzak

Eredu onenak garatzaileen integraziorako

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Nola txertatu TTS APIa

Eskuratu zure API gakoa

Egin zure lehen deia

Aukeratu zure modeloa

Bidali produkziora

Hasiera azkarreko kodearen adibideak

Zer garatzen duten garatzaileek TTS.ai-rekin

AI Chatbots & Assistants

Mugikorra eta ahots aplikazioak

SaaS produktuak

Automatizatutako hodiak

API zehaztapenak

Maiz egiten diren galderak

APIa OpenAI TTS formatuarekin bateragarria al da?

Zein da denbora errealeko aplikazioen latentzia?

Nola funtzionatzen du API erabileraren prezioak?

Ahotsa klonatzea erabil dezaket APIaren bidez?

Ba al dago abiadura mugarik?

Zein audio-formatu itzultzen ditu APIak?

Erabili al dezaket APIa ahots-laguntzaile bat edo chatbot bat sortzeko?

Ba al dago WebSocket edo streaming API bat?

Nola kudeatzen ditut erroreak eta saiakerak ekoizpenean?

Ahots eta modelo erabilgarriak programa bidez zerrendatu ditzaket?

Badago sandbox edo proba-ingurune bat?

Auto-ostatu ditzaket ereduak APIa erabili ordez?

Prest zaude ahots-AIarekin eraikitzeko?