Teksts uz runas API izstrādātājiem

Izveidot balss aplikācijas ar mūsu REST API. Pievienot dabisko tekstu-to-speech, balss klonēšana, runas-teksta un audio apstrāde jūsu lietotnēm, tērzēšanas robotiem, balss asistentiem un SaaS produktiem. OpenAI saderīgu formātu, 20+ modeļus, vienkāršu integrāciju.

REST API Tērzēšanas roboti Balss lietojumprogrammas SaaS produkti Automatizācija

Pamēģini tagad

Bez taras ar Kokoro, Piper, VITS, MeloTTS
Šeit parādīsies jūsu ģenerētais audio
Ģenerēts
Lejupielādēt
Mīlestība TTS.ai? Stāsti saviem draugiem!

API īpašības izstrādātājiem

Viss, kas jums nepieciešams, lai izveidotu balss lietojumprogrammas

Vienkārša REST API

Viens post pieprasījums ģenerēt runu. JSON pieprasījums, audio atbilde. Darbojas ar jebkuru programmēšanas valodu, kas atbalsta HTTP.

Ar OpenAI savietojamu

Iemetiet OpenAI TTS API aizvietotāju. Pārslēdziet jūsu bāzes_url un API atslēgu – esošais kods darbojas nekavējoties.

Pieejami 24+ modeļi

Pieeja katram modelim, izmantojot vienu API. Pārslēdziet modeļus, mainot vienu parametru. Salīdziniet kvalitāti, ātrumu un izmaksas.

Sub-otrā latentums

Kokoro ģenerē audio ar 1 sekundi. Ideāli piemērots reālā laika tērzēšanas robotiem, balss asistentiem un interaktīvām lietojumprogrammām.

Balss klonēšana API

Clone jebkuru balsi no īsa audio parauga caur API. Izmanto klonētas balsis visām nākamajām paaudzēm.

Vairāki formāti

Izvade kā WAV, MP3, OGG vai FLAC. Izvēlieties parauga ātrumu un bitu dziļumu. Straumēšana audio atbalsts reālā laika aplikācijām.

Labākie modeļi izstrādātāju integrācijai

Izvēlieties pareizo modeli jūsu lietojumprogrammas ātrumu, kvalitāti un izmaksu prasībām

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Labākais par: Ātrākais modelis — sekundāra latentums, ideāli piemērots reālā laika lietotnēm un tērzēšanas robotiem

Mēģināt Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Balss klonēšana

Labākais par: TTS straumēšana ar balss klonēšanu balss palīgprogrammām

Mēģināt CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Labākais par: Sarunu AI ar dabisko laiku čatbot un palīgs balss

Mēģināt Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Labākais par: Bezmaksas, tikai CPU modelis liela apjoma lietojumprogrammām ar nulles kredīta izmaksām

Mēģināt Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Labākais par: Audio ģenerēšana ar skaņas efektiem radošajām un izklaides lietotnēm

Mēģināt Bark

Kā integrēt TTS API

No pierakstīšanās līdz pirmajam API zvanam pēc 5 minūtēm

1

Iegūstiet API atslēgu

Pierakstīties par brīvu un ģenerēt API taustiņu no sava konta paneļa. 15,000 rakstzīmes iekļauti.

2

Pirmo reizi zvaniet

Pozīcija /v1/tts ar tekstu, modeli un balsi. Atgriezties audio baitos. Zem 5 koda rindiņām.

3

Izvēlieties savu modeli

Izmēģināt dažādus modeļus jūsu izmantošanas gadījumā. Salīdzināt ātrumu, kvalitāti un izmaksas katrai paaudzei.

4

Kuģis līdz ražošanai

Mērogs ar pay- as- you- go rakstzīmēm. Nav likmes ierobežojumu maksas plāniem. Uzraudzīt izmantošanu jūsu panelī.

Ātrās palaišanas koda piemēri

Integrēt TTS.ai jebkurā valodā ar mūsu REST API

Python Populārs
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Universāls
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Ar OpenAI savietojams formāts Iemetiens
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ko izstrādātāji veido ar TTS.ai

Kopīgi integrācijas modeļi un lietojumprogrammas

AI tērzēšanas roboti un palīgi

Pievienojiet balss izvadi čatbotam vai AI asistentam. Cauruļveida LLM atbildes caur TTS balss saskarnēm. Kokoro nodrošina sub-sekundāro latenci reālā laika sarunām. Sesame CSM ģenerē saruna runu ar dabisku laiku.

  • LLM reakcija uz runas cauruļvadu
  • Sub-sekunde latentums ar Kokoro
  • Sarunu runa ar Sezama CSM
  • Straumēšana audio izvade

Mobilās un balss lietotnes

Izveidojiet balss aplikācijas, pieejamības rīkus, lasīšanas aplikācijas un valodu mācību platformas. Mūsu REST API strādā ar jebkuru mobilo sistēmu. Lejupielādējiet audio failus vai straumi tieši klientam.

  • Reaktīvais native, Flutter, Swift, Kotlin
  • Pieejamības un lasīšanas lietojumprogrammas
  • Valodas apguves platformas
  • Audio satura ģenerēšana

SaaS produkti

White-label balss iespējas jūsu SaaS produktu. Pievienot TTS, STT, balss klonēšana un audio apstrāde kā funkcijas jūsu platformā. Izmantojiet mūsu API kā savu balss aizmuguri bez GPU infrastruktūras vadības.

  • Balss funkcijas ar baltu marķējumu
  • Nevajadzīga GPU infrastruktūra
  • Maksājuma uz vienu lietotāju cenas noteikšana
  • 20+ modeļi, lai piedāvātu lietotājiem

Automatizācijas cauruļvadi

Iekļaut balss ģenerēšanu CI/CD vados, satura automatizāciju un partiju apstrādes darbplūsmas. Izveidot tūkstošiem audio failu no izklājlapu datiem, automatizēt podcast ražošanu, vai veidot satura lokalizācijas cauruļvadus.

  • Partijas apstrāde, izmantojot API
  • Satura lokalizācijas cauruļvadi
  • CI/CD integrācija
  • Izklājlapa audio automatizācijai

API specifikācijas

Iebūvēti ražošanas lietojumiem

20+

TTS modeļi

100+

Balss

30+

Valodas

<1s

Platums (Kokoro)

Bieži uzdoti jautājumi

Bieži uzdotie jautājumi par TTS.ai izstrādātāju API

Jā. Mūsu API seko OpenAI audio runas formātam. Ja izmantojat OpenAI Python vai JavaScript klienta bibliotēku, Jūs varat pārslēgties uz TTS.ai, mainot bāzes_url un api_key parametrus. Jūsu esošais kods darbojas bez izmaiņām.

Kokoro ģenerē audio ar mazāk nekā 1 sekundi tipiskiem teikumiem. CosyVoice 2 atbalsta straumēšanas izlaidi vēl zemākām uztveramām latenci. Tērzēšanas robotiem un balss palīgiem kopējais apaļās joslas laiks parasti ir 1-3 sekundes atkarībā no teksta garuma un modeļa izvēles.

Bezmaksas modeļi (Kokoro, Piper, VITS, MeloTTS) ir pilnīgi bez maksas. Standarta modeļi izmanto 2x rakstzīmes uz 1K teksta. Premium modeļi izmanto 4x rakstzīmes uz 1K teksta. Pieteikties bezmaksas ar 15,000 rakstzīmēm. Plāni sākas $9/mēnesī par 500,000 rakstzīmēm.

Jā. Ielādējiet references audio paraugu (5-30 sekundes) uz balss klonēšanas galapunktu, pēc tam izmantojiet klonēto balss ID turpmākajos TTS pieprasījumos. Modeļi, kas atbalsta klonēšanu, ietver CosyVoice 2, Chatterbox, Fish Speech, un GPT-SoVITS.

Bezmaksas līmenis ir pamata likmes ierobežošana (3 pieprasījumi stundā bez konta). Maksātie plāni ir dāsni likmes ierobežojumi, kas piemēroti ražošanas lietojumiem. Sazinieties ar mums par uzņēmuma līmeņa caurlaides prasībām.

WAV (nepiespiests, augstākās kvalitātes), MP3 (piespiests, mazāki faili), OGG (atvērts formāts) un FLAC (bezzudumu kompresija). Noklusētais ir WAV pie modeļa dzimtā parauga ātrums.

Jā. Apvienojiet mūsu TTS API ar runas uz tekstu modeli un LLM, lai izveidotu pilnīgu balss asistenta cauruli. Kokoro nodrošina sub-sekundi latentumu ideāli reāllaika sarunām. CosyVoice 2 atbalsta straumēšanas izvadi vēl zemāk uztvertiem atbildes laikiem.

CosyVoice 2 un Kokoro atbalsta straumēšanas audio izvadi, kur tiek piegādāti audio gabali, jo tie tiek radīti. Tas samazina laiku līdz pirmajam baitam reālā laika lietojumprogrammām, piemēram, balss palīgiem un interaktīvo pieredzi.

API atgriež standarta HTTP statusa kodus. Īstenot eksponenciālu atkļūdošanu 5xx kļūdām un ātruma limita atbildēm. Misijai kritiskām programmām pievienojiet rindu ar atkārtotu loģiku. Mūsu API ir augsts uptime, bet noturīga kļūdu apstrāde vienmēr ir ieteicama.

Jā. /v1/balsojumi un /v1/modeļi galamērķi atgriež JSON visu pieejamo balsu un modeļu sarakstus ar saviem metadatiem (valodu atbalsts, kvalitātes novērtējums, ātruma novērtējums un cenu līmenis). Izmantojiet tos, lai veidotu dinamiskos modeļus jūsu lietotnē.

Bezmaksas modeļi (Kokoro, Piper, VITS, MeloTTS) kalpo kā efektīva smilšu kaste, jo tie maksā nulles kredītus. Pārbaudiet savu integrāciju ar bezmaksas modeļiem, tad pārslēdzieties uz augstākās klases ražošanas modeļiem, mainot modeļa parametru. Nav nepieciešama atsevišķa testēšanas vide.

Lielākā daļa no mūsu modeļiem ir atvērti un var tikt patstāvīgi. Tomēr pašapkalpošanās prasa ievērojamus GPU resursus (mēs izmantojam 4x NVIDIA Tesla P40 ar 96GB VRAM kopā). API nodrošina rentablu alternatīvu bez infrastruktūras pārvaldības.
5.0/5 (1)

Ko mēs varam uzlabot? Jūsu atgriezeniskā saite palīdz mums atrisināt problēmas.

Gatavs celt ar balss AI?

Iegūstiet bezmaksas API atslēgu un uzsākiet būvniecību. 15 kredīti pieteikšanās, bezmaksas modeļi pieejami, visaptveroša dokumentācija.