Ziņot par kļūdu / funkciju pieprasījumu

Teksts uz runas API izstrādātājiem

Izveidot balss aplikācijas ar mūsu REST API. Pievienot dabisko tekstu-to-speech, balss klonēšana, runas-teksta un audio apstrāde jūsu lietotnēm, tērzēšanas robotiem, balss asistentiem un SaaS produktiem. OpenAI saderīgu formātu, 20+ modeļus, vienkāršu integrāciju.

REST API Tērzēšanas roboti Balss lietojumprogrammas SaaS produkti Automatizācija

Pilns TTS redaktors API dokumenti

Pamēģini tagad

Teksts
Faili

0/500

Bez taras ar Kokoro, Piper, VITS, MeloTTS

Šeit parādīsies jūsu ģenerētais audio

Atvērt pilnu TTS redaktoru

API īpašības izstrādātājiem

Viss, kas jums nepieciešams, lai izveidotu balss lietojumprogrammas

Vienkārša REST API

Viens post pieprasījums ģenerēt runu. JSON pieprasījums, audio atbilde. Darbojas ar jebkuru programmēšanas valodu, kas atbalsta HTTP.

Ar OpenAI savietojamu

Iemetiet OpenAI TTS API aizvietotāju. Pārslēdziet jūsu bāzes_url un API atslēgu – esošais kods darbojas nekavējoties.

Pieejami 24+ modeļi

Pieeja katram modelim, izmantojot vienu API. Pārslēdziet modeļus, mainot vienu parametru. Salīdziniet kvalitāti, ātrumu un izmaksas.

Sub-otrā latentums

Kokoro ģenerē audio ar 1 sekundi. Ideāli piemērots reālā laika tērzēšanas robotiem, balss asistentiem un interaktīvām lietojumprogrammām.

Balss klonēšana API

Clone jebkuru balsi no īsa audio parauga caur API. Izmanto klonētas balsis visām nākamajām paaudzēm.

Vairāki formāti

Izvade kā WAV, MP3, OGG vai FLAC. Izvēlieties parauga ātrumu un bitu dziļumu. Straumēšana audio atbalsts reālā laika aplikācijām.

Labākie modeļi izstrādātāju integrācijai

Izvēlieties pareizo modeli jūsu lietojumprogrammas ātrumu, kvalitāti un izmaksu prasībām

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Labākais par: Ātrākais modelis — sekundāra latentums, ideāli piemērots reālā laika lietotnēm un tērzēšanas robotiem

Mēģināt Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Balss klonēšana

Labākais par: TTS straumēšana ar balss klonēšanu balss palīgprogrammām

Mēģināt CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Labākais par: Sarunu AI ar dabisko laiku čatbot un palīgs balss

Mēģināt Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Labākais par: Bezmaksas, tikai CPU modelis liela apjoma lietojumprogrammām ar nulles kredīta izmaksām

Mēģināt Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Labākais par: Audio ģenerēšana ar skaņas efektiem radošajām un izklaides lietotnēm

Mēģināt Bark

Kā integrēt TTS API

No pierakstīšanās līdz pirmajam API zvanam pēc 5 minūtēm

Iegūstiet API atslēgu

Pierakstīties par brīvu un ģenerēt API taustiņu no sava konta paneļa. 15,000 rakstzīmes iekļauti.

Pirmo reizi zvaniet

Pozīcija /v1/tts ar tekstu, modeli un balsi. Atgriezties audio baitos. Zem 5 koda rindiņām.

Izvēlieties savu modeli

Izmēģināt dažādus modeļus jūsu izmantošanas gadījumā. Salīdzināt ātrumu, kvalitāti un izmaksas katrai paaudzei.

Kuģis līdz ražošanai

Mērogs ar pay- as- you- go rakstzīmēm. Nav likmes ierobežojumu maksas plāniem. Uzraudzīt izmantošanu jūsu panelī.

Ātrās palaišanas koda piemēri

Integrēt TTS.ai jebkurā valodā ar mūsu REST API

Python Populārs

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Universāls

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

Ar OpenAI savietojams formāts Iemetiens

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Iegūstiet savu bezmaksas API atslēgu

Ko izstrādātāji veido ar TTS.ai

Kopīgi integrācijas modeļi un lietojumprogrammas

AI tērzēšanas roboti un palīgi

Pievienojiet balss izvadi čatbotam vai AI asistentam. Cauruļveida LLM atbildes caur TTS balss saskarnēm. Kokoro nodrošina sub-sekundāro latenci reālā laika sarunām. Sesame CSM ģenerē saruna runu ar dabisku laiku.

LLM reakcija uz runas cauruļvadu
Sub-sekunde latentums ar Kokoro
Sarunu runa ar Sezama CSM
Straumēšana audio izvade

Mobilās un balss lietotnes

Izveidojiet balss aplikācijas, pieejamības rīkus, lasīšanas aplikācijas un valodu mācību platformas. Mūsu REST API strādā ar jebkuru mobilo sistēmu. Lejupielādējiet audio failus vai straumi tieši klientam.

Reaktīvais native, Flutter, Swift, Kotlin
Pieejamības un lasīšanas lietojumprogrammas
Valodas apguves platformas
Audio satura ģenerēšana

SaaS produkti

White-label balss iespējas jūsu SaaS produktu. Pievienot TTS, STT, balss klonēšana un audio apstrāde kā funkcijas jūsu platformā. Izmantojiet mūsu API kā savu balss aizmuguri bez GPU infrastruktūras vadības.

Balss funkcijas ar baltu marķējumu
Nevajadzīga GPU infrastruktūra
Maksājuma uz vienu lietotāju cenas noteikšana
20+ modeļi, lai piedāvātu lietotājiem

Automatizācijas cauruļvadi

Iekļaut balss ģenerēšanu CI/CD vados, satura automatizāciju un partiju apstrādes darbplūsmas. Izveidot tūkstošiem audio failu no izklājlapu datiem, automatizēt podcast ražošanu, vai veidot satura lokalizācijas cauruļvadus.

Partijas apstrāde, izmantojot API
Satura lokalizācijas cauruļvadi
CI/CD integrācija
Izklājlapa audio automatizācijai

Skatīt pilnu API dokumentāciju

API specifikācijas

Iebūvēti ražošanas lietojumiem

20+

TTS modeļi

100+

Balss

30+

Valodas

<1s

Platums (Kokoro)

Pierakstīties bez maksas — 15000 rakstzīmes

Bieži uzdoti jautājumi

Bieži uzdotie jautājumi par TTS.ai izstrādātāju API

Jā. Mūsu API seko OpenAI audio runas formātam. Ja izmantojat OpenAI Python vai JavaScript klienta bibliotēku, Jūs varat pārslēgties uz TTS.ai, mainot bāzes_url un api_key parametrus. Jūsu esošais kods darbojas bez izmaiņām.

Kokoro ģenerē audio ar mazāk nekā 1 sekundi tipiskiem teikumiem. CosyVoice 2 atbalsta straumēšanas izlaidi vēl zemākām uztveramām latenci. Tērzēšanas robotiem un balss palīgiem kopējais apaļās joslas laiks parasti ir 1-3 sekundes atkarībā no teksta garuma un modeļa izvēles.

Bezmaksas modeļi (Kokoro, Piper, VITS, MeloTTS) ir pilnīgi bez maksas. Standarta modeļi izmanto 2x rakstzīmes uz 1K teksta. Premium modeļi izmanto 4x rakstzīmes uz 1K teksta. Pieteikties bezmaksas ar 15,000 rakstzīmēm. Plāni sākas $9/mēnesī par 500,000 rakstzīmēm.

Jā. Ielādējiet references audio paraugu (5-30 sekundes) uz balss klonēšanas galapunktu, pēc tam izmantojiet klonēto balss ID turpmākajos TTS pieprasījumos. Modeļi, kas atbalsta klonēšanu, ietver CosyVoice 2, Chatterbox, Fish Speech, un GPT-SoVITS.

Bezmaksas līmenis ir pamata likmes ierobežošana (3 pieprasījumi stundā bez konta). Maksātie plāni ir dāsni likmes ierobežojumi, kas piemēroti ražošanas lietojumiem. Sazinieties ar mums par uzņēmuma līmeņa caurlaides prasībām.

WAV (nepiespiests, augstākās kvalitātes), MP3 (piespiests, mazāki faili), OGG (atvērts formāts) un FLAC (bezzudumu kompresija). Noklusētais ir WAV pie modeļa dzimtā parauga ātrums.

Jā. Apvienojiet mūsu TTS API ar runas uz tekstu modeli un LLM, lai izveidotu pilnīgu balss asistenta cauruli. Kokoro nodrošina sub-sekundi latentumu ideāli reāllaika sarunām. CosyVoice 2 atbalsta straumēšanas izvadi vēl zemāk uztvertiem atbildes laikiem.

CosyVoice 2 un Kokoro atbalsta straumēšanas audio izvadi, kur tiek piegādāti audio gabali, jo tie tiek radīti. Tas samazina laiku līdz pirmajam baitam reālā laika lietojumprogrammām, piemēram, balss palīgiem un interaktīvo pieredzi.

API atgriež standarta HTTP statusa kodus. Īstenot eksponenciālu atkļūdošanu 5xx kļūdām un ātruma limita atbildēm. Misijai kritiskām programmām pievienojiet rindu ar atkārtotu loģiku. Mūsu API ir augsts uptime, bet noturīga kļūdu apstrāde vienmēr ir ieteicama.

Jā. /v1/balsojumi un /v1/modeļi galamērķi atgriež JSON visu pieejamo balsu un modeļu sarakstus ar saviem metadatiem (valodu atbalsts, kvalitātes novērtējums, ātruma novērtējums un cenu līmenis). Izmantojiet tos, lai veidotu dinamiskos modeļus jūsu lietotnē.

Bezmaksas modeļi (Kokoro, Piper, VITS, MeloTTS) kalpo kā efektīva smilšu kaste, jo tie maksā nulles kredītus. Pārbaudiet savu integrāciju ar bezmaksas modeļiem, tad pārslēdzieties uz augstākās klases ražošanas modeļiem, mainot modeļa parametru. Nav nepieciešama atsevišķa testēšanas vide.

Lielākā daļa no mūsu modeļiem ir atvērti un var tikt patstāvīgi. Tomēr pašapkalpošanās prasa ievērojamus GPU resursus (mēs izmantojam 4x NVIDIA Tesla P40 ar 96GB VRAM kopā). API nodrošina rentablu alternatīvu bez infrastruktūras pārvaldības.

5.0/5 (1)

Gatavs celt ar balss AI?

Iegūstiet bezmaksas API atslēgu un uzsākiet būvniecību. 15 kredīti pieteikšanās, bezmaksas modeļi pieejami, visaptveroša dokumentācija.

Pierakstīties brīvībā Skatīt cenu

Teksts uz runas API izstrādātājiem

Pamēģini tagad

Mīlestība TTS.ai? Stāsti saviem draugiem!

API īpašības izstrādātājiem

Vienkārša REST API

Ar OpenAI savietojamu

Pieejami 24+ modeļi

Sub-otrā latentums

Balss klonēšana API

Vairāki formāti

Labākie modeļi izstrādātāju integrācijai

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Kā integrēt TTS API

Iegūstiet API atslēgu

Pirmo reizi zvaniet

Izvēlieties savu modeli

Kuģis līdz ražošanai

Ātrās palaišanas koda piemēri

Ko izstrādātāji veido ar TTS.ai

AI tērzēšanas roboti un palīgi

Mobilās un balss lietotnes

SaaS produkti

Automatizācijas cauruļvadi

API specifikācijas

Bieži uzdoti jautājumi

Vai API ir saderīgs ar OpenAI TTS formātu?

Kāda ir reāllaika lietojumprogrammu latentums?

Kā cenu noteikšana darbojas API lietošanai?

Vai es varu izmantot balss klonēšanu caur API?

Vai pastāv likmes ierobežojums?

Kādus audio formātus API atgriež?

Vai es varu izmantot API, lai izveidotu balss asistentu vai tērzbotu?

Vai ir WebSocket vai straumēšanas API?

Kā risināt kļūdas un kļūdas ražošanā?

Vai es varu uzskaitīt pieejamās balsis un modeļus programmēti?

Vai ir smilšu kaste vai testēšanas vide?

Vai es varu patstāvīgi izmantot modeļus nevis izmantojot API?

Gatavs celt ar balss AI?