Zahtjev za greškom / osobinama

Tekst za govor API za programere

Izgradite aplikacije omogućene glasom s našim REST API. Dodajte prirodni tekst-to-speech, kloniranje glasa, govor-to-text, i obradu zvuka u vaše aplikacije, chatboti, glasovni pomoćnici, i SaaS proizvodi. OpenAI-kompatibilan format, 20+ modeli, jednostavna integracija.

REST API Chatbots Glasovne aplikacije SaaS proizvodi Automatizacija

Potpuni TTS uređivač API Docs

Pokušaj sada

0/500

Besplatno s Kokoro, Piper, VITS, Melotts

Vaš generirani zvuk će se pojaviti ovdje

Otvori potpuni TTS uređivač

API osobine za razvijače

Sve što vam je potrebno da izgradite aplikacije omogućene glasom

Jednostavan REST API

Jedan POST zahtjev za generiranje govora. JSON zahtjev, audio odgovor. Radi sa svim programskim jezikom koji podržava HTTP.

OpenAI-kompatibilno

Drop-in zamjena za OpenAI TTS API. Zamijenite bazu_url i API ključ — postojeći kod radi odmah.

24+ Modeli dostupni

Pristupite svakom modelu kroz jedan API. Prebacite modele promjenom jednog parametara. Usporedite kvalitetu, brzinu i troškove.

Poddruga latencija

Kokoro proizvodi zvuk u manje od 1 sekundu. Savršeno za real-time chatbote, glasovne pomoćnike i interaktivne aplikacije.

API za kloniranje glasa

Kloniraj bilo koji glas iz kratkog zvučnog uzorka preko API. Koristite klonirane glasove za sve naredne generacije.

Višestruki formati

Izlaz kao WAV, MP3, OGG ili FLAC. Odaberite uzorak brzine i dubinu bita. Streaming audio podrška za aplikacije u realnom vremenu.

Najbolji modeli za integraciju razvijača

Odaberite pravi model za brzinu, kvalitetu i troškovne zahtjeve vaše aplikacije

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Brzo 5/5

Najbolje za: Najbrži model – podsekundni latency, idealan za aplikacije u realnom vremenu i chatbots

Pokušaj Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Srednje 5/5 Kloniranje glasa

Najbolje za: Streaming TTS s kloniranjem glasa za prijave pomoćnika glasa

Pokušaj CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Sporo 5/5

Najbolje za: Konverzacijski AL s prirodnim vremenom za chatbot i pomoćnik glasa

Pokušaj Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Brzo 3/5

Najbolje za: Besplatan, CPU-samo model za aplikacije visoke količine s nula kreditne troškove

Pokušaj Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Sporo 4/5

Najbolje za: Generacija zvuka sa zvučnim efektima za kreativne i zabavne aplikacije

Pokušaj Bark

Kako integrirati TTS API

Od prijave do prvog API poziva za manje od 5 minuta

Uzmi svoj API ključ

Prijavite se besplatno i generirati API ključ iz vašeg računa panela. 15.000 znakova uključeno.

Nazovite prvi put

POST do /v1/tts s tekstom, modelom i glasom. Dobiti audio bajtova natrag. Ispod 5 linija koda.

Odaberite svoj model

Isprobajte različite modele za vašu upotrebu. Usporedite brzinu, kvalitetu i troškove po generaciji.

Brod za proizvodnju

Skaliraj s znakovima pay-as-yo-go. Nema ograničenja stopa na plaćene planove. Nadzor korištenja u panelu ploče.

Primjeri brzog početka koda

Iнтегрirati TTS.ai u bilo koji jezik s našim REST API

Python Popularno

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Sveučilišni

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- Compatible Format Ubaci-u

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Uzmite svoj besplatni API ključ

Što razvijatelji grade sa TTS.ai

Zajednički uzorci integracije i aplikacije

AL Chatbots & pomoćnici

Dodajte glasovni izlaz vašem chatbotu ili asistentu AI. Pipe LLM odgovore kroz TTS za glasovne sučelja. Kokoro isporučuje podsekundu latenciju za razgovore u realnom vremenu. Sezam CSM generira razgovorni govor s prirodnim vremenom.

LLM odgovor na govorni cjevovod
Podsekundna latencija s Kokorom
Razgovorni govor sa Sezamom CSM-om
Streaming audio izlaz

Mobilne i glasovne aplikacije

Izgradite mobilne aplikacije omogućene glasom, alate za pristupačnost, aplikacije za čitanje i platforme za učenje jezika. Naš REST API radi s bilo kojim mobilnim okvirom. Preuzmite zvučne datoteke ili stream izravno na klijenta.

Reagiraj indijanski, treptaj, Swift, Kotlin
Pristupačnost i aplikacije za čitanje
platforme za učenje jezika
Generiranje sadržaja zvuka

SaaS proizvodi

Bijela oznaka glasovne sposobnosti u vašem SaaS proizvodu. Dodajte TTS, STT, glasovno kloniranje, i audio obrada kao značajke u vašoj platformi. Koristite naš API kao vaš glasovni podrška bez upravljanja GPU infrastrukturom.

Osobine bijele oznake glasa
Nema potrebe za infrastrukturom GPU-a
Cijene za plaćanje po upotrebi
20+ modela ponuditi svojim korisnicima

Automatska cijevi

Iнтегрirati stvaranje glasa u CI/CD gasovoda, automatizaciju sadržaja i obradu serije radnih tokova. Generirati tisuće audio datoteka iz tablice podataka, automatski podcast proizvodnju, ili graditi sadržaj lokalizacijski gasovoda.

Paketska obrada putem API-ja
Cjevovodi za lokalizaciju sadržaja
Integracija CI/CD-a
Tabela za automatizaciju zvuka

Pogledaj kompletnu API dokumentaciju

API specifikacije

Izgrađena za proizvodnju aplikacija

20+

TTS modeli

100+

Glasovi

30+

Jezici

<1s

Latency (Kokoro)

Upišite se slobodno — 15.000 znakova

Česta pitanja

Zajednička pitanja o TTS.ai programer API

Da. Naš API prati OpenAI zvučni govor format. Ako koristite OpenAI Python ili JavaScript klijentsku biblioteku, možete se prebaciti na TTS.ai promjenom base_url i api_key parametra. Vaš postojeći kod radi bez promjene.

Kokoro generira zvuk u manje od 1 sekundu za tipične rečenice. CosyVoice 2 podržava streaming izlaz za još niže primjećene latencije. Za chatbote i glasovne pomoćnike, ukupno vrijeme krug-trip je obično 1-3 sekunde ovisno o dužini teksta i izboru modela.

Besplatni modeli (Kokoro, Piper, VITS, Melotts) su potpuno besplatni. Standardni modeli koriste 2x znakova po 1K teksta. Premium modeli koriste 4x znakova po 1K teksta. Prijavite se besplatno sa 15.000 znakova. Planovi počinju od 9 dolara/mjesečno za 500.000 znakova.

Da. Ubacite referentni audio uzorak (5-30 sekundi) na ishod kloniranja glasa, zatim koristiti klonirani ID glasa u narednim TTS zahtjeva. Modeli koji podrška kloniranje uključuju CosyVoice 2, Chatterbox, Fish Speech, i GPT-SoviTS.

Besplatni stupanj ima ograničavanje osnovne stope (3 zahtjeva na sat bez računa). Plaćeni planovi imaju velikodušne limite stope pogodne za proizvodnju. Kontaktirajte nas za zahtjeve na razini putovanja na razini poduzeća.

WAV (nekompresovana, najviša kvaliteta), MP3 (kompresovana, manja datoteka), OGG (otvoreni format) i FLAC (besmislena kompresija). Navedite format u vašem zahtjevu. Uobičajeno je WAV na početnoj stopi uzorka modela.

Da. Kombinirati naš TTS API s modelom govor-na-tekst i LLM izgraditi potpuni glasovni pomoćnik cjevovoda. Kokoro pruža podsekundu latencije idealan za razgovor u realnom vremenu. CosyVoice 2 podržava streaming izlaz za još niže primjećeno vrijeme odgovora.

CosyVoice 2 i Kokoro podrška streaming audio izlaz gdje se audio komadi dostavljaju kako su generirani. To smanjuje vrijeme-na-prvi-bajt za aplikacije u realnom vremenu poput glasovnih pomoćnika i interaktivnih iskustava.

API vraća standardne HTTP kodove statusa. Implementirati eksponencijalne backoff za 5xx pogreške i brzine ograničenja odgovora. Za misiju-kritične aplikacije, dodati red s ponovno logikom. Naš API ima visoku razdoblje, ali otporno rukovanje greškama je uvijek preporučeno.

Da. /v1/voices i /v1/models ishodi vraćaju JSON popise svih dostupnih glasova i modela s njihovim metapodacima (jezična podrška, kvalitetna ocjena, brzina i stopa cijene). Koristite ih za izgradnju dinamičkih modela selektora u vašoj aplikaciji.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) služe kao učinkovit pješčanik jer su koštali nula kredita. Testirajte svoju integraciju s besplatnim modelima, zatim prebacite na premium modele u proizvodnji mijenjanjem parametra modela. Nije potrebno zasebno testiranje okruženje.

Većina naših modela je otvorenog izvora i može biti samohosting. Međutim, samohosting zahtijeva značajne resurse GPU-a (koristimo 4x NVIDIA Tesla P40 s 96GB VRAM ukupno). API pruža troškovno učinkovitu alternativu bez upravljanja infrastrukturom.

5.0/5 (1)

Spremni za izgradnju sa glasovnom AI?

Uzmite besplatni API ključ i početi zgradu. 15.000 znakova na prijavu, besplatne modele dostupne, sveobuhvatna dokumentacija.

Slobodno se prijavite Pogledaj cijene

Tekst za govor API za programere

Pokušaj sada

Reci svojim prijateljima!

API osobine za razvijače

Jednostavan REST API

OpenAI-kompatibilno

24+ Modeli dostupni

Poddruga latencija

API za kloniranje glasa

Višestruki formati

Najbolji modeli za integraciju razvijača

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Kako integrirati TTS API

Uzmi svoj API ključ

Nazovite prvi put

Odaberite svoj model

Brod za proizvodnju

Primjeri brzog početka koda

Što razvijatelji grade sa TTS.ai

AL Chatbots & pomoćnici

Mobilne i glasovne aplikacije

SaaS proizvodi

Automatska cijevi

API specifikacije

Česta pitanja

Je li API kompatibilan s OpenAI TTS formatom?

Koja je latencija za prijave u realnom vremenu?

Kako cijene funkcioniraju za API korištenje?

Mogu li koristiti kloniranje glasa kroz API?

Postoji li ograničenje stope?

Koje audio formate vraća API?

Mogu li iskoristiti API za izradu glasovnog pomoćnika ili chatbota?

Postoji li webSocket ili streaming API?

Kako se nositi s pogreškama i retrikcijama u proizvodnji?

Mogu li navesti dostupne glasove i modele programski?

Postoji li pješčanik ili test okruženje?

Mogu li samostalno voditi modele umjesto da koristim API?

Spremni za izgradnju sa glasovnom AI?