Tekst za govor API za programere

Izgradite aplikacije omogućene glasom s našim REST API. Dodajte prirodni tekst-to-speech, kloniranje glasa, govor-to-text, i obradu zvuka u vaše aplikacije, chatboti, glasovni pomoćnici, i SaaS proizvodi. OpenAI-kompatibilan format, 20+ modeli, jednostavna integracija.

REST API Chatbots Glasovne aplikacije SaaS proizvodi Automatizacija

Pokušaj sada

Besplatno s Kokoro, Piper, VITS, Melotts
Vaš generirani zvuk će se pojaviti ovdje
Generirano
Preuzmi
Reci svojim prijateljima!

API osobine za razvijače

Sve što vam je potrebno da izgradite aplikacije omogućene glasom

Jednostavan REST API

Jedan POST zahtjev za generiranje govora. JSON zahtjev, audio odgovor. Radi sa svim programskim jezikom koji podržava HTTP.

OpenAI-kompatibilno

Drop-in zamjena za OpenAI TTS API. Zamijenite bazu_url i API ključ — postojeći kod radi odmah.

24+ Modeli dostupni

Pristupite svakom modelu kroz jedan API. Prebacite modele promjenom jednog parametara. Usporedite kvalitetu, brzinu i troškove.

Poddruga latencija

Kokoro proizvodi zvuk u manje od 1 sekundu. Savršeno za real-time chatbote, glasovne pomoćnike i interaktivne aplikacije.

API za kloniranje glasa

Kloniraj bilo koji glas iz kratkog zvučnog uzorka preko API. Koristite klonirane glasove za sve naredne generacije.

Višestruki formati

Izlaz kao WAV, MP3, OGG ili FLAC. Odaberite uzorak brzine i dubinu bita. Streaming audio podrška za aplikacije u realnom vremenu.

Najbolji modeli za integraciju razvijača

Odaberite pravi model za brzinu, kvalitetu i troškovne zahtjeve vaše aplikacije

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najbolje za: Najbrži model – podsekundni latency, idealan za aplikacije u realnom vremenu i chatbots

Pokušaj Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Kloniranje glasa

Najbolje za: Streaming TTS s kloniranjem glasa za prijave pomoćnika glasa

Pokušaj CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Najbolje za: Konverzacijski AL s prirodnim vremenom za chatbot i pomoćnik glasa

Pokušaj Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najbolje za: Besplatan, CPU-samo model za aplikacije visoke količine s nula kreditne troškove

Pokušaj Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najbolje za: Generacija zvuka sa zvučnim efektima za kreativne i zabavne aplikacije

Pokušaj Bark

Kako integrirati TTS API

Od prijave do prvog API poziva za manje od 5 minuta

1

Uzmi svoj API ključ

Prijavite se besplatno i generirati API ključ iz vašeg računa panela. 15.000 znakova uključeno.

2

Nazovite prvi put

POST do /v1/tts s tekstom, modelom i glasom. Dobiti audio bajtova natrag. Ispod 5 linija koda.

3

Odaberite svoj model

Isprobajte različite modele za vašu upotrebu. Usporedite brzinu, kvalitetu i troškove po generaciji.

4

Brod za proizvodnju

Skaliraj s znakovima pay-as-yo-go. Nema ograničenja stopa na plaćene planove. Nadzor korištenja u panelu ploče.

Primjeri brzog početka koda

Iнтегрirati TTS.ai u bilo koji jezik s našim REST API

Python Popularno
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Sveučilišni
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- Compatible Format Ubaci-u
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Što razvijatelji grade sa TTS.ai

Zajednički uzorci integracije i aplikacije

AL Chatbots & pomoćnici

Dodajte glasovni izlaz vašem chatbotu ili asistentu AI. Pipe LLM odgovore kroz TTS za glasovne sučelja. Kokoro isporučuje podsekundu latenciju za razgovore u realnom vremenu. Sezam CSM generira razgovorni govor s prirodnim vremenom.

  • LLM odgovor na govorni cjevovod
  • Podsekundna latencija s Kokorom
  • Razgovorni govor sa Sezamom CSM-om
  • Streaming audio izlaz

Mobilne i glasovne aplikacije

Izgradite mobilne aplikacije omogućene glasom, alate za pristupačnost, aplikacije za čitanje i platforme za učenje jezika. Naš REST API radi s bilo kojim mobilnim okvirom. Preuzmite zvučne datoteke ili stream izravno na klijenta.

  • Reagiraj indijanski, treptaj, Swift, Kotlin
  • Pristupačnost i aplikacije za čitanje
  • platforme za učenje jezika
  • Generiranje sadržaja zvuka

SaaS proizvodi

Bijela oznaka glasovne sposobnosti u vašem SaaS proizvodu. Dodajte TTS, STT, glasovno kloniranje, i audio obrada kao značajke u vašoj platformi. Koristite naš API kao vaš glasovni podrška bez upravljanja GPU infrastrukturom.

  • Osobine bijele oznake glasa
  • Nema potrebe za infrastrukturom GPU-a
  • Cijene za plaćanje po upotrebi
  • 20+ modela ponuditi svojim korisnicima

Automatska cijevi

Iнтегрirati stvaranje glasa u CI/CD gasovoda, automatizaciju sadržaja i obradu serije radnih tokova. Generirati tisuće audio datoteka iz tablice podataka, automatski podcast proizvodnju, ili graditi sadržaj lokalizacijski gasovoda.

  • Paketska obrada putem API-ja
  • Cjevovodi za lokalizaciju sadržaja
  • Integracija CI/CD-a
  • Tabela za automatizaciju zvuka

API specifikacije

Izgrađena za proizvodnju aplikacija

20+

TTS modeli

100+

Glasovi

30+

Jezici

<1s

Latency (Kokoro)

Česta pitanja

Zajednička pitanja o TTS.ai programer API

Da. Naš API prati OpenAI zvučni govor format. Ako koristite OpenAI Python ili JavaScript klijentsku biblioteku, možete se prebaciti na TTS.ai promjenom base_url i api_key parametra. Vaš postojeći kod radi bez promjene.

Kokoro generira zvuk u manje od 1 sekundu za tipične rečenice. CosyVoice 2 podržava streaming izlaz za još niže primjećene latencije. Za chatbote i glasovne pomoćnike, ukupno vrijeme krug-trip je obično 1-3 sekunde ovisno o dužini teksta i izboru modela.

Besplatni modeli (Kokoro, Piper, VITS, Melotts) su potpuno besplatni. Standardni modeli koriste 2x znakova po 1K teksta. Premium modeli koriste 4x znakova po 1K teksta. Prijavite se besplatno sa 15.000 znakova. Planovi počinju od 9 dolara/mjesečno za 500.000 znakova.

Da. Ubacite referentni audio uzorak (5-30 sekundi) na ishod kloniranja glasa, zatim koristiti klonirani ID glasa u narednim TTS zahtjeva. Modeli koji podrška kloniranje uključuju CosyVoice 2, Chatterbox, Fish Speech, i GPT-SoviTS.

Besplatni stupanj ima ograničavanje osnovne stope (3 zahtjeva na sat bez računa). Plaćeni planovi imaju velikodušne limite stope pogodne za proizvodnju. Kontaktirajte nas za zahtjeve na razini putovanja na razini poduzeća.

WAV (nekompresovana, najviša kvaliteta), MP3 (kompresovana, manja datoteka), OGG (otvoreni format) i FLAC (besmislena kompresija). Navedite format u vašem zahtjevu. Uobičajeno je WAV na početnoj stopi uzorka modela.

Da. Kombinirati naš TTS API s modelom govor-na-tekst i LLM izgraditi potpuni glasovni pomoćnik cjevovoda. Kokoro pruža podsekundu latencije idealan za razgovor u realnom vremenu. CosyVoice 2 podržava streaming izlaz za još niže primjećeno vrijeme odgovora.

CosyVoice 2 i Kokoro podrška streaming audio izlaz gdje se audio komadi dostavljaju kako su generirani. To smanjuje vrijeme-na-prvi-bajt za aplikacije u realnom vremenu poput glasovnih pomoćnika i interaktivnih iskustava.

API vraća standardne HTTP kodove statusa. Implementirati eksponencijalne backoff za 5xx pogreške i brzine ograničenja odgovora. Za misiju-kritične aplikacije, dodati red s ponovno logikom. Naš API ima visoku razdoblje, ali otporno rukovanje greškama je uvijek preporučeno.

Da. /v1/voices i /v1/models ishodi vraćaju JSON popise svih dostupnih glasova i modela s njihovim metapodacima (jezična podrška, kvalitetna ocjena, brzina i stopa cijene). Koristite ih za izgradnju dinamičkih modela selektora u vašoj aplikaciji.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) služe kao učinkovit pješčanik jer su koštali nula kredita. Testirajte svoju integraciju s besplatnim modelima, zatim prebacite na premium modele u proizvodnji mijenjanjem parametra modela. Nije potrebno zasebno testiranje okruženje.

Većina naših modela je otvorenog izvora i može biti samohosting. Međutim, samohosting zahtijeva značajne resurse GPU-a (koristimo 4x NVIDIA Tesla P40 s 96GB VRAM ukupno). API pruža troškovno učinkovitu alternativu bez upravljanja infrastrukturom.
5.0/5 (1)

Što možemo poboljšati? Vaša povratna informacija nam pomaže riješiti probleme.

Spremni za izgradnju sa glasovnom AI?

Uzmite besplatni API ključ i početi zgradu. 15.000 znakova na prijavu, besplatne modele dostupne, sveobuhvatna dokumentacija.