Rozhranie API na prevod textu na reč pre vývojárov

Vytvárajte aplikácie s podporou hlasu pomocou nášho rozhrania REST API. Pridajte do svojich aplikácií, chatbotov, hlasových asistentov a produktov SaaS prirodzený prevod textu na reč, klonovanie hlasu, prevod reči na text a spracovanie zvuku.

REST API Chatboty Aplikácie s hlasom Produkty typu SaaS Automatizácia

Vyskúšajte si to teraz

Zadarmo s Kokoro, Piper, VITS, MeloTTS
Vygenerovaný zvuk sa zobrazí tu
Generované
Stiahnuť
Láska TTS.ai? Povedzte svojim priateľom!

Funkcie API pre vývojárov

Všetko, čo potrebujete na vytváranie hlasových aplikácií

Jednoduché REST API

Jedna požiadavka POST na generovanie reči, požiadavka JSON, zvuková odpoveď. Funguje s akýmkoľvek programovacím jazykom, ktorý podporuje HTTP.

Kompatibilné s OpenAI

Drop-in náhrada pre OpenAI TTS API.Prepnite svoj base_url a API kľúč - existujúci kód funguje okamžite.

24+ modelov k dispozícii.

Získajte prístup ku každému modelu prostredníctvom jediného rozhrania API. Prepínajte modely zmenou jedného parametra a porovnajte kvalitu, rýchlosť a cenu.

Sub- sekundová latencia

Kokoro generuje zvuk za menej ako 1 sekundu, čo je ideálne pre chatboty, hlasových asistentov a interaktívne aplikácie.

Rozhranie Voice Cloning API

Klonujte ľubovoľný hlas z krátkej zvukovej vzorky cez API a použite klonované hlasy pre všetky nasledujúce generácie.

Viacnásobné formáty

Výstup ako WAV, MP3, OGG alebo FLAC. Vyberte vzorkovaciu frekvenciu a bitové hĺbky.Podpora streamingu zvuku pre aplikácie v reálnom čase.

Najlepšie modely pre vývojársku integráciu

Vyberte si ten správny model pre rýchlosť, kvalitu a náklady vašej aplikácie

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najlepšie pre: Najrýchlejší model – latencia menšia ako sekunda, ideálny pre aplikácie a chatboty v reálnom čase

Skúste to. Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Klonovanie hlasu

Najlepšie pre: Streamovanie TTS s klonovaním hlasu pre aplikácie hlasového asistenta

Skúste to. CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Najlepšie pre: Konverzačná umelá inteligencia s prirodzeným načasovaním pre chatbot a hlas asistenta

Skúste to. Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najlepšie pre: Bezplatný model len s procesorom pre veľkoobjemové aplikácie s nulovými nákladmi na kredit

Skúste to. Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najlepšie pre: Generovanie zvuku so zvukovými efektmi pre kreatívne a zábavné aplikácie

Skúste to. Bark

Ako integrovať TTS API

Od registrácie po prvé API volanie za menej ako 5 minút

1

Získajte svoj API kľúč

Zaregistrujte sa zdarma a vygenerujte si API kľúč z riadiaceho panela svojho účtu. 15 000 znakov zahrnutých.

2

Uskutočnite svoj prvý hovor

POST do /v1/tts s textom, modelom a hlasom. Získajte späť zvukové bajty. Pod 5 riadkami kódu.

3

Vyberte si svoj model

Otestujte rôzne modely pre svoj prípad použitia a porovnajte rýchlosť, kvalitu a náklady na generáciu.

4

Odoslať do výroby

Škálujte pomocou znakov s priebežnými platbami. Žiadne obmedzenia sadzieb v platených plánoch.Monitorujte používanie na paneli.

Príklady kódu pre rýchly štart

Integrujte TTS.ai v ľubovoľnom jazyku s naším REST API

Python Populárne
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Univerzálny
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Formát kompatibilný s OpenAI Drop-in
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Čo vývojári stavajú s TTS.ai

Bežné integračné vzory a aplikácie

AI Chatbots & Asistenti

Pridajte hlasový výstup do svojho chatbota alebo asistenta AI. Odpovede LLM prenášajte cez TTS pre rozhrania s podporou hlasu. Kokoro poskytuje latenciu v reálnom čase v reálnom čase. Sesame CSM generuje konverzačnú reč s prirodzeným načasovaním.

  • Odpoveď LLM na potrubie reči
  • Sub-sekundová latencia s Kokoro
  • Konverzačná reč so Sesame CSM
  • Streamovanie zvukového výstupu

Mobilné a hlasové aplikácie

Vytvárajte mobilné aplikácie s podporou hlasu, nástroje na zjednodušenie prístupu, aplikácie na čítanie a platformy na výučbu jazykov. Naše rozhranie REST API funguje s ľubovoľným mobilným rámcom, sťahujte zvukové súbory alebo streamujte priamo do klienta.

  • React Native, Flutter, Swift a Kotlin
  • Aplikácie na prístupnosť a čítanie
  • Jazykové vzdelávacie platformy
  • Generovanie audio obsahu

Produkty SaaS (1)

Pridajte do svojej platformy funkcie ako TTS, STT, klonovanie hlasu a spracovanie zvuku. Použite naše rozhranie API ako hlasový backend bez toho, aby ste museli spravovať infraštruktúru GPU.

  • White-label hlasové funkcie
  • Nie je potrebná infraštruktúra GPU
  • Ceny podľa počtu použitia
  • 20+ modelov, ktoré môžete ponúknuť svojim používateľom

Potrubia pre automatizáciu

Integrujte generovanie hlasu do kanálov CI/CD, automatizácie obsahu a pracovných postupov dávkového spracovania.Generujte tisíce zvukových súborov z údajov tabuľkových hárkov, automatizujte produkciu podcastov alebo vytvárajte kanály na lokalizáciu obsahu.

  • Dávkové spracovanie cez API
  • Lokalizačné kanály obsahu
  • Integrácia CI/CD
  • Tabuľka na audio automatizáciu

Špecifikácie API

Vytvorené pre výrobné aplikácie

20+

Modely TTS

100+

Hlasy

30+

Jazyky

<1s

Latency (Kokoro)

Často kladené otázky

Časté otázky o rozhraní API pre vývojárov TTS.ai

Áno, naše rozhranie API používa formát zvukovej reči OpenAI. Ak používate klientsku knižnicu OpenAI Python alebo JavaScript, môžete prepnúť na TTS.ai zmenou parametrov base_url a api_key. Váš existujúci kód funguje bez úprav.

Kokoro generuje zvuk za menej ako 1 sekundu pre typické vety. CosyVoice 2 podporuje streamingový výstup pre ešte nižšiu latenciu.Pre chatboty a hlasových asistentov, celkový čas cesty tam a späť je typicky 1-3 sekundy v závislosti od dĺžky textu a výberu modelu.

Bezplatné modelky (Kokoro, Piper, VITS, MeloTTS) stoja nulu kreditov. Štandardné modelky stoja 2 kredity za 1000 znakov. Prémiové modelky stoja 4 kredity za 1000 znakov. Zaregistrujte sa zdarma s 15 kreditmi. Plány začínajú na $9/mesiac za 500 kreditov.

Nahrajte referenčnú zvukovú vzorku (5 – 30 sekúnd) do koncového bodu klonovania hlasu a potom použite klonovanú identifikáciu hlasu v nasledujúcich požiadavkách na prevod textu na reč. Medzi modely, ktoré podporujú klonovanie, patria modely CosyVoice 2, Chatterbox, Fish Speech a GPT-SoVITS.

Bezplatná úroveň má základné obmedzenie rýchlosti (3 požiadavky za hodinu bez účtu). Platené plány majú veľkorysé obmedzenia rýchlosti vhodné pre produkčné aplikácie.Kontaktujte nás pre požiadavky na priepustnosť na podnikovej úrovni.

WAV (nekomprimovaný, najvyššia kvalita), MP3 (komprimovaný, menšie súbory), OGG (otvorený formát) a FLAC (bezstratová kompresia). Zadajte formát vo vašej žiadosti. Predvolené je WAV s natívnou vzorkovacou frekvenciou modelu.

Kombinujte naše rozhranie TTS API s modelom prevodu reči na text a LLM a vytvorte kompletný kanál hlasového asistenta. Kokoro poskytuje latenciu nižšiu ako sekunda, ktorá je ideálna pre konverzáciu v reálnom čase.

CosyVoice 2 a Kokoro podporujú streamovanie zvukového výstupu, kde sa zvukové fragmenty dodávajú priamo pri generovaní, čím sa skracuje čas do prvého bajtu pre aplikácie v reálnom čase, ako sú hlasoví asistenti a interaktívne zážitky.

API vracia štandardné stavové kódy HTTP. Implementujte exponenciálne spätné riešenie pre chyby 5xx a odpovede s obmedzením rýchlosti. Pre kritické aplikácie pridajte front s logikou opakovaných pokusov. Naše API má vysokú dobu prevádzky, ale vždy sa odporúča odolné spracovanie chýb.

Áno. Koncové body /v1/voices a /v1/models vracajú zoznamy JSON všetkých dostupných hlasov a modelov s ich metadátami (jazyková podpora, hodnotenie kvality, hodnotenie rýchlosti a cenová úroveň).Využívajte ich na vytváranie dynamických selektorov modelov vo vašej aplikácii.Use them to build dynamic model selectors in your application.

Bezplatné modely (Kokoro, Piper, VITS, MeloTTS) slúžia ako efektívne testovacie prostredie, pretože nestoja žiadne kredity.Otestujte svoju integráciu s bezplatnými modelmi a potom prejdite na prémiové modely v produkcii zmenou parametra modelu. Nie je potrebné žiadne samostatné testovacie prostredie.

Väčšina našich modelov je open source a je možné ich hosťovať, ale tento spôsob vyžaduje značné zdroje GPU (používame 4x NVIDIA Tesla P40 s celkovou pamäťou VRAM 96 GB). API poskytuje cenovo výhodnú alternatívu bez správy infraštruktúry.
5.0/5 (1)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Ste pripravení začať s hlasovou umelou inteligenciou?

Získajte bezplatný API kľúč a začnite budovať.15 kreditov pri registrácii, dostupné bezplatné modely, komplexná dokumentácia.