Nahlásiť chybu / požiadavku na funkciu

Rozhranie API na prevod textu na reč pre vývojárov

Vytvárajte aplikácie s podporou hlasu pomocou nášho rozhrania REST API. Pridajte do svojich aplikácií, chatbotov, hlasových asistentov a produktov SaaS prirodzený prevod textu na reč, klonovanie hlasu, prevod reči na text a spracovanie zvuku.

REST API Chatboty Aplikácie s hlasom Produkty typu SaaS Automatizácia

Úplný TTS Editor Dokumentácia API

Vyskúšajte si to teraz

Text
Súbory

0/500

Zadarmo s Kokoro, Piper, VITS, MeloTTS

Vygenerovaný zvuk sa zobrazí tu

Otvoriť plný TTS editor

Funkcie API pre vývojárov

Všetko, čo potrebujete na vytváranie hlasových aplikácií

Jednoduché REST API

Jedna požiadavka POST na generovanie reči, požiadavka JSON, zvuková odpoveď. Funguje s akýmkoľvek programovacím jazykom, ktorý podporuje HTTP.

Kompatibilné s OpenAI

Drop-in náhrada pre OpenAI TTS API.Prepnite svoj base_url a API kľúč - existujúci kód funguje okamžite.

24+ modelov k dispozícii.

Získajte prístup ku každému modelu prostredníctvom jediného rozhrania API. Prepínajte modely zmenou jedného parametra a porovnajte kvalitu, rýchlosť a cenu.

Sub- sekundová latencia

Kokoro generuje zvuk za menej ako 1 sekundu, čo je ideálne pre chatboty, hlasových asistentov a interaktívne aplikácie.

Rozhranie Voice Cloning API

Klonujte ľubovoľný hlas z krátkej zvukovej vzorky cez API a použite klonované hlasy pre všetky nasledujúce generácie.

Viacnásobné formáty

Výstup ako WAV, MP3, OGG alebo FLAC. Vyberte vzorkovaciu frekvenciu a bitové hĺbky.Podpora streamingu zvuku pre aplikácie v reálnom čase.

Najlepšie modely pre vývojársku integráciu

Vyberte si ten správny model pre rýchlosť, kvalitu a náklady vašej aplikácie

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Najlepšie pre: Najrýchlejší model – latencia menšia ako sekunda, ideálny pre aplikácie a chatboty v reálnom čase

Skúste to. Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Klonovanie hlasu

Najlepšie pre: Streamovanie TTS s klonovaním hlasu pre aplikácie hlasového asistenta

Skúste to. CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Najlepšie pre: Konverzačná umelá inteligencia s prirodzeným načasovaním pre chatbot a hlas asistenta

Skúste to. Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Najlepšie pre: Bezplatný model len s procesorom pre veľkoobjemové aplikácie s nulovými nákladmi na kredit

Skúste to. Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Najlepšie pre: Generovanie zvuku so zvukovými efektmi pre kreatívne a zábavné aplikácie

Skúste to. Bark

Ako integrovať TTS API

Od registrácie po prvé API volanie za menej ako 5 minút

Získajte svoj API kľúč

Zaregistrujte sa zdarma a vygenerujte si API kľúč z riadiaceho panela svojho účtu. 15 000 znakov zahrnutých.

Uskutočnite svoj prvý hovor

POST do /v1/tts s textom, modelom a hlasom. Získajte späť zvukové bajty. Pod 5 riadkami kódu.

Vyberte si svoj model

Otestujte rôzne modely pre svoj prípad použitia a porovnajte rýchlosť, kvalitu a náklady na generáciu.

Odoslať do výroby

Škálujte pomocou znakov s priebežnými platbami. Žiadne obmedzenia sadzieb v platených plánoch.Monitorujte používanie na paneli.

Príklady kódu pre rýchly štart

Integrujte TTS.ai v ľubovoľnom jazyku s naším REST API

Python Populárne

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Univerzálny

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

Formát kompatibilný s OpenAI Drop-in

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Získajte svoj bezplatný API kľúč

Čo vývojári stavajú s TTS.ai

Bežné integračné vzory a aplikácie

AI Chatbots & Asistenti

Pridajte hlasový výstup do svojho chatbota alebo asistenta AI. Odpovede LLM prenášajte cez TTS pre rozhrania s podporou hlasu. Kokoro poskytuje latenciu v reálnom čase v reálnom čase. Sesame CSM generuje konverzačnú reč s prirodzeným načasovaním.

Odpoveď LLM na potrubie reči
Sub-sekundová latencia s Kokoro
Konverzačná reč so Sesame CSM
Streamovanie zvukového výstupu

Mobilné a hlasové aplikácie

Vytvárajte mobilné aplikácie s podporou hlasu, nástroje na zjednodušenie prístupu, aplikácie na čítanie a platformy na výučbu jazykov. Naše rozhranie REST API funguje s ľubovoľným mobilným rámcom, sťahujte zvukové súbory alebo streamujte priamo do klienta.

React Native, Flutter, Swift a Kotlin
Aplikácie na prístupnosť a čítanie
Jazykové vzdelávacie platformy
Generovanie audio obsahu

Produkty SaaS (1)

Pridajte do svojej platformy funkcie ako TTS, STT, klonovanie hlasu a spracovanie zvuku. Použite naše rozhranie API ako hlasový backend bez toho, aby ste museli spravovať infraštruktúru GPU.

White-label hlasové funkcie
Nie je potrebná infraštruktúra GPU
Ceny podľa počtu použitia
20+ modelov, ktoré môžete ponúknuť svojim používateľom

Potrubia pre automatizáciu

Integrujte generovanie hlasu do kanálov CI/CD, automatizácie obsahu a pracovných postupov dávkového spracovania.Generujte tisíce zvukových súborov z údajov tabuľkových hárkov, automatizujte produkciu podcastov alebo vytvárajte kanály na lokalizáciu obsahu.

Dávkové spracovanie cez API
Lokalizačné kanály obsahu
Integrácia CI/CD
Tabuľka na audio automatizáciu

Zobraziť celú dokumentáciu API

Špecifikácie API

Vytvorené pre výrobné aplikácie

20+

Modely TTS

100+

Hlasy

30+

Jazyky

<1s

Latency (Kokoro)

Zaregistrujte sa zadarmo — 15,000 Characters

Často kladené otázky

Časté otázky o rozhraní API pre vývojárov TTS.ai

Áno, naše rozhranie API používa formát zvukovej reči OpenAI. Ak používate klientsku knižnicu OpenAI Python alebo JavaScript, môžete prepnúť na TTS.ai zmenou parametrov base_url a api_key. Váš existujúci kód funguje bez úprav.

Kokoro generuje zvuk za menej ako 1 sekundu pre typické vety. CosyVoice 2 podporuje streamingový výstup pre ešte nižšiu latenciu.Pre chatboty a hlasových asistentov, celkový čas cesty tam a späť je typicky 1-3 sekundy v závislosti od dĺžky textu a výberu modelu.

Bezplatné modelky (Kokoro, Piper, VITS, MeloTTS) stoja nulu kreditov. Štandardné modelky stoja 2 kredity za 1000 znakov. Prémiové modelky stoja 4 kredity za 1000 znakov. Zaregistrujte sa zdarma s 15 kreditmi. Plány začínajú na $9/mesiac za 500 kreditov.

Nahrajte referenčnú zvukovú vzorku (5 – 30 sekúnd) do koncového bodu klonovania hlasu a potom použite klonovanú identifikáciu hlasu v nasledujúcich požiadavkách na prevod textu na reč. Medzi modely, ktoré podporujú klonovanie, patria modely CosyVoice 2, Chatterbox, Fish Speech a GPT-SoVITS.

Bezplatná úroveň má základné obmedzenie rýchlosti (3 požiadavky za hodinu bez účtu). Platené plány majú veľkorysé obmedzenia rýchlosti vhodné pre produkčné aplikácie.Kontaktujte nás pre požiadavky na priepustnosť na podnikovej úrovni.

WAV (nekomprimovaný, najvyššia kvalita), MP3 (komprimovaný, menšie súbory), OGG (otvorený formát) a FLAC (bezstratová kompresia). Zadajte formát vo vašej žiadosti. Predvolené je WAV s natívnou vzorkovacou frekvenciou modelu.

Kombinujte naše rozhranie TTS API s modelom prevodu reči na text a LLM a vytvorte kompletný kanál hlasového asistenta. Kokoro poskytuje latenciu nižšiu ako sekunda, ktorá je ideálna pre konverzáciu v reálnom čase.

CosyVoice 2 a Kokoro podporujú streamovanie zvukového výstupu, kde sa zvukové fragmenty dodávajú priamo pri generovaní, čím sa skracuje čas do prvého bajtu pre aplikácie v reálnom čase, ako sú hlasoví asistenti a interaktívne zážitky.

API vracia štandardné stavové kódy HTTP. Implementujte exponenciálne spätné riešenie pre chyby 5xx a odpovede s obmedzením rýchlosti. Pre kritické aplikácie pridajte front s logikou opakovaných pokusov. Naše API má vysokú dobu prevádzky, ale vždy sa odporúča odolné spracovanie chýb.

Áno. Koncové body /v1/voices a /v1/models vracajú zoznamy JSON všetkých dostupných hlasov a modelov s ich metadátami (jazyková podpora, hodnotenie kvality, hodnotenie rýchlosti a cenová úroveň).Využívajte ich na vytváranie dynamických selektorov modelov vo vašej aplikácii.Use them to build dynamic model selectors in your application.

Bezplatné modely (Kokoro, Piper, VITS, MeloTTS) slúžia ako efektívne testovacie prostredie, pretože nestoja žiadne kredity.Otestujte svoju integráciu s bezplatnými modelmi a potom prejdite na prémiové modely v produkcii zmenou parametra modelu. Nie je potrebné žiadne samostatné testovacie prostredie.

Väčšina našich modelov je open source a je možné ich hosťovať, ale tento spôsob vyžaduje značné zdroje GPU (používame 4x NVIDIA Tesla P40 s celkovou pamäťou VRAM 96 GB). API poskytuje cenovo výhodnú alternatívu bez správy infraštruktúry.

5.0/5 (1)

Ste pripravení začať s hlasovou umelou inteligenciou?

Získajte bezplatný API kľúč a začnite budovať.15 kreditov pri registrácii, dostupné bezplatné modely, komplexná dokumentácia.

Zaregistrujte sa zdarma Zobraziť cenové ponuky

Rozhranie API na prevod textu na reč pre vývojárov

Vyskúšajte si to teraz

Láska TTS.ai? Povedzte svojim priateľom!

Funkcie API pre vývojárov

Jednoduché REST API

Kompatibilné s OpenAI

24+ modelov k dispozícii.

Sub- sekundová latencia

Rozhranie Voice Cloning API

Viacnásobné formáty

Najlepšie modely pre vývojársku integráciu

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Ako integrovať TTS API

Získajte svoj API kľúč

Uskutočnite svoj prvý hovor

Vyberte si svoj model

Odoslať do výroby

Príklady kódu pre rýchly štart

Čo vývojári stavajú s TTS.ai

AI Chatbots & Asistenti

Mobilné a hlasové aplikácie

Produkty SaaS (1)

Potrubia pre automatizáciu

Špecifikácie API

Často kladené otázky

Je API kompatibilné s formátom OpenAI TTS?

Aká je latencia pre aplikácie v reálnom čase?

Ako funguje tvorba cien za používanie rozhrania API?

Môžem použiť klonovanie hlasu cez API?

Existuje obmedzenie rýchlosti?

Aké zvukové formáty rozhranie API vracia?

Môžem použiť rozhranie API na vytvorenie hlasového asistenta alebo chatbota?

Existuje WebSocket alebo streamovacie API?

Ako sa vysporiadam s chybami a opakovanými pokusmi vo výrobe?

Môžem zobraziť zoznam dostupných hlasov a modelov programovo?

Existuje sandbox alebo testovacie prostredie?

Môžem modely hosťovať sám namiesto toho, aby som používal rozhranie API?

Ste pripravení začať s hlasovou umelou inteligenciou?