Raporti cimon / funkcipeton

Tekst-al-vorta API por programistojName

Konstruu voĉajn aplikaĵojn per nia REST API. Aldonu naturan tekst-al-parolon, voĉan klonadon, voĉon-al-tekston, kaj aŭdan prilaboradon al viaj aplikaĵoj, babilrobotoj, voĉaj asistantoj, kaj SaaS-produktoj. OpenAI-kongrua formato, pli ol 20 modeloj, simpla integriĝo.

REST API Babilrobotoj Voĉaj aplikaĵojName SaaS- produktoj Aŭtomate

Plena TTS-redaktilo API-dokumentoj

Provu nun

0/500

Libera kun Kokoro, Piper, VITS, MeloTTS

Via generita sono aperos tie ĉi

Malfermi plenan TTS-redaktilon

API- ebloj por programistoj

Ĉio, kion vi bezonas por konstrui voĉajn aplikaĵojnName

Simpla REST API

Unu POST-peto por generi parolon. JSON-peto, aŭda respondo. Laboras kun iu ajn programlingvo, kiu subtenas HTTP.

OpenAI- kongrua

Enŝovita anstataŭaĵo por OpenAI TTS API. Ŝanĝu vian base_url kaj API ŝlosilon - ekzistanta kodo funkcias tuj.

24+ disponeblaj modeloj

Aliri ĉiun modelon tra ununura API. Ŝanĝi modelojn per ŝanĝo de unu parametro. Komparu kvaliton, rapidecon kaj koston.

Subsekunda prokrasto

Kokoro generas sonon en malpli ol 1 sekundo. Perfekta por realtempaj babilrobotoj, voĉaj asistantoj, kaj interagaj aplikaĵoj.

API por voĉklonado

Kloni iun ajn voĉon el mallonga sona specimeno per la API. Uzi klonitajn voĉojn por ĉiuj postaj generacioj.

Pluraj formatoj

Eligo kiel WAV, MP3, OGG, aŭ FLAC. Elektu specimenadon kaj bitprofundecon. Subteno por fluanta sono por realtempaj aplikaĵoj.

Plej bonaj modeloj por integriĝo de programistoj

Elektu la ĝustan modelon por via aplikaĵo

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fiksa 5/5

Plej bona por: Plej rapida modelo — sub-sekunda latenteco, ideala por realtempaj aplikaĵoj kaj babilrobotoj

Provu Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Voĉa klonado

Plej bona por: Fluigo de TTS kun voĉ-klonado por voĉ-asistentaj aplikaĵoj

Provu CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Malrapide 5/5

Plej bona por: Konversacia AI kun natura tempomezuro por babilroboto kaj asistanta voĉo

Provu Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fiksa 3/5

Plej bona por: Libera, nur CPU-modelo por altvolumaj aplikaĵoj kun nulaj kreditkostoj

Provu Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Malrapide 4/5

Plej bona por: Songenerado kun sonaj efektoj por kreivaj kaj distraj aplikaĵoj

Provu Bark

Kiel integri la TTS API

De aliĝo al la unua API-voko en malpli ol 5 minutoj

Elŝuti vian API- ŝlosilon

Registriĝu senpage kaj kreu API-ŝlosilon el via kont-kontrolilo. 15,000 signoj inkluditaj.

Make Your First Call

POST al /v1/tts kun teksto, modelo, kaj voĉo. Ricevu sonajn bajtojn. Sub 5 linioj de kodo.

Elektu vian modelon

Testu diversajn modelojn por via uzokazo. Komparu rapidecon, kvaliton kaj koston por ĉiu generacio.

Sendi al Produktado

Skali per pagendaj kreditoj. Neniu tarifa limigo sur pagitaj planoj. Kontrolu uzadon en via stirtabulo.

Rapidstartaj kodoekzemploj

Integri TTS.ai en iu ajn lingvo kun nia REST API

Python Populara

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Universala

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- kongrua formato Drop- in

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ricevu vian senpagan API-ŝlosilon

Kion programistoj konstruas per TTS.ai

Komunaj integraj ŝablonoj kaj aplikaĵoj

AI- babilejoj kaj helpantojName

Aldonu voĉan eligon al via babilroboto aŭ AI-helpanto. Fluigu LLM-respondojn tra TTS por voĉaj interfacoj. Kokoro liveras sub-sekundan latencon por realtempaj konversacioj. Sesame CSM generas konversacian paroladon kun natura tempo.

LLM-respondo al parolkondukilo
Subsekunda prokrasto kun Kokoro
Konversacia parolado kun Sesame CSM
Fluanta aŭda eligo

Poŝtelefonaj kaj voĉaj aplikaĵojName

Konstruu voĉajn poŝtelefonajn aplikaĵojn, alireblecajn ilojn, legaparatojn kaj platformojn por lingvolernado. Nia REST API funkcias kun iu ajn poŝtelefona kadro. Elŝutu sonajn dosierojn aŭ fluigu rekte al la kliento.

React Native, Flutter, Swift, Kotlin
Alireblecaj kaj legadaj aplikaĵoj
Lingvolernaj platformoj
Generado de aŭda enhavo

SaaS- produktoj

Blank-etikedaj voĉaj kapabloj en via SaaS-produkto. Aldonu TTS, STT, voĉan klonadon, kaj aŭdan prilaboradon kiel funkciojn en via platformo. Uzu nian API kiel voĉan internon sen administri GPU-infrastrukturon.

Blank-etikedaj voĉaj ecoj
Ne necesas GPU-infrastrukturo
Pago laŭ uzado
20+ modeloj por proponi al viaj uzantoj

Aŭtomataj kanaloj

Integri voĉan generadon en CI/CD-kanalojn, enhavo-aŭtomatigon, kaj batprocesajn laborfluojn. Generi milojn da sondosieroj el kalkultabelaj datumoj, aŭtomatigi podkastan produktadon, aŭ konstrui enhavo-lokigajn kanalojn.

Bataj prilaboradoj per API
Konektiloj por lokalizado de enhavo
CI/CD-integriĝo
Tabelkalkulilo por aŭda aŭtomatigo

Montri la plenan API- dokumentaron

API Specifoj

Konstruita por produktado de aplikaĵoj

20+

TTS- modeloj

100+

Voĉoj

30+

Lingvoj

<1s

Latenco (Kokoro)

Signu vin senpage — 15,000 signoj

Oftaj demandoj

Komunaj demandoj pri la TTS.ai programisto API

Jes. Nia API sekvas la OpenAI aŭdparolan formaton. Se vi uzas la OpenAI Piton aŭ Ĝavoskriptan klientbibliotekon, vi povas ŝanĝi al TTS.ai ŝanĝante la parametrojn base_url kaj api_key. Via ekzistanta kodo funkcias sen modifo.

Kokoro generas sonon en malpli ol 1 sekundo por tipaj frazoj. CosyVoice 2 subtenas fluan eligon por eĉ pli malalta perceptata latenteco. Por babilrobotoj kaj voĉaj asistantoj, la totala vojaĝtempo estas tipe 1-3 sekundoj depende de la tekstolongo kaj modeloelekto.

Senpagaj modeloj (Kokoro, Piper, VITS, MeloTTS) estas tute senpagaj. Normalaj modeloj uzas 2x signojn por 1K da teksto. Premium-modeloj uzas 4x signojn por 1K da teksto. Registriĝu senpage kun 15,000 signoj. Planoj komenciĝas je $9/monate por 500,000 signoj.

Jes. Alŝutu referencan sonspecimenon (5-30 sekundoj) al la voĉklona finopunkto, tiam uzu la klonitan voĉan identigilon en postaj TTS-petoj. Modeloj kiuj subtenas klonadon inkluzivas CosyVoice 2, Chatterbox, Fish Speech, kaj GPT-SoVITS.

La senpaga nivelo havas bazan limigon de rapideco (3 petoj po horo sen konto). La pagaj planoj havas grandajn limigojn de rapideco taŭgaj por produktaj aplikaĵoj. Kontaktu nin por entreprennivelaj bezonoj pri rapideco.

WAV (nekunpremita, plej alta kvalito), MP3 (kunpremita, pli malgrandaj dosieroj), OGG (malferma formato), kaj FLAC (senperda kunpremado). Donu la formaton en via peto. Defaŭlte estas WAV je la nacia specimena ofteco de la modelo.

Jes. Kombinu nian TTS API kun parol-al-teksta modelo kaj LLM por konstrui kompletan voĉ-asistentan kanalon. Kokoro provizas sub-sekundan latencon idealan por realtempa konversacio. CosyVoice 2 subtenas fluan eligon por eĉ pli malaltaj perceptataj respondtempoj.

CosyVoice 2 kaj Kokoro subtenas fluantan aŭdan eligon kie aŭdaj partoj estas liverataj dum ili estas generataj. Tio reduktas la tempon ĝis la unua bito por realtempaj aplikaĵoj kiel voĉaj asistantoj kaj interagaj spertoj.

La API redonas normalajn HTTP- statajn kodojn. Realigu eksponentan malantaŭeniĝon por 5xx- eraroj kaj rapidlimajn respondojn. Por misi- kritikaj aplikaĵoj, aldonu vicon kun reprovlogiko. Nia API havas altan funkcidaŭron, sed rezistema erarotraktado estas ĉiam rekomendata.

Jes. La finpunktoj /v1/voices kaj /v1/models redonas JSON-listojn de ĉiuj disponeblaj voĉoj kaj modeloj kun iliaj metadatumoj (lingva subteno, kvalito-rangigoj, rapido-rangigoj, kaj preznivelo). Uzu tiujn por konstrui dinamikajn modelelektilojn en via aplikaĵo.

Liberaj modeloj (Kokoro, Piper, VITS, MeloTTS) servas kiel efika sabloŝranko ĉar ili estas tute liberaj. Testu vian integriĝon kun liberaj modeloj, poste ŝanĝu al premiumaj modeloj en produktado per ŝanĝo de la modeloparametro. Neniu aparta testommedio necesas.

Plej multaj el niaj modeloj estas malfermkodaj kaj povas esti mem-gastigataj. Tamen, mem-gastigado postulas signifajn GPU-risurcojn (ni uzas 4x NVIDIA Tesla P40 kun 96GB VRAM entute). La API provizas kostan alternativon sen infrastrukturadministrado.

5.0/5 (1)

Ĉu vi pretas konstrui per voĉa AI?

Aĉetu vian senpagan API-ŝlosilon kaj komencu konstrui. 15,000 signoj je aliĝo, disponeblaj senpagaj modeloj, ampleksa dokumentaro.

Aliĝi senpage Rigardi prezojn

Tekst-al-vorta API por programistojName

Provu nun

Ĉu vi ŝatas TTS.ai? Diru al viaj amikoj!

API- ebloj por programistoj

Simpla REST API

OpenAI- kongrua

24+ disponeblaj modeloj

Subsekunda prokrasto

API por voĉklonado

Pluraj formatoj

Plej bonaj modeloj por integriĝo de programistoj

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Kiel integri la TTS API

Elŝuti vian API- ŝlosilon

Make Your First Call

Elektu vian modelon

Sendi al Produktado

Rapidstartaj kodoekzemploj

Kion programistoj konstruas per TTS.ai

AI- babilejoj kaj helpantojName

Poŝtelefonaj kaj voĉaj aplikaĵojName

SaaS- produktoj

Aŭtomataj kanaloj

API Specifoj

Oftaj demandoj

Ĉu la API kongruas kun la OpenAI TTS-formato?

Kio estas la latenteco por realtempaj aplikaĵoj?

Kiel funkcias la prezo por API-uzo?

Ĉu mi povas uzi voĉan klonadon tra la API?

Ĉu ekzistas limigo de la rapideco?

Kiujn sonajn formatojn la API redonas?

Ĉu mi povas uzi la API por konstrui voĉan asistanton aŭ babilroboton?

Ĉu ekzistas WebSocket aŭ fluanta API?

Kiel mi traktas erarojn kaj reprovojn en produktado?

Ĉu mi povas programe listigi disponeblajn voĉojn kaj modelojn?

Ĉu ekzistas sabloŝranko aŭ testa medio?

Ĉu mi povas mem gastigi la modelojn anstataŭ uzi la API?

Ĉu vi pretas konstrui per voĉa AI?