Maandishi kwa Usemi API kwa Ajili ya Wasitawi

Jenga matumizi ya sauti inayoweza kutumika kwa mfumo wetu wa sauti wa RES API. ongeza ujumbe wa asili wa maandishi -to-speech, uundaji wa sauti, habari za usemi, na ushughulikiaji wa sauti kwenye programu yako, wazungumzaji, wasaidizi wa sauti, na bidhaa za SaaS.

MILIMA YA PEKEE Vibweta Faida za Sauti Vitu Vilivyotengenezwa kwa SaaS Automa

Kijaribu Sasa

Nikiwa huru na Kokoro, Piper, VITS, MetoTTTS
Sauti yako iliyotokezwa itatokea hapa
Genested
Pakia
Waeleze rafiki zako kuhusu mapenzi ya TTS.ai?

Sehemu za MILI kwa Ajili ya Wakuzi

Kila kitu unachohitaji ili kutengeneza programu zinazoweza kutumika kwa sauti

MILIMA Rahisi

JSON aliomba atayarishe hotuba kwa kutumia lugha yoyote inayounga mkono HTP.

Unaweza Kufaana na Watu

TTS API, unaochukua mahali pa nafasi ya kwanza ya kituo chako cha mawasiliano na API huwa na matokeo mara moja.

24+ Mifano Yapatikana

Tumia kila mfano kupitia mfano mmoja kwa kubadili kipimo kimoja cha parameta. Linganisha ubora, mwendo, na gharama.

Kutoweza Kuafikiana Chini ya Ardhi

Kokoro anaamsha sauti kwa sekunde moja. Imefaa sana kwa wazungumzaji wa muda mrefu, wasaidizi wa sauti, na maombi ya mazungumzo.

Sauti Yenye Kuunganisha API

Ongoza sauti yoyote kutoka kwenye sampuli fupi ya sauti kupitia API. Tumia sauti zilizotokezwa kwa vizazi vyote vinavyofuata.

Namna Mbalimbali

Chagua kiwango cha sampuli na kina kidogo.

Njia Bora za Kuboresha Ukuzi

Chagua kiolezo kifaacho kwa ajili ya mwendo, ubora, na gharama za matumizi yako

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Faida kwa: Mfano wa hali ya juu zaidi ni ule wa pili, unaofaa kwa ajili ya programu za muda na minong'ono ya muda mrefu

Jaribu Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Sauti Yaungana

Faida kwa: TEGEMEA TTS ikiwa na uwezo wa kutokeza sauti kwa ajili ya matumizi ya sauti ya msaidizi

Jaribu CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Faida kwa: Mazungumzo ya AI yenye wakati wa kawaida wa kupiga gumzo na kuwa naibu wa sauti

Jaribu Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Faida kwa: Huru, CPU-pekee ya maombi ya juu yenye gharama ya sufuri ya mkopo

Jaribu Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Faida kwa: Kizazi chenye sauti kwa ajili ya ubuni na vitumbuizo

Jaribu Bark

Jinsi ya Kuikanyaga TTS API

Kuanzia matangazo ya ishara hadi ya kwanza API kupiga simu chini ya dakika 5

1

Tafuta Faida za Kufanya Maamuzi

Weka sahihi kwa ajili ya uhuru na kutokeza ufunguo wa API kutoka kwenye sanduku lako la matangazo.

2

Fanya Ziara Yako ya Kwanza

POST to /v1/tts ikiwa na maandishi, muundo, na sauti.

3

Chagua Kielelezo Chako

Jaribuni vielelezo tofauti - tofauti kwa ajili ya kesi yenu. Linganisha mwendo, ubora, na gharama kwa kila kizazi.

4

Meli za Kuzalisha

sawa na herufi-za-yo-za-u-u-nasa-na kiwango cha juu katika mipango ya malipo. matumizi ya kufuatilia matokeo katika bodi yako.

Mifano ya Ujumbe wa Siri Inaanza Haraka

Intragrate TTS.ai katika lugha yoyote ile na REST API

Python Inapendwa na wengi
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Ulimwenguni pote
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Muundo Ulio Wazi Gone-in
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Kile Ambacho Wasitawi Hujenga kwa TTS.ai

Muundo na matumizi ya kawaida

Matusi na Wasaidizi

Ongezea sauti kwenye mtandao wako wa soga au msaidizi wa AI. Pipe LLM maoni kupitia TTS kwa ajili ya mawasiliano ya sauti. Kokoro anawasilisha kiwango cha chini cha pili kwa mazungumzo ya wakati halisi. Sesame CSM anatoa hotuba ya majadiliano kwa wakati wa asili.

  • FARAGUA bomba la usemi
  • Uchelewa wa pili pamoja na Koro
  • Mazungumzo na Sesame CSM
  • Utoaji wa sauti unaosisimua

Faida za Simu na Sauti

Jenga zana za mkononi zinazoweza kuzimwa kwa sauti, vifaa vya upatikanaji, programu za kusoma, na majukwaa ya kujifunza lugha.

  • Mitikiaji Mwenyeji wa Asili wa Amerika, Mpiga - Picha, Swift, Kotlin
  • Kufikiwa kwa urahisi na programu za kusoma
  • Jukwaa la kujifunza lugha
  • Kizazi cha Audio

Vitu Vilivyotengenezwa kwa SaaS

Uwezo wa sauti nyeupe katika bidhaa yako ya SaaS. Oongeza TTS, STET, uundaji wa sauti, na utengenezaji wa sauti kama sehemu katika jukwaa lako.

  • Sauti nyeupe - nyeupe
  • Hakutakuwa na Huduma za Msingi za GPU
  • Shungi la kheri, lenye rangi ya vikwazo vya milimani.
  • 20+ wanamitindo ili kuwapa watumiaji wako

Mashine za Kujiendesha

Asilimia miani ya sauti katika mabomba ya CI/CD, uingizaji wa maudhui, na ushughulikiaji wa mitambo.

  • Maendeleo ya Batch kupitia API
  • Mifereji ya mahali hapo yenye uradhi
  • paper size
  • Tangaza Kwenye Miisho ya sauti

Sehemu Mbalimbali za API

Lilijengwa kwa ajili ya matumizi ya utokezaji

20+

Miindo ya Mizinga

100+

Sauti

30+

Lugha

<1s

Laticy (Koro)

Maswali Ambayo Watu Huuliza Mara Nyingi

Maswali ya kawaida kuhusu mwendelezaji TTS.ai API

Ndiyo. kama unatumia maktaba ya wakala wa USAI au maktaba ya wateja ya JavaScript, unaweza kubadilisha herufi TTS.ai kwa kubadili msingi wa mfumo wa sauti na api_kesi.

Kokoro anatoa sauti kwa mara ya pili kwa sentensi za kawaida. CosyVoice 2 inaunga mkono usambazaji kwa kiasi kidogo cha sauti. Kwa wazungumzaji na wasaidizi wa sauti, jumla ya muda wote kwa kawaida huwa ni sekunde 1-3 ikitegemea urefu wa maandishi na uchaguzi wa kimitindo.

Waigaji huru (Koro, Piper, VITS, MetoTTS) wako huru kabisa.

Naam. Pakua sampuli ya sauti (mita 5-30) kwenye sauti iliyotokezwa, kisha tumia sauti iliyotokezwa ya ID katika maombi ya TTS. Maandamano yanayounga mkono ufanyizaji wa chembe za urithi ni pamoja na CosyVoice 2, Chatterbox, Fish Sp Sp Sp Sp, na GPT-SEVITS.

Seti huru ina kiwango cha msingi cha kupunguza maombi (ya kila saa bila akaunti). Mipango ina mipaka ya kiwango cha juu kwa ajili ya matumizi ya uzalishaji. Wasiliana nasi kwa ajili ya shughuli za kibiashara kupitia matakwa.

UV (hali ya juu sana), MP3 (mabumba madogo, madogo), OG (ushongo wa wazi), na FALAC (ambazano ambalo halijakamilika), tumia muundo huo katika ombi lako. Defrault ni WAV kwa kiwango cha asili cha sampuli ya kiolezo hicho.

Naam. Changia TTS API na mfano wa mazungumzo ya hotuba na LM kujenga bomba la sauti teule. Kokoro huandaa kifaa kabisa kwa mazungumzo ya wakati halisi. CosyVoice 2 inaunga mkono utokezwaji wa kiasi kikubwa cha fedha kwa ajili ya nyakati zinazodhaniwa kuwa chini zaidi.

CosyVoice 2 na Kokoro wanaunga mkono utoaji wa sauti zinazotiririka mahali ambapo vipande vya sauti hutolewa.

Masuala ya msingi ya kiwango cha afya. Kufuta makosa 5 na kupunguza miitikio. Kwa maombi ya kiuandishi, ongeza foleni kwa mantiki ya kinyuklia.

Ndio. The /v1/voisies and /v1/models respents repain of vyote vipatikanavyo vya sauti na violezo pamoja na msaada wao wa lugha, viwango vya hali ya juu, viwango vya mwendo wa kasi, na tabaka la nyuma).

Vituo huru (Koro, Piper, VITS, MetoTTS) hutumika kama sanduku la mchanga lenye matokeo kwa sababu vinagharimu sufuri.

Wengi wa wanamitindo wetu wako wazi na wanaweza kujiletea wenyewe. Hata hivyo, kujinyonga kunahitaji rasilimali muhimu za GPU (tunatumia 4x NVIDIA Tesla P40 with 96GB VRAM).
5.0/5 (1)

Uwezo wako wa kutatua matatizo ni nini?

Je, Niko Tayari Kujenga kwa Sauti?

Pata funguo zako za bure na uanze kujenga.