Ижодкорлар учун матндан сўзга API

Бизнинг REST API билан овозли дастурларни яратинг. Сўзлашув учун табиий матн, овозни клонлаш, сўзлашув учун матн ва аудиони ўз дастурларингиз, чатботларингиз, овозли ёрдамчиларингиз ва SaaS маҳсулотларингизга қўшинг. OpenAI-га мос формат, 20+ модел, оддий интеграция.

REST API Чатботлар Товуш дастурлари SaaS маҳсулотлари Автоматлаштириш

Энди синаб кўриш

Kokoro, Piper, VITS, MeloTTS билан бепул
Сизнинг яратилган аудионгиз бу ерда пайдо бўлади
Юкланган
Юклаб олиш
TTS.ai'ни севасанми? Дўстларингга айт!

Ижодкорлар учун API хусусиятлари

Сўзли дастурларни яратиш учун керак бўлган барча нарса

Оддий REST API

Товуш яратиш учун бир POST сўрови. JSON сўрови, аудио жавоби. HTTP'ни қўллаб-қувватловчи барча дастурлаш тиллари билан ишлайди.

OpenAI-муносиб

OpenAI TTS API учун ўрнини босувчи. Сизнинг base_url ва API калитингизни алмаштиринг — мавжуд код дарҳол ишлайди.

24+ модели мавжуд

Ҳар бир моделга битта API орқали кириш. Бир параметрни ўзгартириш билан моделларни алмаштириш. Сифат, тезлик ва қийматни солиштириш.

Иккинчидан кичик кечикиш

Kokoro 1 сония ичида аудиони яратади. У реал вақтдаги чатботлар, овозли ёрдамчилар ва интерактив дастурлар учун жуда яхши.

Товушни клонлаш API

API орқали қисқа аудио намунадан ҳар қандай овозни клонлаш. Клонланган овозларни барча кейинги авлодлар учун қўллаш.

Кўп форматлар

WAV, MP3, OGG ёки FLAC кўринишида чиқинди. Намуна тезлигини ва бит чуқурлигини танланг. Реал вақт дастурлари учун аудио узатиш қўллаб-қувватланади.

Иқтидорли дастурчи учун энг яхши моделлар

Сўнгра дастурингиз тезлиги, сифати ва қиймати талабларига мос моделни танланг

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Энг яхшиси: Энг тезкор модел - секунддан кичик кутиш вақти, реал вақт дастурлари ва чатботлар учун идеал

Синаб кўриш Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Товушни клонлаш

Энг яхшиси: ТТСни овоз ёрдамчиси дастурлари учун овозни клонлаш билан узатиш

Синаб кўриш CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Энг яхшиси: Чатбот ва ёрдамчи овоз учун табиий вақт билан гаплашувчи AI

Синаб кўриш Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Энг яхшиси: Кредит харажатлари йўқ, юқори ҳажмли дастурлар учун фақат CPU модели

Синаб кўриш Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Энг яхшиси: Ижодкорлик ва ҳордиқ чиқариш дастурлари учун товуш эффектлари билан аудио яратиш

Синаб кўриш Bark

TTS API'ни қандай бирлаштириш мумкин

5 дақиқадан камроқ вақт ичида рўйхатдан ўтишдан биринчи API чақириқларигача

1

API калитингизни олиш

Бепул рўйхатдан ўтинг ва ҳисобингиз панелидан API калитини яратинг. 15,000 та белги киритилган.

2

Биринчи қўнғироқни амалга ошириш

/v1/tts'га матн, модел ва овоз билан POST. Аудио байтларни қайтариш. 5 сатр код остида.

3

Модельингизни танланг

Сўзлашувингиз учун турли моделларни синовдан ўтказинг. Тезлик, сифат ва ҳар бир авлод учун харажатларни солиштиринг.

4

Производствога юбориш

Ўтказилган кредитлар билан ўлчаш. Ўтказилган тариф режаларида тариф чекловлари йўқ. Дастгоҳингизда фойдаланишни кузатинг.

Қисқача код мисоллари

Бизнинг REST API билан TTS.ai'ни ҳар қандай тилда интеграциялаш

Python Кўп тарқалган
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Умумжаҳон
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-мувофик формат Қизил
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ижодкорлар TTS.ai билан нима қуришади

Умумлаштирилган интеграция намуналари ва дастурлар

AI суҳбат ботлари ва ёрдамчилари

Сўзлашув ботингиз ёки AI ёрдамчисига овозли чиқишни қўшинг. LLM жавобларини овозли интерфейслар учун TTS орқали юборинг. Kokoro реал вақтдаги суҳбатлар учун секунддан кичик кутиш вақтини тақдим этади. Sesame CSM табиий вақт билан суҳбатли сўзлашувни яратади.

  • LLM сўзлашув каналига жавоб беради
  • Kokoro билан суб-секундлик кечикиш
  • Sesame CSM билан суҳбатлашиш
  • Аудио қувватлаш

Мобиль ва овозли дастурлар

Товушли мобил дастурлар, қўлланма асбоблар, ўқиш дастурлари ва тил ўрганиш платформаларини яратинг. Бизнинг REST API барча мобил дастурлар билан ишлайди. Аудио файлларни юклаб олинг ёки клиентга тўғридан-тўғри узатинг.

  • React Native, Flutter, Swift, Kotlin
  • Қўллатиш ва ўқиш дастурлари
  • Тил ўрганиш платформалари
  • Аудио мазмун яратиш

SaaS маҳсулотлари

Сизнинг SaaS маҳсулотингизда овоз имкониятларини оқ-белгилаш. TTS, STT, овозни клонлаш ва аудиони ўз платформангизда ишлаш хусусиятларини қўшинг. Бизнинг API'ни GPU инфратузилмасини бошқармасдан овозни ишлаш учун қўлланг.

  • Оқ-белгили овоз хусусиятлари
  • GPU инфратузилмасига эҳтиёж йўқ
  • Истифодага қараб тўлов
  • 20+ фойдаланувчиларингиз учун таклиф этиладиган моделлар

Автоматлаштириш қувурлари

CI/CD қувурларига, мазмун автоматизациясига ва партияли ишлаш жараёнларига овоз яратишни интеграция қилинг. Элементлар жадвали маълумотларидан минглаб аудио файлларни яратинг, подкастлар ишлаб чиқаришни автоматлаштиринг ёки мазмун локализацияси қувурларини қуринг.

  • API орқали партияни ишлаш
  • Мазмун локализацияси қувурлари
  • CI/CD интеграцияси
  • Аудио автоматизация учун электрон варақа

API хусусиятлари

Продукция дастурлари учун яратилган

20+

TTS моделлари

100+

Овозлар

30+

Тиллар

<1s

Задбуронлик (Kokoro)

Кўп бериладиган саволлар

TTS.ai дастурчи API ҳақидаги оддий саволлар

Ҳа. Бизнинг API OpenAI аудио сўзлашув форматига риоя қилади. Агар сиз OpenAI Python ёки JavaScript клиент китобхонасини фойдаланаётган бўлсангиз, base_url ва api_key параметрларини ўзгартириб TTS.ai га ўтишингиз мумкин. Сизнинг мавжуд кодингиз ўзгаришсиз ишлайди.

Kokoro оддий жумлалар учун 1 сониядан камроқ вақтда аудиони яратади. CosyVoice 2 ҳаттоки камроқ кутиш вақти учун ҳам стриймингни қўллаб-қувватлайди. Чатботлар ва овозли ёрдамчилар учун, матн узунлиги ва модел танлашига қараб, умумий айланиш вақти одатда 1-3 сонияни ташкил қилади.

Бепул моделлар (Kokoro, Piper, VITS, MeloTTS) 0 кредитга тушади. Стандарт моделлар 1000 ҳарф учун 2 кредитга тушади. Плюс моделлар 1000 ҳарф учун 4 кредитга тушади. 15 кредит билан бепул рўйхатдан ўтинг. 500 кредит учун режалар ойига $9 дан бошланади.

Ҳа. Эътиборли аудио намунасини (5-30 сония) овозни клонлаш охирги нуқтасига юкланг, сўнгра клонланган овоз ID'ни кейинги TTS талабларида фойдаланинг. Клонлашни қўллаб-қувватлайдиган моделлар орасида CosyVoice 2, Chatterbox, Fish Speech ва GPT-SoVITS мавжуд.

Бепул даражанинг асосий тезлик чегараси бор (ҳисоб-варағи бўлмаганда соатига 3 та талаб). Умумий тариф режалари ишлаб чиқариш дастурлари учун мос келадиган кенг тезлик чегараларига эга. Корхона даражасидаги тезлик талаблари учун биз билан боғланинг.

WAV (сиқилмаган, энг юқори сифатли), MP3 (сиқилган, кичик файллар), OGG (очиқ формат) ва FLAC (ҳисобсиз сиқиш). Сизнинг талабингизда форматни кўрсатинг. Ўртача - бу моделнинг ўз намуна тезлигидаги WAV.

Ҳа. Бизнинг TTS API'ни сўздан матнга модел ва LLM билан бирлаштиринг, тўлиқ овоз ёрдамчиси қувурини яратиш учун. Kokoro реал вақтда суҳбат учун идеал секунддан кичик кутиш вақтини таъминлайди. CosyVoice 2 ҳаттоки камроқ қабул қилинган жавоб вақти учун стрийминг чиқиндисини қўллаб-қувватлайди.

CosyVoice 2 ва Kokoro аудио парчалари яратилганда етказиб бериладиган аудио узатиш ечимини қўллаб-қувватлайди. Бу овозли ёрдамчилар ва интерактив тажрибалар каби реал вақтдаги дастурлар учун биринчи байтгача бўлган вақтни камайтирган.

API стандарт HTTP ҳолати кодларини қайтаради. 5xx хатолари ва тезлик чегараси жавоблари учун экспоненциал ортга қайтишни амалга оширинг. Миссия-критик дастурлар учун, қайта уриниш мантиқи билан навбатни қўшинг. Бизнинг API юқори иш вақтига эга, аммо барқарор хатоларни бошқариш ҳар доим тавсия этилади.

Ҳа. /v1/voices ва /v1/models охирги нуқталари барча мавжуд овозлар ва моделлар JSON рўйхатини уларнинг метамаълумотлари билан (тил қўллаб-қувватлаши, сифат баҳолари, тезлик баҳолари ва нархлар даражаси) қайтаради. Булардан дастурингизда динамик модел танловчиларини яратиш учун фойдаланинг.

Бепул моделлар (Kokoro, Piper, VITS, MeloTTS) кредитларсиз самарали тошхона сифатида хизмат қилади. Бепул моделлар билан интеграцияни синаб кўринг, сўнгра модел параметрини ўзгартириб, ишлаб чиқаришда премиум моделларга ўтинг. Айрим синов муҳитига эҳтиёж йўқ.

Бизнинг моделларимиз кўпчилиги очиқ манбали ва ўз-ўзини хост қилиш мумкин. Лекин, ўз-ўзини хост қилиш катта GPU ресурсларини талаб қилади (биз 4x NVIDIA Tesla P40 ва жами 96GB VRAM ни фойдаланамиз). API инфратузилма бошқарувисиз арзон альтернатива тақдим этади.
5.0/5 (1)

Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.

Товушли ИИ билан қуришга тайёрмисиз?

Бепул API калитингизни олиб, қуришни бошланг. 15 кредитни рўйхатдан ўтказиш, бепул моделлар, тўлиқ ҳужжатлар.