Матн ба гуфтугӯ API барои таҳиягарон

Барномаҳои овозиро бо API-и REST-и мо созед. Матни табииро ба сухан, дубора сохтани овоз, суханро ба матн ва коркардкунии аудиоро ба барномаҳои худ, чатботҳо, ёрдамчиёни овозӣ ва маҳсулоти SaaS илова кунед. Формати мувофиқи OpenAI, 20+ модел, якҷоякунии оддӣ.

REST API Чатботҳо Барномаҳои овозӣ Маҳсулотҳои SaaS Автоматизатсия

Ҳоло кӯшиш кунед

Озод бо Kokoro, Piper, VITS, MeloTTS
Шумо дар ин ҷо садои эҷодшударо пайдо мекунед
Сохта шуд
Боркунӣ
Шумо TTS.ai-ро дӯст медоред? Ба дӯстонатон бигӯед!

Хусусиятҳои API барои таҳиягарон

Ҳама чизҳое, ки шумо барои сохтани барномаҳои овозӣ лозим аст

API- и оддии RESTName

Як дархости POST барои эҷоди сухан. Дархости JSON, ҷавоби аудиоӣ. Бо ҳамаи забонҳои барномасозӣ, ки HTTP- ро дастгирӣ мекунанд, кор мекунад.

Совместимость с OpenAI

Ҷойивазкунии фаврӣ барои OpenAI TTS API. Base_url ва калиди API-и худро иваз кунед — рамзи мавҷуда фавран кор мекунад.

24+ намунаҳои дастрас

Дастрасӣ ба ҳар як намуна аз тариқи як API. Мубодилаи намунаҳо бо тағйир додани як параметр. Муқоисаи сифати, суръат ва нархи.

Задержка подсекунд

Kokoro садоро дар муддати камтар аз 1 сония эҷод мекунад. Барои чатботҳои вақти воқеӣ, ёрирасонҳои овозӣ ва барномаҳои интерактивӣ комил аст.

API- и нусхабардории овоз

Тасвири овози кӯтоҳ аз API. Барои ҳамаи наслҳои оянда овозҳои такроршударо истифода баред.

Бисёр андозаҳо

Хуруҷ ҳамчун WAV, MP3, OGG ё FLAC. Зуддии намуна ва чуқурии битро интихоб кунед. Пуштибонии садои равон барои барномаҳои вақти воқеӣ.

Намунаҳои беҳтарин барои ҳамгироии таҳиягар

Интихоби модели дуруст барои суръати барномаи шумо, сифати он ва талаботи хароҷот

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Беҳтарин барои: Модели тезтарин — интизории суб- сония, барои барномаҳои вақти воқеӣ ва чатботҳо идеалӣ

Кӯшиш кунед Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Тасвири овоз

Беҳтарин барои: Транслатсия кардани TTS бо нусхаи овоз барои барномаҳои ёрии овозӣ

Кӯшиш кунед CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Беҳтарин барои: AI-и гуфтугӯӣ бо вақти табиӣ барои чатбот ва овози ёрирасон

Кӯшиш кунед Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Беҳтарин барои: Модули ройгон, танҳо CPU барои барномаҳои калонҳаҷм бо харҷи кредитӣ бепул

Кӯшиш кунед Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Беҳтарин барои: Эҷоди аудио бо таъсироти садо барои барномаҳои эҷодӣ ва фароғатӣ

Кӯшиш кунед Bark

Чӣ тавр якҷоя кардани TTS API

Аз сабти ном то даъвати API-и аввал дар муддати 5 дақиқа

1

Калиди API- и худро гиред

Барои ройгон сабти ном шудан ва эҷоди калиди API аз панели ҳисоб. 15,000 аломатҳо дохил карда шудаанд.

2

Занг задан

POST ба /v1/tts бо матн, намуна ва овоз. Байтҳои аудиоиро баргардонед. Дар зери 5 сатри код.

3

Интихоби намуна

Санҷиши моделҳои гуногун барои истифодаи шумо. Суръати, сифати ва нархи ҳар як наслро муқоиса кунед.

4

& Ба кор даровардан

Масштаб бо рамзҳои пардохти худкор. Дар нақшаҳои пардохтшуда маҳдудиятҳои нархи мавҷуд нест. Истифодаи худро дар панели идоракунӣ назорат кунед.

Намунаҳои коди оғози тез

Якҷоя кардани TTS.ai дар ҳар як забон бо API REST-и мо

Python & Беҳтарин
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Универсалӣ
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Андозаи мувофиқи OpenAI & Гузарондан
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Инкишофдиҳандагон бо TTS.ai чӣ месозанд

Намунаҳои умумӣ ва барномаҳои ҳамгироӣ

AI Чатботҳо ва Ёрдамчиёни

Илова кардани овоз ба чатбот ё ёрдамчии AI. Ҷавобҳои LLM-ро тавассути TTS барои интерфейсҳои овозӣ фиристед. Kokoro барои гуфтугӯи вақти воқеӣ дар як сония интизор мешавад. Sesame CSM гуфтугӯи гуфтугӯро бо вақти табиӣ эҷод мекунад.

  • Ҷавоби LLM ба канали сухан
  • Задержка под секунду с Kokoro
  • Суханронии муоширатӣ бо Sesame CSM
  • Хуруҷи аудиоии равон

Барномаҳои мобилӣ ва овозӣName

Барномаҳои мобилии овозӣ, асбобҳои дастрасӣ, барномаҳои хондан ва платформаҳои омӯзиши забонро созед. REST API-и мо бо ҳар як сохтори мобилӣ кор мекунад. Файлҳои аудиоиро зеркашӣ кунед ё мустақиман ба мизоҷон интиқол диҳед.

  • Реаксияи маҳаллии, Flutter, Swift, Kotlin
  • Дастрасӣ ва барномаҳои хондан
  • Платформаҳои омӯзиши забон
  • Эҷоди мундариҷаи аудиоӣ

Маҳсулотҳои SaaS

қобилияти овози White-label дар маҳсулоти SaaS-и шумо. TTS, STT, клонкунии овоз ва коркардкунии аудиоро ҳамчун хусусиятҳо дар платформаи худ илова кунед. API-и моро ҳамчун пуштибонии овози худ бе идоракунии инфрасохтори GPU истифода баред.

  • Хусусиятҳои овозии White Label
  • Инфраструктураи GPU лозим нест
  • Пардохти барои истифода
  • 20+ намунаҳо барои пешниҳоди корбарони худ

Конвейерҳои автоматӣ

Интеграцияи эҷоди овоз ба каналҳои CI/CD, автоматизатсияи мундариҷа ва ҷараёни корҳои бастабандӣ. Эҷоди ҳазорҳо файлҳои аудиоӣ аз маълумотҳои варақаи электронӣ, автоматизатсияи истеҳсоли подкастҳо ё сохтани каналҳои локализатсияи мундариҷа.

  • Иҷрои бастаҳо тавассути API
  • Конвейери локализатсияи мундариҷа
  • Якҷоякунии CI/CD
  • Варақаи электронӣ барои автоматизатсияи аудио

Муайянкуниҳои API

Барои барномаҳои истеҳсолӣ сохта шудааст

20+

Намунаҳои TTS

100+

Овозҳо

30+

Забонҳо

<1s

Таъхир (Kokoro)

Саволҳои пурсидашаванда

Саволҳои маъмул дар бораи TTS.ai API- и таҳиягар

Да. Наш API следует формату разговора аудио OpenAI. Если вы используете клиентскую библиотеку OpenAI Python или JavaScript, вы можете переключиться на TTS.ai с изменением параметров base_ url и api_ key. Ваш код существует и работает без изменений.

Kokoro барои ифодаҳои оддӣ садоро дар муддати камтар аз 1 сония эҷод мекунад. CosyVoice 2 барои кам кардани мӯҳлати интизорӣ, барои баромади равон пуштибонӣ мекунад. Барои чатботҳо ва ёрони овозӣ, вақти умумии бозгашт одатан 1- 3 сония вобаста ба дарозии матн ва интихоби намуна аст.

Намунаҳои ройгон (Kokoro, Piper, VITS, MeloTTS) комилан ройгон мебошанд. Намунаҳои стандартӣ 2x аломатҳоро барои 1K матн истифода мебаранд. Намунаҳои Premium 4x аломатҳоро барои 1K матн истифода мебаранд. Бо 15,000 аломатҳо ройгон сабти ном кунед. Нақшаҳо аз $9/моҳа барои 500,000 аломатҳо оғоз меёбанд.

Бале. Боркунии намунаи аудиоии истинод (5-30 сония) ба нуқтаи ниҳоии клонкунии овоз, сипас истифодаи ID-и овози клоншуда дар дархостҳои баъдии TTS. Намунаҳое, ки клонкуниро дастгирӣ мекунанд, CosyVoice 2, Chatterbox, Fish Speech ва GPT-SoVITS мебошанд.

Дараҷаи ройгон маҳдудияти суръати асосӣ дорад (3 дархост дар як соат бе ҳисоби корбар). Дараҷаҳои пардохташуда маҳдудияти суръати васеъ доранд, ки барои барномаҳои истеҳсолӣ мувофиқанд. Барои талаботи сатҳи корпоратсия бо мо тамос гиред.

WAV (бе фишурдан, сифати баландтарин), MP3 (фишурда, файлҳои хурдтар), OGG (формати кушода) ва FLAC (фишурдани бе талафот). Формати дархостро муайян кунед. Пешфарз - WAV бо суръати намунаи модел.

Да. Барои сохтани канали пурраи ёрии овозӣ, API- и TTS- ро бо моделҳои гуфтугӯ ба матн ва LLM якҷоя кунед. Kokoro барои гуфтугӯи вақти воқеӣ интизории субсекундӣ медиҳад. CosyVoice 2 барои вақти ҷавоби камтар аз ин, баромади равониро дастгирӣ мекунад.

CosyVoice 2 ва Kokoro пахши аудиоиро дастгирӣ мекунанд, ки дар он қисмҳои аудиоӣ ҳангоми эҷод шуданашон пешниҳод карда мешаванд. Ин вақтро то байтҳои аввал барои барномаҳои вақти воқеӣ, ба монанди ёрирасонҳои овозӣ ва таҷрибаҳои интерактивӣ коҳиш медиҳад.

API- и мо рамзҳои ҳолати стандартии HTTP- ро бармегардонад. Барои хатогиҳои 5xx ва ҷавобҳои маҳдудияти суръат, ба таври экспоненсиалӣ бармегардад. Барои барномаҳои муҳими вазифа, навбатро бо мантиқи такроркунӣ илова кунед. API- и мо вақти кории баланд дорад, аммо коркарди хатогиҳо ҳамеша тавсия дода мешавад.

Ҳа. Нуқтаҳои охирини /v1/voices ва /v1/models рӯйхати JSON-и ҳамаи овозҳои дастрас ва намунаҳоро бо метамаълумотҳои онҳо (дастгирии забон, рейтингҳои сифат, рейтингҳои суръат ва дараҷаи нархгузорӣ) бармегардонанд. Инҳоро барои сохтани интихобкунандагони намунаи динамикӣ дар замимаи худ истифода баред.

Модельҳои ройгон (Kokoro, Piper, VITS, MeloTTS) ҳамчун қуттии реги самаранок хизмат мекунанд, зеро онҳо кредитҳои сифрро талаб мекунанд. Иҷрои худро бо моделҳои ройгон санҷед, сипас ба моделҳои Premium дар истеҳсолот бо тағир додани параметри модел гузаред. Ягон муҳити санҷишии алоҳида лозим нест.

Most of our models are open-source and can be self-hosted. However, self-hosting requires significant GPU resources (we use 4x NVIDIA Tesla P40 with 96GB VRAM total). The API provides a cost-effective alternative without infrastructure management.
5.0/5 (1)

Чӣ чизро метавонем беҳтар кунем? Бозгашти шумо ба мо дар ислоҳи мушкилиҳо кӯмак мекунад.

Шумо омодаед, ки бо овози AI сохтан?

Калиди API- и ройгонро гиред ва сохтанро оғоз кунед. 15 кредит барои сабти ном, намунаҳои ройгон дастрас, ҳуҷҷатҳои пурра.