Разработчиктер үчүн тексттен сүйлөмгө API

Биздин REST API менен үн менен иштелип чыккан тиркемелерди түзүңүз. Сиздин тиркемелерге, чат-ботторго, үн ассистенттерине жана SaaS продуктуларына табигый тексттен сүйлөмгө, сүйлөмдөн текстке жана аудио иштетүүнү кошуңуз. OpenAI-компатибельный формат, 20+ модели, простая интеграция.

REST API Чат-боттор Сөз колдонмолору SaaS продуктулары Автоматташтыруу

Азыр аракет кылыңыз

Кокоро, Пайпер, VITS, MeloTTS менен акысыз
Сиздин түзүлгөн аудио файлыңыз бул жерде пайда болот
Жаратылган
Жүктөө
TTS.ai сизге жактыбы? Досторуңузга айтып коюңуз!

Иштетүүчүлөр үчүн API мүмкүнчүлүктөрү

Сөз менен иштөөчү тиркемелерди түзүү үчүн зарыл болгон бардык нерсе

Жакшы REST API

Сөздү генерациялоо үчүн бир POST суранычы. JSON суранычы, аудио жооп. HTTPди колдогон бардык программалоо тилдери менен иштей алат.

OpenAI менен шайкеш

OpenAI TTS API үчүн алмаштыргыч. Сиздин base_url жана API ачкычын алмаштырыңыз — бар коду тез эле иштей баштайт.

24+ моделдери бар

Ар бир моделге бир гана API аркылуу кирүү. Бир гана параметрди өзгөртүү менен моделдерди алмаштыруу. Качество, скорость и стоимость сравните.

Субсекунддук кечиктирүү

Kokoro 1 секундада аудиону жаратат. Чатботтор, үн жардамчылары жана интерактивдүү тиркемелерге идеалдуу.

Сөздү клондоо API

Клондоо ар бир үн кыска аудио үлгүсүнөн API аркылуу. Клондоо үндөрү кийинки бардык муундарга колдонулат.

Бир нече форматтар

WAV, MP3, OGG же FLAC форматында чыгаруу. Дискретизациянын ылдамдыгын жана бит тереңдигин тандоо. Реалдуу убакытта колдонмолор үчүн аудио поток колдоосу.

Жазуучулар үчүн интеграциялоо үчүн мыкты моделдер

Сиздин программаңыздын ылдамдыгына, сапатына жана баасына ылайыктуу модель тандаңыз

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Эң жакшысы: Эң ылдам модель — секунданын бир бөлүгүндөгү кечиктирүү, реалдуу убакыттагы колдонмолор жана чат-боттор үчүн идеалдуу

_Көрөлү Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Сөздү клондоо

Эң жакшысы: Транслирование TTS с голосовым клонированием для голосовых ассистентов

_Көрөлү CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Эң жакшысы: Чатбот жана ассистенттин үнүнүн табигый убакыты менен баарлашуу ИИ

_Көрөлү Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Эң жакшысы: Акысыз, көп көлөмдөгү колдонмолор үчүн гана CPU модели, кредиттик чыгымдар жок

_Көрөлү Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Эң жакшысы: Аудио эффекттер менен аудио генератор чыгармачыл жана көңүл ачуучу колдонмолор үчүн

_Көрөлү Bark

TTS API-ин интеграциялоо

Регистрациядан биринчи API чакыруусуна чейинки убакыт 5 мүнөттөн аз

1

API ачкычын алуу

Бесплатно зарегистрироваться и генерировать API ключ из панели учетной записи. 15 000 символов включено.

2

Сиздин алгачкы чалуу

POST текст, модель жана үн менен /v1/tts дарегине. Аудио байттарды алуу. 5 сап код менен.

3

Моделиңизди тандоо

Өзүңүздүн иш-аракеттериңиз үчүн ар кандай моделдерди текшериңиз. Жылдамдыкты, сапатты жана бир генерациянын баасын салыштырыңыз.

4

Продукцияга жөнөтүү

Масштабирование с символами, которые платят за использование. Платежные планы не имеют ограничений. Использование контролируется в вашем панели управления.

Кодду тез баштоо мисалдары

TTS.ai-ди каалаган тилде REST API менен интеграциялоо

Python Популярное
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Универсалдуу
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-катуу формат Кыймылсыз
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

TTS.ai менен иштеп чыгуучулар эмнелерди түзөт

Жалпы интеграциялык шаблондор жана тиркемелер

AI чат-боттору жана жардамчылары

Чатбот же AI ассистентине үн чыгарууну кошуу. LLM жооптору TTS аркылуу үн менен иштей турган интерфейстер үчүн. Kokoro реалдык убакытта сүйлөшүү үчүн секунданын ичинде жооп берет. Sesame CSM табигый убакыт менен сүйлөшүү сөздөрүн жаратат.

  • LLM жооптору сүйлөм конвейерине
  • Kokoro менен секунданын бир бөлүгү ичиндеги кечиктирүү
  • Sesame CSM менен сүйлөшүү
  • Аудио чыгуу

Мобилдик жана үн колдонмолор

Сөз менен иштөөчү мобилдик тиркемелерди, жеткиликтүүлүктү жакшыртуу каражаттарын, окуу тиркемелерин жана тил үйрөнүү платформаларын түзүү. Биздин REST API каалаган мобилдик фреймворк менен иштей алат. Аудиофайлдарды жүктөп алыңыз же түз эле клиентке жөнөтүңүз.

  • React Native, Flutter, Swift, Kotlin
  • Коопсуздук жана окуу тиркемелери
  • Тил үйрөнүү платформалары
  • Аудио мазмунду түзүү

Продукт

Сиздин SaaS продуктуңуздагы үн мүмкүнчүлүктөрү. TTS, STT, үн клондоо жана аудио иштетүү мүмкүнчүлүктөрүн платформаңызга кошуңуз. Биздин APIни үн backend катары колдонуп, GPU инфраструктурасын башкарбаңыз.

  • Белгисиз үн өзгөчөлүктөрү
  • Графикалык процессор инфраструктурасы керек эмес
  • Колдонуу үчүн төлөм
  • Колдонуучуларыңызга сунуштай турган 20дан ашык модель

Автоматташтыруу каналдары

CI/CD каналдарына, контент автоматизациясына жана пакеттик иштетүү процесстерине үн генераторун интеграциялоо. Электрондук таблицалардан миңдеген аудио файлдарды генерациялоо, подкасттарды автоматташтыруу же контент локализациялоо каналдарын түзүү.

  • Батареялык иштетүү API аркылуу
  • Мазмун локализациялоо контейнерлери
  • CI/CD интеграциясы
  • Аудио автоматизациясы үчүн электрондук таблица

API спецификациялары

Продукциялык колдонмолор үчүн курулган

20+

ТТС моделдери

100+

Добуштар

30+

Тилдер

<1s

Задержка (Kokoro)

Көп берилүүчү суроолор

TTS.ai иштеп чыгуучулардын API жөнүндө кеңири тараган суроолор

Да. Биздин API OpenAI аудио-сөз форматына ылайык иштелип чыккан. Эгерде сиз OpenAI Python же JavaScript клиенттик библиотекасын колдонсоңуз, анда TTS.aiге өтүп, base_url жана api_key параметрлерин өзгөртө аласыз. Сиздин кодуңуз өзгөртүүсүз иштей берет.

Kokoro типтүү сүйлөмдөрдү 1 секундада генерациялайт. CosyVoice 2 потоктук чыгарылышты колдойт, бул дагы аз убакытты талап кылат. Чатботтор жана үн жардамчылары үчүн, тексттин узундугуна жана тандалган моделге жараша, жалпы айлануу убактысы 1-3 секунда.

Free models (Kokoro, Piper, VITS, MeloTTS) are completely free. Standard models use 2x characters per 1K of text. Premium models use 4x characters per 1K of text. Free register with 15,000 characters. Plans start at $9/month for 500,000 characters.

Да. Справочную аудиопробу (5-30 секунд) загрузить в конечную точку голосовой клонировки, а затем использовать клонированный голосовой идентификатор в последующих запросах TTS. Клонирование поддерживают такие модели, как CosyVoice 2, Chatterbox, Fish Speech и GPT-SoVITS.

Бесплатный уровень имеет базовый лимит скорости (3 запроса в час без учетной записи). Платежные планы имеют большие лимиты скорости, подходящие для производственных приложений. Для прохождения требований корпоративного уровня обращайтесь к нам.

WAV (сыгып алынбаган, эң жогорку сапат), MP3 (сыгып алынбаган, кичине файлдар), OGG (ачык формат) жана FLAC (көбүнчө жоготуусуз сыгып алынган). Форматты сурооңузда көрсөтүңүз. Адегенде WAV моделиңиздин өздүк дискретизациясы менен.

Да. Биздин TTS API-ин сүйлөмдөн текстке моделин жана LLM-ди бириктирип, толук үн ассистентинин конвейерин түзүңүз. Kokoro секунданын ичиндеги кечиктирүүнү камсыз кылат, бул реалдуу убакытта сүйлөшүү үчүн идеалдуу. CosyVoice 2 дагы эле төмөн сезилген жооп убактысы үчүн потоктук чыгарылышты колдойт.

CosyVoice 2 жана Kokoro аудио чыгарууну колдойт, анда аудио бөлүктөрүн түзүү учурунда жеткирүү мүмкүн. Бул үн жардамчылары жана интерактивдүү тажрыйбалар сыяктуу реалдуулукта иштөөчү тиркемелерде биринчи байтка чейинки убакытты кыскартат.

API стандарттык HTTP абал коддорун кайтарат. 5xx каталары үчүн экспоненциалдык backoff жана ылдамдык чектөөлөрүн ишке ашырат. Критикалык колдонмолор үчүн, логика менен кайталап аракеттенүү менен кезекти кошуу. Биздин API жогорку иштетүү убактысына ээ, бирок каталарды оңдоо дайыма сунушталат.

Да. /v1/voices жана /v1/models конечных точек возвращают JSON списки всех доступных голосов и моделей с их метаданными (языковая поддержка, качество, скорость и цены). Используйте их для создания динамических выборщиков моделей в приложении.

Free models (Kokoro, Piper, VITS, MeloTTS) effective sandbox as they are completely free. Test your integration with free models, then switch to premium models in production by changing the model parameter. No separate test environment needed.

Биздин моделдердин көбү ачык булактуу жана өз алдынча хосттоого болот. Бирок, өз алдынча хосттоого GPU ресурстары керек (биз 4x NVIDIA Tesla P40 менен 96GB VRAM колдонобуз). API инфраструктураны башкаруусуз эле үнөмдүү альтернатива болуп саналат.
5.0/5 (1)

Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.

Сөздүк менен иштей баштагыңыз келеби?

Сиздин акысыз API ачкычын алып, курууну баштаңыз. 15,000 символдук каттоо, акысыз моделдер, толук документация.