Қате / мүмкіндік туралы хабарлау

Жасаушылар үшін мәтіннен сөйлеуге APIName

REST API арқылы дауысты қолдайтын қолданбаларды құрыңыз. Қолданбаларға, чат-боттарға, дауыс ассистенттеріне және SaaS өнімдеріне мәтіннен сөйлеуге, дауысты клондауға, сөйлеуден мәтінге және аудио өңдеуге мүмкіндік беріңіз. OpenAI-мен үйлесімді формат, 20-дан астам үлгі, қарапайым интеграция.

REST API Чат-боттар Дыбыс қолданбаларыName SaaS өнімдері Автоматтандыру

Толық TTS редакторы API құжаттамалары

Қазір сынап көру

0/500

Kokoro, Piper, VITS, MeloTTS-пен тегінName

Жіберілген аудиосы осында көрсетіледі

Тікелей ТДЖ редакторын ашу

Жасаушылар үшін API мүмкіндіктеріName

Дыбыспен жұмыс істейтін қолданбаларды құру үшін қажет барлық нәрсеName

Қарапайым REST APIName

Бір POST сұранысы сөйлеуді құру үшін. JSON сұранысы, аудио жауап. HTTP қолдайтын кез келген бағдарламалау тілімен жұмыс істейді.

OpenAI- үйлесімді

OpenAI TTS API- нің ауыстырылуы. base_ url және API кілттерін ауыстырыңыз — бар код бірден жұмыс істейді.

Бар 24+ үлгісі

Әрбір модельге бір API арқылы қол жеткізу. Бір параметрді өзгерту арқылы модельдерді ауыстыру. Сапа, жылдамдық және бағаны салыстырыңыз.

Секундқа дейінгі кідіріс

Kokoro 1 секундта дыбыс шығарады. Тікелей чат-боттар, дауыс ассистенттері және интерактивті қолданбалар үшін өте қолайлы. Name

Дыбыс клоны APIName

API арқылы қысқа аудио үлгіден кез келген дауысты клондау. Келесі барлық буындар үшін клондалған дауыстар қолданылады.

Бірнеше пішімдер

Шығыс WAV, MP3, OGG немесе FLAC түрінде. Дискретизация жиілігі мен бит тереңдігін таңдаңыз. Реал- уақыт қолданбалары үшін аудионы тасымалдауды қолдау.

Жасаушыларды біріктірудің ең жақсы үлгілері

Қолданбаның жылдамдығы, сапасы және бағасына сәйкес келетін модельді таңдаңыз

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Тұрақты 5/5

Келесіге ең қолайлы: Ең жылдам үлгі - секундқа дейінгі кешіктіру, нақты уақыттағы қолданбалар мен чат-боттар үшін өте қолайлы

Сынау Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Таспа 5/5 Дыбысты көшіру

Келесіге ең қолайлы: Дыбыс көмегі қолданбалары үшін дыбыстарды клондау арқылы TTS-ті тасымалдау

Сынау CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Баяу 5/5

Келесіге ең қолайлы: Чатбот пен ассистенттің дауысы үшін табиғи уақыт белгілеуімен сөйлесетін жасанды интеллект

Сынау Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Тұрақты 3/5

Келесіге ең қолайлы: Тегін, тек процессормен жұмыс істейтін, көлемді қолданбалар үшін, кредит шығындары жоқ

Сынау Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Баяу 4/5

Келесіге ең қолайлы: Құрастыру және ойын-сауық қолданбалары үшін дыбыс эффекттерімен аудионы құру

Сынау Bark

TTS API- ны қалай біріктіру керек

Жазылудан бастап бірінші API шақыруына дейін 5 минуттан аз уақыт

API кілтіңізді алу

Тіркелгіңіздің басқару панелінен API кілтін құру үшін тегін тіркеліңіз. 15,000 таңба кіреді.

Бірінші қоңырауыңыз

POST /v1/tts мәтінмен, модельмен және дауыспен. Аудио байттарын қайтару. 5 жол код.

Модельіңізді таңдаңыз

Сіздің қолданыс жағдайыңыз үшін түрлі модельдерді сынап көріңіз. Жылдамдық, сапа және бір буынның бағасын салыстырыңыз.

Өндіріске жіберу

Пайдаланылған сайын төленетін таңбалармен масштабтау. Ақылы жоспарларда тариф шектеулері жоқ. Пайдалануыңызды басқару панелінде бақылау.

Кодты жедел бастау мысалдары

TTS.ai-ді кез келген тілге REST API-мен біріктіру

Python Бейне

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Бүкіләлемдік

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI- ге сәйкес пішімі Кірістіру

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

API кілтін алыңыз

Жасаушылар TTS.ai- мен не құрастырады

Ортақ интеграциялық үлгілер мен қолданбалар

AI чат-боттары мен көмекшілеріName

Чатбот немесе AI ассистентіне дыбыс шығаруды қосыңыз. LLM жауаптары дыбыс қолдайтын интерфейстер үшін TTS арқылы беріледі. Kokoro секунд ішіндегі уақытты үнемдеу үшін тікелей сөйлесуге мүмкіндік береді. Sesame CSM табиғи уақытпен сөйлесуді шығарады.

LLM- дің сөйлеу конвейеріне жауап беруіName
Kokoro- ның секундқа дейінгі кешігіп шығуы
Sesame CSM- дегі сөйлеуName
Аудио шығару

Қолмен және дауыспен қолданбаларName

Дыбыстық мобильді қолданбаларды, қолжетімділік құралдарын, оқу қолданбаларын және тіл үйрену платформаларын құрыңыз. Біздің REST API кез келген мобильді фреймворкпен жұмыс істейді. Аудио файлдарды жүктеп алыңыз немесе тікелей клиентке жіберіңіз.

React Native, Flutter, Swift, Kotlin
Арнайы мүмкіндіктер мен оқу қолданбалары
Тіл үйрену платформалары
Аудио мазмұнын құру

SaaS өнімдері

Сіздің SaaS өніміңіздегі ақ-белгілі дауыс мүмкіндіктері. ТТС, STT, дауысты клондау, және аудио өңдеу мүмкіндіктерін платформаңызға қосыңыз. Біздің API-ні GPU инфрақұрылымын басқарусыз дауыс сервері ретінде қолданыңыз.

White- label дыбыс мүмкіндіктеріName
Графикалық процессор инфрақұрылымы қажет емес
Пайдалануға қарай төлеу
Пайдаланушыларыңызға ұсынатын 20+ үлгі

Автоматтандыру конвейерлері

CI/CD конвейерлері, мазмұнды автоматтандыру және пакеттік өңдеу жұмыс ағымдарына дыбыс генерациясын біріктіру. Электрондық кестеден мыңдаған аудио файлдарды құру, подкасттарды автоматтандыру немесе мазмұнды локализациялау конвейерлерін құру.

API арқылы дестелік өңдеу
Мазмұнды локализациялау конвейерлері
CI/CD интеграциясы
Аудио автоматтандыру үшін электрондық кестеName

API құжаттамасын қарау

API спецификациялары

Өндірістік қолданбалар үшін жасалған

20+

Тіл- дыбыс қатынасы үлгілері

100+

Дыбыстар

30+

ТілдерName

<1s

Кідіріс (Kokoro)

Тегін тіркелу — 15, 000 таңба

Жиі қойылатын сұрақтар

TTS.ai жасаушы API туралы жиі қойылатын сұрақтар

Иә. Біздің API OpenAI аудио сөйлеу пішіміне сәйкес келеді. Егер OpenAI Python не JavaScript клиент жиындарын қолдансаңыз, base_ url және api_ key параметрлерін өзгертіп TTS.ai- ге ауысуға болады. Бар кодыңыз өзгеріссіз жұмыс істейді.

Kokoro әдетте сөйлемдерді 1 секундта шығарады. CosyVoice 2- нің қолдауы бойынша, әдетте, 1- 3 секундта шығарылады. Чатботтар мен дауыс ассистенттері үшін, әдетте, мәтінді 1- 3 секундта шығарады, мәтінді ұзындығына және таңдалған үлгіге байланысты.

Тегін үлгілер (Kokoro, Piper, VITS, MeloTTS) тегін. Стандартты үлгілер 1K мәтінге 2x таңбаны пайдаланады. Премиум үлгілер 1K мәтінге 4x таңбаны пайдаланады. 15,000 таңбамен тегін тіркеліңіз. 500,000 таңба үшін жоспарлар $9/ айдан басталады.

Иә. Сілтеме аудио үлгісін (5- 30 секунд) дауысты клондау аяқтау нүктесіне жүктеп беріңіз, содан кейін клондалған дауыс идентификаторы келесі TTS сұраныстарында қолданылсын. Клондауды қолдайтын модельдер: CosyVoice 2, Chatterbox, Fish Speech және GPT- SoVITS.

Тегін деңгейде негізгі жылдамдық шектеулері бар (тіркелгісіз сағат сайын 3 сұраныс). Ақылы деңгейде өндірістік қолданбаларға ыңғайлы кеңейтілген жылдамдық шектеулері бар. Кәсіпорын деңгейіндегі өтімділік талаптары үшін бізбен байланысыңыз.

WAV (сыйымдылығы жоғары, сығусыз), MP3 (сығусыз, ірі файлдар), OGG (ашық пішім) және FLAC (жоғалтусыз сығу). Сұрауда пішімдерді келтіріңіз. Әдетте, үлгінің өзінің дискреттеу жиілігімен WAV.

Иә. Тілдің дыбысын жазу API- ны сөйлеуден мәтінге модельмен және LLM- мен біріктіріп, толық дыбыс ассистентінің конвейерін құрыңыз. Kokoro секунд ішіндегі кешіктіруді ұсынады, бұл шынайы уақыттағы әңгіме үшін өте жақсы. CosyVoice 2 сонымен қатар, жауап беру уақытын қысқарту үшін, ағындық шығаруды қолдайды.

CosyVoice 2 және Kokoro аудио шығаруды ағынмен жеткізуді қолдайды, онда аудио бөліктер құрылған кезде беріледі. Бұл дыбыс ассистенттері мен интерактивті тәжірибелер сияқты нақты уақыт қолданбаларында бірінші байтқа дейінгі уақытты қысқартады.

API стандартты HTTP күй- жай кодтарын қайтарады. 5xx қателерді және жылдамдық шегі жауаптарын экспоненциалды түрде азайтады. Критикалық қолданбаларға қайталау логикасы бар кезекті қосады. API жұмыс уақыты ұзақ, бірақ қателерді оңай өңдеу әрқашан ұсынылады.

Иә. / v1/ voices және / v1/ models аяқтау нүктелері барлық қол жетімді дауыстар мен үлгілердің JSON тізімдерін және олардың метадеректерін (тілді қолдау, сапа рейтингі, жылдамдық рейтингі, баға деңгейі) қайтарады. Оларды қолданбаңыздағы динамикалық үлгі таңдағыштарын құру үшін қолданыңыз.

Еркін үлгілер (Kokoro, Piper, VITS, MeloTTS) ақысыз болғандықтан, тиімді сынау ортасы ретінде қызмет етеді. Еркін үлгілермен біріктіруді сынап көріңіз, содан кейін үлгінің параметрін өзгертіп, өндірістік үлгілерге ауысыңыз. Ерекше сынау ортасы қажет емес.

Біздің модельдердің көпшілігі ашық көзді және өздігінен хостталатын. Бірақ, өздігінен хостталу үшін айтарлықтай графикалық процессор ресурстары қажет (біз 4x NVIDIA Tesla P40 және жалпы 96GB VRAM қолданамыз). API инфрақұрылымды басқарусыз рентабельді альтернатива ұсынады.

5.0/5 (1)

Дыбыспен жасап көруге дайынсыз ба?

API кілтін тегін алып, құруды бастаңыз. 15, 000 таңба тіркеу кезінде, тегін үлгілер, толық құжаттама.

Тегін тіркелу Бағасын қарау

Жасаушылар үшін мәтіннен сөйлеуге APIName

Қазір сынап көру

TTS.ai ұнады ма? Достарыңызға хабарлаңыз!

Жасаушылар үшін API мүмкіндіктеріName

Қарапайым REST APIName

OpenAI- үйлесімді

Бар 24+ үлгісі

Секундқа дейінгі кідіріс

Дыбыс клоны APIName

Бірнеше пішімдер

Жасаушыларды біріктірудің ең жақсы үлгілері

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API- ны қалай біріктіру керек

API кілтіңізді алу

Бірінші қоңырауыңыз

Модельіңізді таңдаңыз

Өндіріске жіберу

Кодты жедел бастау мысалдары

Жасаушылар TTS.ai- мен не құрастырады

AI чат-боттары мен көмекшілеріName

Қолмен және дауыспен қолданбаларName

SaaS өнімдері

Автоматтандыру конвейерлері

API спецификациялары

Жиі қойылатын сұрақтар

API OpenAI TTS пішімімен үйлесімді ме?

Реал- уақыт қолданбаларының кешіктіруі қанша?

API пайдалану үшін бағалау қалай жұмыс істейді?

API арқылы дауысты клондау қолданыла ала ма?

Жылдамдық шегі бар ма?

API қандай аудио пішімдерін қайтарады?

API- ны дыбыс көмегі немесе чат-бот құру үшін қолдана аламын ба?

WebSocket не ағын API бар ма?

Өндірістік қателерді және қайталауларды қалай шешуге болады?

Бар дауыс пен модельдер тізімі бағдарламалық түрде келтірілуі мүмкін бе?

Қалдықтарды жинау немесе сынау ортасы бар ма?

API- ны қолданбай модельдерді өзім хосттап ала аламын ба?

Дыбыспен жасап көруге дайынсыз ба?