Жасаушылар үшін мәтіннен сөйлеуге APIName

REST API арқылы дауысты қолдайтын қолданбаларды құрыңыз. Қолданбаларға, чат-боттарға, дауыс ассистенттеріне және SaaS өнімдеріне мәтіннен сөйлеуге, дауысты клондауға, сөйлеуден мәтінге және аудио өңдеуге мүмкіндік беріңіз. OpenAI-мен үйлесімді формат, 20-дан астам үлгі, қарапайым интеграция.

REST API Чат-боттар Дыбыс қолданбаларыName SaaS өнімдері Автоматтандыру

Қазір сынап көру

Kokoro, Piper, VITS, MeloTTS-пен тегінName
Жіберілген аудиосы осында көрсетіледі
Жіберілген
Жүктеп алу
TTS.ai ұнады ма? Достарыңызға хабарлаңыз!

Жасаушылар үшін API мүмкіндіктеріName

Дыбыспен жұмыс істейтін қолданбаларды құру үшін қажет барлық нәрсеName

Қарапайым REST APIName

Бір POST сұранысы сөйлеуді құру үшін. JSON сұранысы, аудио жауап. HTTP қолдайтын кез келген бағдарламалау тілімен жұмыс істейді.

OpenAI- үйлесімді

OpenAI TTS API- нің ауыстырылуы. base_ url және API кілттерін ауыстырыңыз — бар код бірден жұмыс істейді.

Бар 24+ үлгісі

Әрбір модельге бір API арқылы қол жеткізу. Бір параметрді өзгерту арқылы модельдерді ауыстыру. Сапа, жылдамдық және бағаны салыстырыңыз.

Секундқа дейінгі кідіріс

Kokoro 1 секундта дыбыс шығарады. Тікелей чат-боттар, дауыс ассистенттері және интерактивті қолданбалар үшін өте қолайлы. Name

Дыбыс клоны APIName

API арқылы қысқа аудио үлгіден кез келген дауысты клондау. Келесі барлық буындар үшін клондалған дауыстар қолданылады.

Бірнеше пішімдер

Шығыс WAV, MP3, OGG немесе FLAC түрінде. Дискретизация жиілігі мен бит тереңдігін таңдаңыз. Реал- уақыт қолданбалары үшін аудионы тасымалдауды қолдау.

Жасаушыларды біріктірудің ең жақсы үлгілері

Қолданбаның жылдамдығы, сапасы және бағасына сәйкес келетін модельді таңдаңыз

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Келесіге ең қолайлы: Ең жылдам үлгі - секундқа дейінгі кешіктіру, нақты уақыттағы қолданбалар мен чат-боттар үшін өте қолайлы

Сынау Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Дыбысты көшіру

Келесіге ең қолайлы: Дыбыс көмегі қолданбалары үшін дыбыстарды клондау арқылы TTS-ті тасымалдау

Сынау CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Келесіге ең қолайлы: Чатбот пен ассистенттің дауысы үшін табиғи уақыт белгілеуімен сөйлесетін жасанды интеллект

Сынау Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Келесіге ең қолайлы: Тегін, тек процессормен жұмыс істейтін, көлемді қолданбалар үшін, кредит шығындары жоқ

Сынау Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Келесіге ең қолайлы: Құрастыру және ойын-сауық қолданбалары үшін дыбыс эффекттерімен аудионы құру

Сынау Bark

TTS API- ны қалай біріктіру керек

Жазылудан бастап бірінші API шақыруына дейін 5 минуттан аз уақыт

1

API кілтіңізді алу

Тіркелгіңіздің басқару панелінен API кілтін құру үшін тегін тіркеліңіз. 15,000 таңба кіреді.

2

Бірінші қоңырауыңыз

POST /v1/tts мәтінмен, модельмен және дауыспен. Аудио байттарын қайтару. 5 жол код.

3

Модельіңізді таңдаңыз

Сіздің қолданыс жағдайыңыз үшін түрлі модельдерді сынап көріңіз. Жылдамдық, сапа және бір буынның бағасын салыстырыңыз.

4

Өндіріске жіберу

Пайдаланылған сайын төленетін таңбалармен масштабтау. Ақылы жоспарларда тариф шектеулері жоқ. Пайдалануыңызды басқару панелінде бақылау.

Кодты жедел бастау мысалдары

TTS.ai-ді кез келген тілге REST API-мен біріктіру

Python Бейне
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Бүкіләлемдік
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI- ге сәйкес пішімі Кірістіру
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Жасаушылар TTS.ai- мен не құрастырады

Ортақ интеграциялық үлгілер мен қолданбалар

AI чат-боттары мен көмекшілеріName

Чатбот немесе AI ассистентіне дыбыс шығаруды қосыңыз. LLM жауаптары дыбыс қолдайтын интерфейстер үшін TTS арқылы беріледі. Kokoro секунд ішіндегі уақытты үнемдеу үшін тікелей сөйлесуге мүмкіндік береді. Sesame CSM табиғи уақытпен сөйлесуді шығарады.

  • LLM- дің сөйлеу конвейеріне жауап беруіName
  • Kokoro- ның секундқа дейінгі кешігіп шығуы
  • Sesame CSM- дегі сөйлеуName
  • Аудио шығару

Қолмен және дауыспен қолданбаларName

Дыбыстық мобильді қолданбаларды, қолжетімділік құралдарын, оқу қолданбаларын және тіл үйрену платформаларын құрыңыз. Біздің REST API кез келген мобильді фреймворкпен жұмыс істейді. Аудио файлдарды жүктеп алыңыз немесе тікелей клиентке жіберіңіз.

  • React Native, Flutter, Swift, Kotlin
  • Арнайы мүмкіндіктер мен оқу қолданбалары
  • Тіл үйрену платформалары
  • Аудио мазмұнын құру

SaaS өнімдері

Сіздің SaaS өніміңіздегі ақ-белгілі дауыс мүмкіндіктері. ТТС, STT, дауысты клондау, және аудио өңдеу мүмкіндіктерін платформаңызға қосыңыз. Біздің API-ні GPU инфрақұрылымын басқарусыз дауыс сервері ретінде қолданыңыз.

  • White- label дыбыс мүмкіндіктеріName
  • Графикалық процессор инфрақұрылымы қажет емес
  • Пайдалануға қарай төлеу
  • Пайдаланушыларыңызға ұсынатын 20+ үлгі

Автоматтандыру конвейерлері

CI/CD конвейерлері, мазмұнды автоматтандыру және пакеттік өңдеу жұмыс ағымдарына дыбыс генерациясын біріктіру. Электрондық кестеден мыңдаған аудио файлдарды құру, подкасттарды автоматтандыру немесе мазмұнды локализациялау конвейерлерін құру.

  • API арқылы дестелік өңдеу
  • Мазмұнды локализациялау конвейерлері
  • CI/CD интеграциясы
  • Аудио автоматтандыру үшін электрондық кестеName

API спецификациялары

Өндірістік қолданбалар үшін жасалған

20+

Тіл- дыбыс қатынасы үлгілері

100+

Дыбыстар

30+

ТілдерName

<1s

Кідіріс (Kokoro)

Жиі қойылатын сұрақтар

TTS.ai жасаушы API туралы жиі қойылатын сұрақтар

Иә. Біздің API OpenAI аудио сөйлеу пішіміне сәйкес келеді. Егер OpenAI Python не JavaScript клиент жиындарын қолдансаңыз, base_ url және api_ key параметрлерін өзгертіп TTS.ai- ге ауысуға болады. Бар кодыңыз өзгеріссіз жұмыс істейді.

Kokoro әдетте сөйлемдерді 1 секундта шығарады. CosyVoice 2- нің қолдауы бойынша, әдетте, 1- 3 секундта шығарылады. Чатботтар мен дауыс ассистенттері үшін, әдетте, мәтінді 1- 3 секундта шығарады, мәтінді ұзындығына және таңдалған үлгіге байланысты.

Тегін үлгілер (Kokoro, Piper, VITS, MeloTTS) тегін. Стандартты үлгілер 1K мәтінге 2x таңбаны пайдаланады. Премиум үлгілер 1K мәтінге 4x таңбаны пайдаланады. 15,000 таңбамен тегін тіркеліңіз. 500,000 таңба үшін жоспарлар $9/ айдан басталады.

Иә. Сілтеме аудио үлгісін (5- 30 секунд) дауысты клондау аяқтау нүктесіне жүктеп беріңіз, содан кейін клондалған дауыс идентификаторы келесі TTS сұраныстарында қолданылсын. Клондауды қолдайтын модельдер: CosyVoice 2, Chatterbox, Fish Speech және GPT- SoVITS.

Тегін деңгейде негізгі жылдамдық шектеулері бар (тіркелгісіз сағат сайын 3 сұраныс). Ақылы деңгейде өндірістік қолданбаларға ыңғайлы кеңейтілген жылдамдық шектеулері бар. Кәсіпорын деңгейіндегі өтімділік талаптары үшін бізбен байланысыңыз.

WAV (сыйымдылығы жоғары, сығусыз), MP3 (сығусыз, ірі файлдар), OGG (ашық пішім) және FLAC (жоғалтусыз сығу). Сұрауда пішімдерді келтіріңіз. Әдетте, үлгінің өзінің дискреттеу жиілігімен WAV.

Иә. Тілдің дыбысын жазу API- ны сөйлеуден мәтінге модельмен және LLM- мен біріктіріп, толық дыбыс ассистентінің конвейерін құрыңыз. Kokoro секунд ішіндегі кешіктіруді ұсынады, бұл шынайы уақыттағы әңгіме үшін өте жақсы. CosyVoice 2 сонымен қатар, жауап беру уақытын қысқарту үшін, ағындық шығаруды қолдайды.

CosyVoice 2 және Kokoro аудио шығаруды ағынмен жеткізуді қолдайды, онда аудио бөліктер құрылған кезде беріледі. Бұл дыбыс ассистенттері мен интерактивті тәжірибелер сияқты нақты уақыт қолданбаларында бірінші байтқа дейінгі уақытты қысқартады.

API стандартты HTTP күй- жай кодтарын қайтарады. 5xx қателерді және жылдамдық шегі жауаптарын экспоненциалды түрде азайтады. Критикалық қолданбаларға қайталау логикасы бар кезекті қосады. API жұмыс уақыты ұзақ, бірақ қателерді оңай өңдеу әрқашан ұсынылады.

Иә. / v1/ voices және / v1/ models аяқтау нүктелері барлық қол жетімді дауыстар мен үлгілердің JSON тізімдерін және олардың метадеректерін (тілді қолдау, сапа рейтингі, жылдамдық рейтингі, баға деңгейі) қайтарады. Оларды қолданбаңыздағы динамикалық үлгі таңдағыштарын құру үшін қолданыңыз.

Еркін үлгілер (Kokoro, Piper, VITS, MeloTTS) ақысыз болғандықтан, тиімді сынау ортасы ретінде қызмет етеді. Еркін үлгілермен біріктіруді сынап көріңіз, содан кейін үлгінің параметрін өзгертіп, өндірістік үлгілерге ауысыңыз. Ерекше сынау ортасы қажет емес.

Біздің модельдердің көпшілігі ашық көзді және өздігінен хостталатын. Бірақ, өздігінен хостталу үшін айтарлықтай графикалық процессор ресурстары қажет (біз 4x NVIDIA Tesla P40 және жалпы 96GB VRAM қолданамыз). API инфрақұрылымды басқарусыз рентабельді альтернатива ұсынады.
5.0/5 (1)

Нені жақсартуға болады? Сіздің пікіріңіз бізге қателерді түзетуге көмектеседі.

Дыбыспен жасап көруге дайынсыз ба?

API кілтін тегін алып, құруды бастаңыз. 15, 000 таңба тіркеу кезінде, тегін үлгілер, толық құжаттама.