Тексттан сөйләмгә API булдыручылар өчен

Безнең REST API ярдәмендә тавыш активлаштырылган кушымталарны төзегез. Сезнең кушымталарга, чатботларга, тавыш ярдәмчеләренә һәм SaaS продуктларына табигый тексттан сөйләмгә, тавыш клонлаштыруга, сүздән текстка һәм аудио эшкәртүгә өстәгез. OpenAI-га туры килә торган формат, 24+ модель, гади интеграция.

REST API Чатботлар Тел кушымталары Продуктлар Автоматлаштыру

Хәзер кулланып карагыз

0/500
Kokoro, Piper, VITS, MeloTTS белән бушлай
Your generated audio will appear here
Кулланылган
0:00 0:00
Җибәрү
TTS.ai сезгә ошадымы? Дусларыгызга сөйләгез!

Программистлар өчен API мөмкинлекләре

Сүзле кушымталарны төзү өчен сезгә кирәк булган бөтен нәрсә

Гадәти REST API

Сүзне барлыкка китерү өчен бер POST сорау. JSON сорау, аудио җавап. HTTPны яклаучы теләсә нинди программалау теле белән эшли.

OpenAI-га туры килә

OpenAI TTS API өчен төшеп төшә торган алмаш. Сезнең base_url һәм API ачкычларыгызны алмаштырыгыз — хәзерге код тиздән эшли башлый.

24+ модельләр бар

Һәрбер модельгә бер API аша керү. Бер параметрны үзгәртеп модельләрне алмаштыру. Халыкара сыйфат, тизлек һәм бәяләрне чагыштыру.

Икенчедән түбәнрәк кискенлек

Kokoro аудионы 1 секундтан да азрак вакыт эчендә барлыкка китерә. Чатботлар, тавыш ярдәмчеләре һәм интерактив кулланмалар өчен бик яхшы.

Тел клонлаштыру API

Кыска аудио үрнәгеннән API аша теләсә нинди тавышны клонлау. Клонланган тавышларны барлык киләчәк буыннар өчен куллану.

Берничә форматлар

WAV, MP3, OGG яки FLAC форматында чыгару. Дисплей тизлеген һәм бит тирәнлеген сайларга. Реаль вакытлы кулланмалар өчен аудио трансляцияләүне яклау.

Разработчик интеграциясе өчен иң яхшы модельләр

Сезнең кушымта өчен дөрес модельне сайлагыз

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Иң яхшысы: Иң тиз модель — секунд эчендә, реаль вакытлы кушымталар һәм чатботлар өчен идеаль

Өйрәнү Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Сүзләрне клонлау

Иң яхшысы: Сүз ярдәмчесе кушымталары өчен тавыш клонлаштыру белән TTS трансляциясе

Өйрәнү CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Иң яхшысы: Чатбот һәм ярдәмче тавыш өчен табигый вакыт белән сөйләшү өчен җанлы ярдәмче

Өйрәнү Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Иң яхшысы: Кредит чыгымнары юк, зур күләмдәге кушымталар өчен бушлай, процессорны гына кулланучы модель

Өйрәнү Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Иң яхшысы: Иҗади һәм күңел ачу программалары өчен тавыш эффектлары белән аудио генерацияләү

Өйрәнү Bark

TTS API-ны ничек берләштерергә

Регистрациядән беренче API чакыруга кадәр 5 минуттан азрак вакыт

1

API ачкычыгызны алырга

50 дән артык фәнни хезмәт, шул исәптән 5 монография авторы.

2

Беренче шалтыратуны ясау

/v1/tts адресына текст, модель һәм тавыш белән POST җибәрү. Аудио байтларын кайтару. 5 юл код астында.

3

Сезнең модельне сайлагыз

Сезнең куллану очрагы өчен төрле модельләрне тикшерегез. Җитештерү буенча тизлек, сыйфат һәм бәяләрне чагыштырыгыз.

4

Продукциягә җибәрү

Сез кулланган саен түләү кредитлары белән киңәйтегез. Платалы планнарда тариф чикләүләре юк. Сезнең куллануны контрольдә тотыгыз.

Кодның тиз башлау мисаллары

TTS.ai'ны безнең REST API белән теләсә нинди телдә берләштерү

Python Популяр
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Глобаль
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-га туры килә торган формат Өчпочмак
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

РФ су реестры мәгълүматлары: Титовка.

Иң киң таралган интеграция шаблоннары һәм кулланмалар

AI чатботлар һәм ярдәмчеләр

Сезнең чатбот яки AI ярдәмчесенә тавыш чыгаруны кушыгыз. LLM җавапларын тавыш активлаштырылган интерфейслар өчен TTS аша җибәрегез. Kokoro реаль вакытлы сөйләшүләр өчен секунд эчендә җавап бирә. Sesame CSM табигый вакыт белән сөйләшү сөйләмен барлыкка китерә.

  • LLM сөйләм каналына җавап бирү
  • Кокоро белән субсекундлы кискенлек
  • РФ су реестры мәгълүматлары: Семёновка.
  • Аудио чыгару

Мобиль һәм тавыш кушымталары

Сүзле мобиль кушымталар, мөмкинлекләре чикләнгән кешеләр өчен ярдәм чаралары, уку кушымталарын һәм тел өйрәнү платформаларын төзегез. Безнең REST API теләсә нинди мобиль фреймворк белән эшли. Аудио файлларны юкка чыгарыгыз яки турыдан-туры клиентка тапшырыгыз.

  • React Native, Flutter, Swift, Kotlin
  • Мөмкинлекләре чикләнгән кешеләр өчен һәм уку өчен кулланмалар
  • Тел өйрәнү платформалары
  • Аудио эчтәлекне төзү

Продуктлар

Сезнең SaaS продуктыгызда тавыш мөмкинлекләре. ТТС, STT, тавыш клонлаштыру һәм аудио эшкәртү сезнең платформагызга өстәлсен. Сезнең тавыш backend итеп безнең API кулланыгыз GPU инфраструктурасын идарә итмичә.

  • White-label тавыш сыйфатлары
  • GPU инфраструктурасы кирәкми
  • Төп мәкалә: Аурупа берлеге
  • Сезнең кулланучыларыгызга тәкъдим итәр өчен 24+ модель

Автоматлаштыру конвейерлары

CI/CD каналлары, эчтәлек автоматлаштыру һәм пакет эшкәртү эш агымнарына тавыш генерациясен берләштерегез. Электрон таблица мәгълүматларыннан меңләгән аудиофайллар булдырыгыз, подкастлар җитештерүне автоматлаштырыгыз яки эчтәлек локализациясе каналларын төзегез.

  • API аша пакетларны эшкәртү
  • Мәгълүмат локализациясе каналлары
  • CI/CD интеграциясе
  • Аудио автоматлаштыру өчен электрон таблица

API күрсәтмәләре

Продукция кушымталары өчен төзелгән

24+

TTS модельләре

100+

тавышлар

30+

Телләр

<1s

Калып:Кокоро

Кайвакыт бирелә торган сораулар

TTS.ai программалау интерфейсы турында киң таралган сораулар

Әйе. Безнең API OpenAI аудио сөйләм форматына ия. Әгәр сез OpenAI Python яки JavaScript клиент китапханәсен куллансагыз, base_url һәм api_key параметрларын үзгәртеп, TTS.ai-га күчә аласыз. Хәзерге кодыгыз үзгәрешсез эшли.

Kokoro гадәти җөмләләр өчен аудионы 1 секундтан да азрак вакыт эчендә ясый. CosyVoice 2 агымдагы чыганакны тагы да азрак вакытка җиткерүне хуплый. Чатботлар һәм тавыш ярдәмчеләре өчен, әйләнеп кайту вакыты гадәттә 1-3 секунд тәшкил итә, җөмлә озынлыгына һәм модельне сайлауга карап.

Бушлай модельләр (Kokoro, Piper, VITS, MeloTTS) 0 кредитка төшә. Стандарт модельләр 1000 символ өчен 2 кредитка төшә. Премиум модельләр 1000 символ өчен 4 кредитка төшә. 50 кредит белән бушлай теркәлегез. Планнар 500 кредит өчен ай саен 9 доллардан башлана.

Әйе. Сүзне клонлау тәмамлану ноктасына аудио үрнәген (5-30 секунд) йөкләгез, аннан соң клонланган тавыш идентификаторын ТТС сорауларында кулланыгыз. Клонлауны яклаучы модельләр арасында CosyVoice 2, Chatterbox, Fish Speech һәм GPT-SoVITS бар.

Бушлай дәрәҗәдә төп тизлек чикләүләре бар (хисабсыз сәгать саен 3 сорау). Акча түләү планнарында зур тизлек чикләүләре бар, алар җитештерү программаларына туры килә. Корпоратив дәрәҗәдәге тизлек таләпләре өчен безгә мөрәҗәгать итегез.

WAV (сыгылмаган, иң югары сыйфатлы), MP3 (сыгылмалы, кечкенә файллар), OGG (ачык формат) һәм FLAC (йотылмыйча сыгылмалы). Сорауда форматны күрсәтегез. Әдәттә, WAV модельнең үз дискретлаштыру тизлеге белән.

Әйе. Безнең TTS API-ны сөйләм-текст моделе һәм LLM белән берләштереп, тулы тавыш ярдәмчесе каналын төзегез. Kokoro реаль вакытлы сөйләшү өчен идеаль секундка кадәрге кискенлекне тәэмин итә. CosyVoice 2 агымдагы чыганакны тагы да түбәнрәк кабул ителгән җавап вакытлары өчен яклый.

CosyVoice 2 һәм Kokoro аудио чыганакларны трансляцияләүне яклыйлар, бу очракта аудио кисәкләре алар барлыкка килгәч үк бирелә. Бу тавыш ярдәмчеләре һәм интерактив тәҗрибә кебек реаль вакытлы кулланмалар өчен беренче байтка кадәр вакытны кыскарта.

API стандарт HTTP торышы кодларын кайтара. 5xx хаталары һәм тизлек чикләүләре өчен экспоненциаль кире кайтару гамәлгә ашырыла. Миссия-критик кушымталар өчен, кабатлау логикасы белән чират куегыз. Безнең API зур эш вакытына ия, ләкин катлаулы хаталарны эшкәртү һәрвакыт киңәш ителә.

Әйе. /v1/voices һәм /v1/models тәмамлану нокталары JSON исемлекләрен кайтара, анда бар булган тавышлар һәм модельләр һәм аларның метадәресләре (телне яклау, сыйфат рейтинглары, тизлек рейтинглары һәм бәяләр дәрәҗәсе) күрсәтелгән. Аларны сезнең кулланмагызда динамик модель сайлагычларын төзү өчен кулланыгыз.

Бушлай модельләр (Kokoro, Piper, VITS, MeloTTS) нәтиҗәле чүп савыты булып хезмәт итә, чөнки алар кредитларсыз эшлиләр. Бушлай модельләр белән интеграцияләнүегезне тикшерегез, аннары модель параметрларын үзгәртеп, җитештерү өчен түләүле модельләргә күчегез. Боларга аерым тикшерү мохитләре кирәкми.

Безнең модельләрнең күбесе ачык чыганаклы һәм үз-үзенә хезмәт күрсәтә ала. Ләкин үз-үзенә хезмәт күрсәтү зур GPU ресурсларын таләп итә (без 4x NVIDIA Tesla P40 һәм 96GB VRAM кулланабыз). API инфраструктураны идарә итмичә, чыгымнар ягыннан нәтиҗәле альтернатива бирә.
5.0/5 (1)

Сез «Voice AI» белән төзергә әзерме?

Сезнең бушлай API ачкычыгызны алыгыз һәм төзелешне башлагыз. 50 кредит теркәлү, бушлай модельләр, тулы документация.