АПИ текста за говор за програмере

Градите програме омогућене гласом са АПИ‐ ом. Додајте природни текст- у- говор, клонирање, говор- у- текст, и обраду звука у ваше апликације, чатоботе, гласовне помоћнике и сааС производе. Компатибилан формат, 20+ модела, једноставна интеграција.

ОСТАЉАЈ АПИ Чатоти Гласовни програми СааС производи Аутоматизација

Пробај сада.

Слободно са Кокоро, Пајпер, ВИТС, МелоТТС
Овд› је ће се појавити ваш генерисани звук
генерисано
Преузми
Љубав ТТС.аи?

АПИ могућности за програмере

Све што вам је потребно да направите програме омогућене гласом

Једноставни АПИ

Један захт› јев ПОСТ‐ а за стварање говора. ЈСОН захт› јев, аудио одговор. Ради са било којим програмским језиком који подржава ХТТП.

~@ ¦ОпенАИ¦OpenAI¦- компатибилан

Зам› јена за ~@ ¦ОпенАИ ТТТС¦OpenAI TTS¦. Смените кључеве base_ url и API — постојећи код ради одмах.

24+ Модели доступни

Приступите сваком моделу кроз један АПИ. Пребаците модел мењањем једног параметара. Упоредите квалитет, брзину и трошкове.

Поддруга латенција

Кокоро ствара аудио за мање од 1 секунду. Савршено за ћаскање у реалном времену, гласовне асистенте и интерактивне програме.

АПИ клонирања гласа

Клонирајте сваки глас из кратког аудио узорка преко АПИ‐ а. Користите клониране гласове за све наредне генерације.

Вишеструки формати

Излаз као WAV, MP3, OGG или FLAC. Изаберите брзину узорка и дубину бита. Стремите аудио подршку за програме у реалном времену.

Најбољи модели за интеграцију програмера

Изаберите прави модел за захтеве брзине, квалитета и трошкова програма

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Најбоље за: Најбржи модел — подсекунда латенција, идеалан за апликација у реалном времену и ћаскање

Покушај Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Гласово клонирање

Најбоље за: Течење ТТС са клонирањем гласа за програме за помоћник говора

Покушај CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Најбоље за: Разговорни ВИ са природним тајмингом за ћаскање и помоћник гласа

Покушај Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Најбоље за: Бесплатан модел ЦПУ‐ а само за програме са високим обимом са нултом трошкова кредита

Покушај Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Најбоље за: Генерација звука са звучним ефектима за програме креативног и забавногName

Покушај Bark

Како интегрисати ТТС АПИ

Од пријаве до првог АПИ позива за мање од 5 минута

1

Донеси свој АПИ кључ

Пријавите се бесплатно и стварајте АПИ кључ са табло- табле налога. Укључено је 15.000 знакова.

2

Обавите први позив

ПОСТ до /v1/ tts са текстом, моделом и гласом. Вратите аудио бајтове испод 5 редова кода.

3

Изаберите свој модел

Пробајте различите моделе за ваше коришћење. Упоредите брзину, квалитет и трошкове по генерацији.

4

Брод за производњу

Скалирај са знаковима плаћања као што си ти. Нема ограничења ставки плаћених планова. Надгледај коришћење у табли.

Прим› јери брзог почетка

Интегриши TTS.ai на било који језик са нашим РЕСТА АПИ

Python Популарно
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL универзално
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
Формат компатибилне ~@ ¦ОпенАИ¦OpenAI¦ Упадај
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Шта програмери граде са TTS.ai

Заједнички обрасци и програми за интеграцију

АЛИ‐ ов ћаскалице и помоћници

Додај гласовни излаз свом чатботу или ВИ асистенту. Цеви ЛЛМ одговоре преко ТТС- а за сучеља омогућена гласом. Кокоро добавља подсекунда латенције за разговоре у реалном времену. Сезаме ЦСМ ствара разговорни говор са природним тајмингом.

  • ЛЛМ одговор на говорни цевовод
  • Подсекунда латенција са Кокоро
  • Разговорни говор са Сезаме ЦСМ
  • Ток аудио излаза

мобилни & гласовни програми

Изградите мобилне програме омогућене гласом, алатке за приступачност, програме за читање и платформе за учење језика. НАШ РЕСТ АПИ ради са било којим мобилним оквиром. Преузмите аудио фајлове или ток директно клијенту.

  • Реагирајте домородце, флетер, Свифт, Котлин
  • Приступачност и програм за читање
  • платформе за учење језика
  • Стварање аудио садржаја

СааС производи

Способности за гласање беле ознаке у производу СааС. Додајте ТТС, СТТ, клонирање гласа и обраду звука као могућности у платформи. Користите АПИ као позадину гласа без управљања инфраструктуром ГПУ.

  • Могућности б› ијелог говора
  • ГПУ инфраструктура није потребна
  • Цене за плаћање по коришћењу
  • 20+ модела за понуду корисницима

Аутоматизација цеви

Интегриши генерацију гласа у ЦИ/ ЦД цевоводе, аутоматизацију садржаја и пакетну обраду радних токова. Генерирајте хиљаде аудио фајлова из података табеле, аутоматску производњу подкаста или градите локализацију садржаја.

  • Пакетна обрада преко АПИ‐ а
  • Садржај нафтовода за локализацију
  • Интеграција ЦИ/ ЦД‐ а
  • Табела за аутоматизацију звука

Спецификације ~@ ¦АПИ‐ а¦API‐ a¦

Направљен за производне програме

20+

ТТС модели

100+

Гласови

30+

језици

<1s

Латенција (Кокоро)

Често постављана питања

Уобичајена питања о TTS.ai програмер АПИ

Да. Наш АПИ прати аудио говор OpenAI формат. Ако користите библиотеку OpenAI Python или ~@ ¦јаваскрипт¦JavaScript¦ клијента, можете пребацити на TTS.ai изм› ијеном параметра base_url и api_ key. Постојећи код ради без изм› јене.

Кокоро генерише аудио за мање од 1 секунду за типичне реченице. CosyVoice 2 подржава проток излаза за још мање уочаване латенције. За ћаскалице и гласовне помоћнике, укупно време тркања је обично 1-3 секунде у зависности од дужине текста и избора модела.

Бесплатни модели (Кокоро, Пајпер, ВИТС, МелоТТС) су потпуно слободни. Стандардни модели користе 2x знака по 1К текста. Премиум модели користе 4x знакова по 1К текста. Слободно се пријавите са 15.000 знакова. Планови почињу од 9 долара месечно за 500.000 знакова.

Да. Пошаљите референтни аудио узорак (5- 30 секунди) на крајњу тачку клонирања, затим користите клонирани гласовни ИД у наредним ТТС захтевима. Модели који подржавају клонирање укључују Цоси Глас 2, Цхаттербокс, Рибљи говор и ГПТ- СоВИТС.

Слободни ниво има основну стопа ограничења (3 захт› јева на сат без налога). Плаћени планови имају великодушне ограничења стопа одговарајућих за производњу програма. Контактирајте нас за захтеве протока на нивоу предузећа.

WAV (некомпресовани, највиши квалитет), MP3 (компресирани, мањи фајлови), OGG (отворени формат) и FLAC (компресирање без губитка). Задајте формат у вашем захт› јеву. Подразум› ијевано је WAV по узорку модела.

Да. Удружите наш ТТС АПИ са моделом говора- у- текст и ЛЛМ за изградњу комплетног гласовног асистента нафтовода. Кокоро обезбеђује подсекундну латенцију идеалну за разговор у реалном времену. Згодни глас 2 подржава излаз за још мање време одговора.

Пријатни глас 2 и Кокоро подржавају пренос аудио излаза где се достављају аудио парчићи док се генеришу. Ово смањује време- у- први- бајт за реалновременске програме, као што су говорни асистенти и интерактивна искуства.

АПИ враћа стандардне ХТТП кодове стања. Имплементира експоненцијално бацкофф за 5xx грешака и ограничења брзине. За програме за критичну мисију, додај ред са логиком понављања. Наш АПИ има високо вр› ијеме, али се увек препоручује отпорно руковање грешкама.

Да. Исходни крајеви /v1/ гласови и /v1/ модели враћају ~@ ¦ЈСОН¦JSON¦ списке свих доступних гласова и модела са својим метаподацима (језична подршка, квалитет рејтинг, брзина рејтинг и ниво цене). Користите ово за изградњу динамичких селектора модела у програму.

Бесплатни модели (Кокоро, Пајпер, ВИТС, МелоТТС) послужују као ефикасна песочника пошто коштају нулте кредите. Тестирајте своју интеграцију са слободним моделима, затим пребаците на премиум моделе у производњи мењањем параметра модела. Није потребно одвојено пробно окружење.

Већина наших модела је отворени извор и може да се води самостојно. Међутим, само домаћинство захтева значајне ресурсе ГПУ‐ а (користимо 4x NVIDIA Tesla P40 са укупним 96GB VRAM). АПИ обезбеђује трошкове ефикасну алтернативу без управљања инфраструктуром.
5.0/5 (1)

Твоја повратна реакција нам помаже да решимо проблеме.

Спремни да граде са гласом АИ?

Узми свој кључ од АПИ и почни са изградњом. 15 кредита за пријаву, бесплатне моделе на располагању, свеобухватна документација.