АПИ текста за говор за програмере
Градите програме омогућене гласом са АПИ‐ ом. Додајте природни текст- у- говор, клонирање, говор- у- текст, и обраду звука у ваше апликације, чатоботе, гласовне помоћнике и сааС производе. Компатибилан формат, 20+ модела, једноставна интеграција.
Пробај сада.
АПИ могућности за програмере
Све што вам је потребно да направите програме омогућене гласом
Једноставни АПИ
Један захт› јев ПОСТ‐ а за стварање говора. ЈСОН захт› јев, аудио одговор. Ради са било којим програмским језиком који подржава ХТТП.
~@ ¦ОпенАИ¦OpenAI¦- компатибилан
Зам› јена за ~@ ¦ОпенАИ ТТТС¦OpenAI TTS¦. Смените кључеве base_ url и API — постојећи код ради одмах.
24+ Модели доступни
Приступите сваком моделу кроз један АПИ. Пребаците модел мењањем једног параметара. Упоредите квалитет, брзину и трошкове.
Поддруга латенција
Кокоро ствара аудио за мање од 1 секунду. Савршено за ћаскање у реалном времену, гласовне асистенте и интерактивне програме.
АПИ клонирања гласа
Клонирајте сваки глас из кратког аудио узорка преко АПИ‐ а. Користите клониране гласове за све наредне генерације.
Вишеструки формати
Излаз као WAV, MP3, OGG или FLAC. Изаберите брзину узорка и дубину бита. Стремите аудио подршку за програме у реалном времену.
Најбољи модели за интеграцију програмера
Изаберите прави модел за захтеве брзине, квалитета и трошкова програма
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Најбоље за: Најбржи модел — подсекунда латенција, идеалан за апликација у реалном времену и ћаскање
Покушај Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Најбоље за: Течење ТТС са клонирањем гласа за програме за помоћник говора
Покушај CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Најбоље за: Разговорни ВИ са природним тајмингом за ћаскање и помоћник гласа
Покушај Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Најбоље за: Бесплатан модел ЦПУ‐ а само за програме са високим обимом са нултом трошкова кредита
Покушај Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Најбоље за: Генерација звука са звучним ефектима за програме креативног и забавногName
Покушај BarkКако интегрисати ТТС АПИ
Од пријаве до првог АПИ позива за мање од 5 минута
Донеси свој АПИ кључ
Пријавите се бесплатно и стварајте АПИ кључ са табло- табле налога. Укључено је 15.000 знакова.
Обавите први позив
ПОСТ до /v1/ tts са текстом, моделом и гласом. Вратите аудио бајтове испод 5 редова кода.
Изаберите свој модел
Пробајте различите моделе за ваше коришћење. Упоредите брзину, квалитет и трошкове по генерацији.
Брод за производњу
Скалирај са знаковима плаћања као што си ти. Нема ограничења ставки плаћених планова. Надгледај коришћење у табли.
Прим› јери брзог почетка
Интегриши TTS.ai на било који језик са нашим РЕСТА АПИ
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Шта програмери граде са TTS.ai
Заједнички обрасци и програми за интеграцију
АЛИ‐ ов ћаскалице и помоћници
Додај гласовни излаз свом чатботу или ВИ асистенту. Цеви ЛЛМ одговоре преко ТТС- а за сучеља омогућена гласом. Кокоро добавља подсекунда латенције за разговоре у реалном времену. Сезаме ЦСМ ствара разговорни говор са природним тајмингом.
- ЛЛМ одговор на говорни цевовод
- Подсекунда латенција са Кокоро
- Разговорни говор са Сезаме ЦСМ
- Ток аудио излаза
мобилни & гласовни програми
Изградите мобилне програме омогућене гласом, алатке за приступачност, програме за читање и платформе за учење језика. НАШ РЕСТ АПИ ради са било којим мобилним оквиром. Преузмите аудио фајлове или ток директно клијенту.
- Реагирајте домородце, флетер, Свифт, Котлин
- Приступачност и програм за читање
- платформе за учење језика
- Стварање аудио садржаја
СааС производи
Способности за гласање беле ознаке у производу СааС. Додајте ТТС, СТТ, клонирање гласа и обраду звука као могућности у платформи. Користите АПИ као позадину гласа без управљања инфраструктуром ГПУ.
- Могућности б› ијелог говора
- ГПУ инфраструктура није потребна
- Цене за плаћање по коришћењу
- 20+ модела за понуду корисницима
Аутоматизација цеви
Интегриши генерацију гласа у ЦИ/ ЦД цевоводе, аутоматизацију садржаја и пакетну обраду радних токова. Генерирајте хиљаде аудио фајлова из података табеле, аутоматску производњу подкаста или градите локализацију садржаја.
- Пакетна обрада преко АПИ‐ а
- Садржај нафтовода за локализацију
- Интеграција ЦИ/ ЦД‐ а
- Табела за аутоматизацију звука
Спецификације ~@ ¦АПИ‐ а¦API‐ a¦
Направљен за производне програме
20+
ТТС модели
100+
Гласови
30+
језици
<1s
Латенција (Кокоро)
Често постављана питања
Уобичајена питања о TTS.ai програмер АПИ
Твоја повратна реакција нам помаже да решимо проблеме.
Спремни да граде са гласом АИ?
Узми свој кључ од АПИ и почни са изградњом. 15 кредита за пријаву, бесплатне моделе на располагању, свеобухватна документација.