Текст за говор API за разработчици
Изграждане на глас-включени приложения с нашите REST API. Добавяне на естествен текст-то-шпик, клониране на глас, говор-то-текст, и аудио обработка към вашите приложения, чатботи, гласов асистент, и SaaS продукти. OpenAI-съответстващ формат, 20+ модели, проста интеграция.
Опитай сега.
API функции за разработчици
Всичко, от което се нуждаете, за да изградите приложения с глас
Обикновено API
Един POST искане за генериране на реч. JSON искане, аудио отговор. Работи с всеки език за програмиране, който поддържа HTTP.
Компатибилно на OpenAI
Drop-in замяна на OpenAI TTS API. Превключете base_url и API ключ — съществуващ код работи незабавно.
24+ Модели на разположение
Достъп до всеки модел чрез един API. Превключете модели чрез промяна на един параметър. Сравните качество, скорост и разходи.
Подвтора латенция
Кокоро генерира аудио в под 1 секунда. Перфектно за чатботи в реално време, гласов асистент и интерактивни приложения.
Гласово клониране API
Клониране на всеки глас от къса аудио проба чрез API. Използвайте клонирани гласове за всички следващи поколения.
Многоформати
Изход като WAV, MP3, OGG или FLAC. Изберете скоростта на извадката и дълбочина на бита. Ускоряване на аудио поддръжката за приложения в реално време.
Най-добрите модели за интеграция на разработчиците
Изберете правилния модел за скоростта, качеството и разходите на вашето приложение
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Най-добро за: Най-бърз модел — подсекунда латенция, идеална за приложения в реално време и чатботи
Опитай. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Най-добро за: Пренасочване на TTS с клониране на глас за приложения за гласов асистент
Опитай. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Най-добро за: Разговорен интелигентен интелект с естествен момент за чатбот и асистентски глас
Опитай. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Най-добро за: Безплатен модел на процесора само за високообемни приложения с нулева кредитна цена
Опитай. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Най-добро за: Аудио генериране със звукови ефекти за творчески и развлекателни приложения
Опитай. BarkКак да се интегрира API на TTS
От регистрация до първия API повикване в под 5 минути
Вземи си API ключ
Регистрирайте се безплатно и генерирате API ключ от вашата акаунтна табло. 15 000 символа включени.
Обади се за първи път
POST до /v1/tts с текст, модел и глас. Вземи аудио байти обратно. Под 5 редове код.
Избор на вашия модел
Тествайте различни модели за вашия случай на употреба. Сравни скорост, качество и разходи на поколение.
Кораб за производство
Скалирайте с символи за изплащане на пари. Без ограничения на цените на платените планове. Наблюдавайте използването в вашата табло.
Примери за бързо стартиране на кода
Интегриране на TTS.ai в който и да е език с нашия REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Какво изграждат разработчиците с TTS.ai
Общи модели и приложения за интеграция
AL Чатботи и асистентки
Добавете гласов изход към вашия чатбот или AI асистент. Pipe LLM отговорите чрез TTS за гласови интерфейси. Kokoro предоставя подсекунда латенция за разговори в реално време. Sesame CSM генерира разговорно говорене с естествен момент.
- LLM отговор на речния тръбопровод
- Подсекунда латенция с Кокоро
- Разговорна реч със Сезаме CSM
- Ускоряване на аудио изхода
Мобилни & Гласови приложения
Изграждане на мобилни приложения с глас, инструменти за достъпност, четене на приложения и езикови платформи за обучение. Нашият REST API работи с всяка мобилна рамка. Сваляне на аудио файлове или поток директно към клиента.
- Реакция на местните, флейтър, Суифт, Котлин
- Достъпност и приложения за четене
- Езикови платформи за обучение
- Създаване на аудио съдържание
Продукти на SaaS
Бела маркировка Гласови възможности във вашия продукт SaaS. Добавете TTS, STT, гласово клониране, и аудио обработка като функции във вашата платформа. Използвайте нашия API като ваш гласов поддръжник, без да управлявате GPU инфраструктура.
- Гласови характеристики на белата маркировка
- Не се нуждае от инфраструктура на ГПС
- Цените за заплащане за ползване
- 20+ модели за предлагане на Вашите потребители
Автоматизиране на тръбите
Интегриране на генерирането на глас в CI/CD тръбопроводи, автоматизация на съдържанието и преработка на партиди работни потоки. Генериране на хиляди аудио файлове от електронни данни, автоматизиране на производството на подкаст, или изграждане на съдържание локализирани тръбопроводи.
- Пакетна обработка чрез API
- Местопроводи за локализиране на съдържанието
- Интеграция на CI/CD
- Електронна таблица за аудио автоматизация
API спецификации
Изградени за производствени приложения
20+
Модели на ТТС
100+
Гласове
30+
Езици
<1s
Латенция (Кокоро)
Често задавани въпроси
Общи въпроси за TTS.ai разработчик API
Какво можем да подобрим? Твоята обратна връзка ни помага да решим проблемите.
Готови ли сте за изграждане с гласова интелигенция?
Вземи си безплатния API ключ и започнете да строите. 15 000 символа на регистрация, безплатни модели на разположение, цялостна документация.