Текст для речи API для разработчиков

Создайте голосовые приложения с нашим REST API. Добавить естественный текст-спирт, клонирование голоса, речь-текст и аудиообработка в ваши приложения, чатботы, голосовые ассистенты и продукты SaaS. OpenAI-совместимый формат, 20+ модели, простая интеграция.

РЕСТ API Чатботы Голосовые приложения Продукты Saas Автоматизация

Попробуй сейчас.

Бесплатно с Кокоро, Пайпер, VITS, MeloTTS
Твой спродюсированный звук появится здесь.
Генерированные
0:00
Загрузка
Нравится TTS.ai? Расскажите друзьям!

API Особенности для разработчиков

Всё, что нужно для создания голосовых приложений

Простый РАСТ API

Один запрос POST для подготовки речи. Запрос JSON, аудиоответ. Работает с любым языком программирования, поддерживающим HTTP.

OpenAI-Cовместимый

Замена OpenAI TTS API. Переключите базовый ключ_url и API — существующий код работает немедленно.

24+ Имеющиеся модели

Доступ к каждой модели через единый API. Переключение моделей путем изменения одного параметра. Сравните качество, скорость и стоимость.

Вторая ступень

Кокоро производит звук в течение 1 секунды. Идеально подходит для болтовни в реальном времени, голосовых ассистентов и интерактивных приложений.

Голос клонирования API

Скопируйте любой голос из короткого звукового образца через API. Используйте клонированные голоса для всех последующих поколений.

Множественные форматы

Выход в виде WAV, MP3, OGG или FLAC. Выберите скорость отбора проб и глубину бита.

Наилучшие модели интеграции разработчиков

Выберите правильную модель для требований к скорости, качеству и стоимости приложения.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Лучший для: Самая быстрая модель — подвторая латентность, идеальная для приложений в реальном времени и чатботов

Попробуй Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Клонирование голоса

Лучший для: Установка TTS с клонированием голоса для приложений для голосовых ассистентов

Попробуй CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Лучший для: Переговорный АИ с естественным временем для болтовни и ассистента голоса

Попробуй Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Лучший для: Бесплатная модель только для высокообъемных прикладных программ при нулевой стоимости

Попробуй Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Лучший для: Аудиовизуальное поколение с звуковыми эффектами для творческих и развлекательных приложений

Попробуй Bark

Как интегрировать TTS API

От регистрации до первого вызова API менее 5 минут

1

Возьмите ключ API

Зарегистрируйтесь бесплатно и создайте ключ API из вашей панели счетов. Включая 15 000 символов.

2

Сделай свой первый звонок

POST - /v1/tts с текстом, моделью и голосом.

3

Выберите свою модель

Проверьте различные модели для вашего варианта использования. Сравните скорость, качество и стоимость на поколение.

4

Судно для производства

Шкала с распределительными персонажами. Никаких ограничений по ставкам для платных планов. Отслеживайте использование в приборной панели.

Примеры кода быстрого запуска

Включить TTS.ai на любом языке с нашим REST API

Python Популярный
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Универсальный
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-Cовместимый формат Прибытие
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Что создатели строят с TTS.ai

Общие модели интеграции и виды применения

AI Чатботы и помощники

Добавьте голосовую передачу в ваш чатбот или ассистент АИ. Отчёты LLM через TTS для голосовых интерфейсов. Кокоро передает субсекундную латентность для переговоров в режиме реального времени. Sesame CSM генерирует разговорную речь с естественным временем.

  • Реагирование LLM на речевой трубопровод
  • Субвторая опоздание с Кокоро
  • Разговоры с Сезам КШМ
  • Сверка аудио выходов

Мобильные & голосовые приложения

Создайте голосовые мобильные приложения, инструменты доступа, приложения для чтения и платформы для изучения языка. Наш REST API работает с любой мобильной системой. Загрузить аудио файлы или поток напрямую к клиенту.

  • Реакция коренного населения, флютера, свифта, Котлина
  • Доступность и приложения для чтения
  • Лингвистические учебные платформы
  • Аудиосодержание

Продукты Saas

Включите TTS, STT, клонирование голоса и аудиообработку в качестве параметров вашей платформы. Используйте API в качестве своего голоса, не управляя инфраструктурой GPU.

  • Характеристики голоса с белой маркировкой
  • Инфраструктура ГПС не требуется
  • Ценообразование на основе оплаты за пользование
  • 20+ модели, предлагаемые вашим пользователям

Автоматизированные трубопроводы

Интегрировать голосовое производство в трубопроводы CI/CD, автоматизацию контента и процесс обработки пакетов. Создавать тысячи аудиофайлов из таблиц данных, автоматизировать производство подкастов или создавать трубопроводы локализации контента.

  • Обработка партии через API
  • Трубопроводы локализации содержания
  • Интеграция CI/CD
  • Распределить лист для автоматизации звука

Спецификации API

Построено для производственных целей

20+

Модели TTS

100+

Голоса

30+

Знание языков

<1s

Легенда (Кокоро)

Часто задаваемые вопросы

Общие вопросы о TTS.ai разработчиках API

Да. Наш API следует формату звуковой речи OpenAI. Если вы используете библиотеку клиентов OpenAI Python или JavaScript, вы можете переключиться на TTS.ai, изменяя параметры базы_url и api_ ключа. Ваш существующий код работает без изменений.

Кокоро генерирует звук менее 1 секунды для типичных предложений. " CosyVoice 2 " поддерживает выход потока для еще более низкой предполагаемой запоздалости. Для чатботов и голосовых ассистентов общее время круглосуточного путешествия обычно составляет 1-3 секунды в зависимости от длины текста и выбора модели.

Свободные модели (Kokoro, Piper, VITS, MeloTTS) полностью свободны. Стандартные модели используют 2 x символов на 1K текста. Премиальные модели используют 4x символов на 1K текста. Запишитесь бесплатно с 15 000 символами. Планы начинаются с 9 000 в месяц для 500 000 символов.

Да. Загрузить эталонный аудио образец (5-30 секунд) в точку клонирования голоса, затем использовать клонированный идентификатор голоса в последующих запросах TTS. Модели, которые поддерживают клонирование, включают CosyVoice 2, Chatterbox, Fish Refaction и GPT-SOVITS.

Свободный уровень имеет базовую ставку, ограничивающую (3 запроса в час без счета). Платные планы имеют щедрую ставку, подходящую для производственных приложений. Свяжитесь с нами по требованиям, предъявляемым на уровне предприятия.

WAV (некорректированное, высокое качество), MP3 (компрессированные, небольшие файлы), OGG (открытый формат) и FLAC (бесполезное сжатие). Указать формат в запросе. По умолчанию WAV является WAV по локальной частоте выборки модели.

Комбинируйте наши TTS API с речевой моделью и LLM, чтобы построить полный голосовой ассистент. Kokoro предлагает подвторую запоздалую модель для разговора в реальном времени. CosyVoice 2 поддерживает поток-выпуск для даже более низкого, по-видимому, времени реагирования.

CosyVoice 2 и Kokoro поддерживают аудиовыпуск, когда аудиовыпуски производятся по мере их создания. Это сокращает время-байт для приложений в реальном времени, таких как голосовые ассистенты и интерактивные опыты.

API возвращает стандартные коды состояния HTTP. Введите экспоненциальное отклонение для 5хх ошибок и предельных значений. Для важнейших прикладных программ, добавьте очередь с логикой ретрита. Наш API имеет высокую частоту, но упругую обработку ошибок всегда рекомендуется.

Да. /v1/фактуры и /v1/модели возвращают списки всех имеющихся голосов и моделей с их метаданными (поддержка на языке, рейтинг качества, рейтинг скорости и уровень цен). Используйте их для построения динамических выборщиков моделей в вашем приложении.

Бесплатные модели (Kokoro, Piper, VITS, MeloTTS) служат в качестве эффективной песчаной коробки, поскольку они стоят нулевых кредитов. Проверьте вашу интеграцию с бесплатными моделями, затем переключитесь на премиальные модели в производстве путем изменения параметра модели. Отдельных испытательных условий не требуется.

Большинство наших моделей являются открытыми и могут быть самоуправляемыми. Однако для самостоятельной работы требуются значительные ресурсы ГПС (мы используем 4х NVIDIA Tesla P40 с общим показателем 96GB VRAM). API является экономически эффективной альтернативой без управления инфраструктурой.
5.0/5 (1)

Твоя обратная связь помогает нам решать проблемы.

Готовы строить с помощью "Голосовой АИ"?

Возьмите свой бесплатный ключ API и начинайте строительство. 15 баллов по регистрации, бесплатные модели, полная документация.