Текст для речи API для разработчиков

Создайте голосовые приложения с нашим REST API. Добавить естественный текст-спирт, клонирование голоса, речь-текст и аудиообработка в ваши приложения, чатботы, голосовые ассистенты и продукты SaaS. OpenAI-совместимый формат, 20+ модели, простая интеграция.

РЕСТ API Чатботы Голосовые приложения Продукты Saas Автоматизация

Попробуй сейчас.

Бесплатно с Кокоро, Пайпер, VITS, MeloTTS
Твой спродюсированный звук появится здесь.
Генерированные
Загрузка
Нравится TTS.ai? Расскажите друзьям!

API Особенности для разработчиков

Всё, что нужно для создания голосовых приложений

Простый РАСТ API

Один запрос POST для подготовки речи. Запрос JSON, аудиоответ. Работает с любым языком программирования, поддерживающим HTTP.

OpenAI-Cовместимый

Замена OpenAI TTS API. Переключите базовый ключ_url и API — существующий код работает немедленно.

24+ Имеющиеся модели

Доступ к каждой модели через единый API. Переключение моделей путем изменения одного параметра. Сравните качество, скорость и стоимость.

Вторая ступень

Кокоро производит звук в течение 1 секунды. Идеально подходит для болтовни в реальном времени, голосовых ассистентов и интерактивных приложений.

Голос клонирования API

Скопируйте любой голос из короткого звукового образца через API. Используйте клонированные голоса для всех последующих поколений.

Множественные форматы

Выход в виде WAV, MP3, OGG или FLAC. Выберите скорость отбора проб и глубину бита.

Наилучшие модели интеграции разработчиков

Выберите правильную модель для требований к скорости, качеству и стоимости приложения.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Лучший для: Самая быстрая модель — подвторая латентность, идеальная для приложений в реальном времени и чатботов

Попробуй Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Клонирование голоса

Лучший для: Установка TTS с клонированием голоса для приложений для голосовых ассистентов

Попробуй CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Лучший для: Переговорный АИ с естественным временем для болтовни и ассистента голоса

Попробуй Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Лучший для: Бесплатная модель только для высокообъемных прикладных программ при нулевой стоимости

Попробуй Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Лучший для: Аудиовизуальное поколение с звуковыми эффектами для творческих и развлекательных приложений

Попробуй Bark

Как интегрировать TTS API

От регистрации до первого вызова API менее 5 минут

1

Возьмите ключ API

Зарегистрируйтесь бесплатно и создайте ключ API из вашей панели счетов. Включая 15 000 символов.

2

Сделай свой первый звонок

POST - /v1/tts с текстом, моделью и голосом.

3

Выберите свою модель

Проверьте различные модели для вашего варианта использования. Сравните скорость, качество и стоимость на поколение.

4

Судно для производства

Шкала с распределительными персонажами. Никаких ограничений по ставкам для платных планов. Отслеживайте использование в приборной панели.

Примеры кода быстрого запуска

Включить TTS.ai на любом языке с нашим REST API

Python Популярный
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Универсальный
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-Cовместимый формат Прибытие
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Что создатели строят с TTS.ai

Общие модели интеграции и виды применения

AI Чатботы и помощники

Добавьте голосовую передачу в ваш чатбот или ассистент АИ. Отчёты LLM через TTS для голосовых интерфейсов. Кокоро передает субсекундную латентность для переговоров в режиме реального времени. Sesame CSM генерирует разговорную речь с естественным временем.

  • Реагирование LLM на речевой трубопровод
  • Субвторая опоздание с Кокоро
  • Разговоры с Сезам КШМ
  • Сверка аудио выходов

Мобильные & голосовые приложения

Создайте голосовые мобильные приложения, инструменты доступа, приложения для чтения и платформы для изучения языка. Наш REST API работает с любой мобильной системой. Загрузить аудио файлы или поток напрямую к клиенту.

  • Реакция коренного населения, флютера, свифта, Котлина
  • Доступность и приложения для чтения
  • Лингвистические учебные платформы
  • Аудиосодержание

Продукты Saas

Включите TTS, STT, клонирование голоса и аудиообработку в качестве параметров вашей платформы. Используйте API в качестве своего голоса, не управляя инфраструктурой GPU.

  • Характеристики голоса с белой маркировкой
  • Инфраструктура ГПС не требуется
  • Ценообразование на основе оплаты за пользование
  • 20+ модели, предлагаемые вашим пользователям

Автоматизированные трубопроводы

Интегрировать голосовое производство в трубопроводы CI/CD, автоматизацию контента и процесс обработки пакетов. Создавать тысячи аудиофайлов из таблиц данных, автоматизировать производство подкастов или создавать трубопроводы локализации контента.

  • Обработка партии через API
  • Трубопроводы локализации содержания
  • Интеграция CI/CD
  • Распределить лист для автоматизации звука

Спецификации API

Построено для производственных целей

20+

Модели TTS

100+

Голоса

30+

Знание языков

<1s

Легенда (Кокоро)

Часто задаваемые вопросы

Общие вопросы о TTS.ai разработчиках API

Да. Наш API следует формату звуковой речи OpenAI. Если вы используете библиотеку клиентов OpenAI Python или JavaScript, вы можете переключиться на TTS.ai, изменяя параметры базы_url и api_ ключа. Ваш существующий код работает без изменений.

Кокоро генерирует звук менее 1 секунды для типичных предложений. " CosyVoice 2 " поддерживает выход потока для еще более низкой предполагаемой запоздалости. Для чатботов и голосовых ассистентов общее время круглосуточного путешествия обычно составляет 1-3 секунды в зависимости от длины текста и выбора модели.

Свободные модели (Kokoro, Piper, VITS, MeloTTS) полностью свободны. Стандартные модели используют 2 x символов на 1K текста. Премиальные модели используют 4x символов на 1K текста. Запишитесь бесплатно с 15 000 символами. Планы начинаются с 9 000 в месяц для 500 000 символов.

Да. Загрузить эталонный аудио образец (5-30 секунд) в точку клонирования голоса, затем использовать клонированный идентификатор голоса в последующих запросах TTS. Модели, которые поддерживают клонирование, включают CosyVoice 2, Chatterbox, Fish Refaction и GPT-SOVITS.

Свободный уровень имеет базовую ставку, ограничивающую (3 запроса в час без счета). Платные планы имеют щедрую ставку, подходящую для производственных приложений. Свяжитесь с нами по требованиям, предъявляемым на уровне предприятия.

WAV (некорректированное, высокое качество), MP3 (компрессированные, небольшие файлы), OGG (открытый формат) и FLAC (бесполезное сжатие). Указать формат в запросе. По умолчанию WAV является WAV по локальной частоте выборки модели.

Комбинируйте наши TTS API с речевой моделью и LLM, чтобы построить полный голосовой ассистент. Kokoro предлагает подвторую запоздалую модель для разговора в реальном времени. CosyVoice 2 поддерживает поток-выпуск для даже более низкого, по-видимому, времени реагирования.

CosyVoice 2 и Kokoro поддерживают аудиовыпуск, когда аудиовыпуски производятся по мере их создания. Это сокращает время-байт для приложений в реальном времени, таких как голосовые ассистенты и интерактивные опыты.

API возвращает стандартные коды состояния HTTP. Введите экспоненциальное отклонение для 5хх ошибок и предельных значений. Для важнейших прикладных программ, добавьте очередь с логикой ретрита. Наш API имеет высокую частоту, но упругую обработку ошибок всегда рекомендуется.

Да. /v1/фактуры и /v1/модели возвращают списки всех имеющихся голосов и моделей с их метаданными (поддержка на языке, рейтинг качества, рейтинг скорости и уровень цен). Используйте их для построения динамических выборщиков моделей в вашем приложении.

Бесплатные модели (Kokoro, Piper, VITS, MeloTTS) служат в качестве эффективной песчаной коробки, поскольку они стоят нулевых кредитов. Проверьте вашу интеграцию с бесплатными моделями, затем переключитесь на премиальные модели в производстве путем изменения параметра модели. Отдельных испытательных условий не требуется.

Большинство наших моделей являются открытыми и могут быть самоуправляемыми. Однако для самостоятельной работы требуются значительные ресурсы ГПС (мы используем 4х NVIDIA Tesla P40 с общим показателем 96GB VRAM). API является экономически эффективной альтернативой без управления инфраструктурой.
5.0/5 (1)

Твоя обратная связь помогает нам решать проблемы.

Готовы строить с помощью "Голосовой АИ"?

Возьмите свой бесплатный ключ API и начинайте строительство. 15 баллов по регистрации, бесплатные модели, полная документация.