Доклад " Bugg " / " Особенности запроса "

Текст для речи API для разработчиков

Создайте голосовые приложения с нашим REST API. Добавить естественный текст-спирт, клонирование голоса, речь-текст и аудиообработка в ваши приложения, чатботы, голосовые ассистенты и продукты SaaS. OpenAI-совместимый формат, 20+ модели, простая интеграция.

РЕСТ API Чатботы Голосовые приложения Продукты Saas Автоматизация

Полный редактор TTS Доктора API

Попробуй сейчас.

0/500

Бесплатно с Кокоро, Пайпер, VITS, MeloTTS

Твой спродюсированный звук появится здесь.

Откройте полный редактор TTS

API Особенности для разработчиков

Всё, что нужно для создания голосовых приложений

Простый РАСТ API

Один запрос POST для подготовки речи. Запрос JSON, аудиоответ. Работает с любым языком программирования, поддерживающим HTTP.

OpenAI-Cовместимый

Замена OpenAI TTS API. Переключите базовый ключ_url и API — существующий код работает немедленно.

24+ Имеющиеся модели

Доступ к каждой модели через единый API. Переключение моделей путем изменения одного параметра. Сравните качество, скорость и стоимость.

Вторая ступень

Кокоро производит звук в течение 1 секунды. Идеально подходит для болтовни в реальном времени, голосовых ассистентов и интерактивных приложений.

Голос клонирования API

Скопируйте любой голос из короткого звукового образца через API. Используйте клонированные голоса для всех последующих поколений.

Множественные форматы

Выход в виде WAV, MP3, OGG или FLAC. Выберите скорость отбора проб и глубину бита.

Наилучшие модели интеграции разработчиков

Выберите правильную модель для требований к скорости, качеству и стоимости приложения.

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Быстрый 5/5

Лучший для: Самая быстрая модель — подвторая латентность, идеальная для приложений в реальном времени и чатботов

Попробуй Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Средний 5/5 Клонирование голоса

Лучший для: Установка TTS с клонированием голоса для приложений для голосовых ассистентов

Попробуй CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Медленно 5/5

Лучший для: Переговорный АИ с естественным временем для болтовни и ассистента голоса

Попробуй Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Быстрый 3/5

Лучший для: Бесплатная модель только для высокообъемных прикладных программ при нулевой стоимости

Попробуй Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Медленно 4/5

Лучший для: Аудиовизуальное поколение с звуковыми эффектами для творческих и развлекательных приложений

Попробуй Bark

Как интегрировать TTS API

От регистрации до первого вызова API менее 5 минут

Возьмите ключ API

Зарегистрируйтесь бесплатно и создайте ключ API из вашей панели счетов. Включая 15 000 символов.

Сделай свой первый звонок

POST - /v1/tts с текстом, моделью и голосом.

Выберите свою модель

Проверьте различные модели для вашего варианта использования. Сравните скорость, качество и стоимость на поколение.

Судно для производства

Шкала с распределительными персонажами. Никаких ограничений по ставкам для платных планов. Отслеживайте использование в приборной панели.

Примеры кода быстрого запуска

Включить TTS.ai на любом языке с нашим REST API

Python Популярный

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Универсальный

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-Cовместимый формат Прибытие

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Свободный ключ API

Что создатели строят с TTS.ai

Общие модели интеграции и виды применения

AI Чатботы и помощники

Добавьте голосовую передачу в ваш чатбот или ассистент АИ. Отчёты LLM через TTS для голосовых интерфейсов. Кокоро передает субсекундную латентность для переговоров в режиме реального времени. Sesame CSM генерирует разговорную речь с естественным временем.

Реагирование LLM на речевой трубопровод
Субвторая опоздание с Кокоро
Разговоры с Сезам КШМ
Сверка аудио выходов

Мобильные & голосовые приложения

Создайте голосовые мобильные приложения, инструменты доступа, приложения для чтения и платформы для изучения языка. Наш REST API работает с любой мобильной системой. Загрузить аудио файлы или поток напрямую к клиенту.

Реакция коренного населения, флютера, свифта, Котлина
Доступность и приложения для чтения
Лингвистические учебные платформы
Аудиосодержание

Продукты Saas

Включите TTS, STT, клонирование голоса и аудиообработку в качестве параметров вашей платформы. Используйте API в качестве своего голоса, не управляя инфраструктурой GPU.

Характеристики голоса с белой маркировкой
Инфраструктура ГПС не требуется
Ценообразование на основе оплаты за пользование
20+ модели, предлагаемые вашим пользователям

Автоматизированные трубопроводы

Интегрировать голосовое производство в трубопроводы CI/CD, автоматизацию контента и процесс обработки пакетов. Создавать тысячи аудиофайлов из таблиц данных, автоматизировать производство подкастов или создавать трубопроводы локализации контента.

Обработка партии через API
Трубопроводы локализации содержания
Интеграция CI/CD
Распределить лист для автоматизации звука

Полная документация API

Спецификации API

Построено для производственных целей

20+

Модели TTS

100+

Голоса

30+

Знание языков

<1s

Легенда (Кокоро)

Безымянный — 15 000 символов

Часто задаваемые вопросы

Общие вопросы о TTS.ai разработчиках API

Да. Наш API следует формату звуковой речи OpenAI. Если вы используете библиотеку клиентов OpenAI Python или JavaScript, вы можете переключиться на TTS.ai, изменяя параметры базы_url и api_ ключа. Ваш существующий код работает без изменений.

Кокоро генерирует звук менее 1 секунды для типичных предложений. " CosyVoice 2 " поддерживает выход потока для еще более низкой предполагаемой запоздалости. Для чатботов и голосовых ассистентов общее время круглосуточного путешествия обычно составляет 1-3 секунды в зависимости от длины текста и выбора модели.

Свободные модели (Kokoro, Piper, VITS, MeloTTS) полностью свободны. Стандартные модели используют 2 x символов на 1K текста. Премиальные модели используют 4x символов на 1K текста. Запишитесь бесплатно с 15 000 символами. Планы начинаются с 9 000 в месяц для 500 000 символов.

Да. Загрузить эталонный аудио образец (5-30 секунд) в точку клонирования голоса, затем использовать клонированный идентификатор голоса в последующих запросах TTS. Модели, которые поддерживают клонирование, включают CosyVoice 2, Chatterbox, Fish Refaction и GPT-SOVITS.

Свободный уровень имеет базовую ставку, ограничивающую (3 запроса в час без счета). Платные планы имеют щедрую ставку, подходящую для производственных приложений. Свяжитесь с нами по требованиям, предъявляемым на уровне предприятия.

WAV (некорректированное, высокое качество), MP3 (компрессированные, небольшие файлы), OGG (открытый формат) и FLAC (бесполезное сжатие). Указать формат в запросе. По умолчанию WAV является WAV по локальной частоте выборки модели.

Комбинируйте наши TTS API с речевой моделью и LLM, чтобы построить полный голосовой ассистент. Kokoro предлагает подвторую запоздалую модель для разговора в реальном времени. CosyVoice 2 поддерживает поток-выпуск для даже более низкого, по-видимому, времени реагирования.

CosyVoice 2 и Kokoro поддерживают аудиовыпуск, когда аудиовыпуски производятся по мере их создания. Это сокращает время-байт для приложений в реальном времени, таких как голосовые ассистенты и интерактивные опыты.

API возвращает стандартные коды состояния HTTP. Введите экспоненциальное отклонение для 5хх ошибок и предельных значений. Для важнейших прикладных программ, добавьте очередь с логикой ретрита. Наш API имеет высокую частоту, но упругую обработку ошибок всегда рекомендуется.

Да. /v1/фактуры и /v1/модели возвращают списки всех имеющихся голосов и моделей с их метаданными (поддержка на языке, рейтинг качества, рейтинг скорости и уровень цен). Используйте их для построения динамических выборщиков моделей в вашем приложении.

Бесплатные модели (Kokoro, Piper, VITS, MeloTTS) служат в качестве эффективной песчаной коробки, поскольку они стоят нулевых кредитов. Проверьте вашу интеграцию с бесплатными моделями, затем переключитесь на премиальные модели в производстве путем изменения параметра модели. Отдельных испытательных условий не требуется.

Большинство наших моделей являются открытыми и могут быть самоуправляемыми. Однако для самостоятельной работы требуются значительные ресурсы ГПС (мы используем 4х NVIDIA Tesla P40 с общим показателем 96GB VRAM). API является экономически эффективной альтернативой без управления инфраструктурой.

5.0/5 (1)

Готовы строить с помощью "Голосовой АИ"?

Возьмите свой бесплатный ключ API и начинайте строительство. 15 баллов по регистрации, бесплатные модели, полная документация.

Не подписываться Вид Ценообразование

Текст для речи API для разработчиков

Попробуй сейчас.

Нравится TTS.ai? Расскажите друзьям!

API Особенности для разработчиков

Простый РАСТ API

OpenAI-Cовместимый

24+ Имеющиеся модели

Вторая ступень

Голос клонирования API

Множественные форматы

Наилучшие модели интеграции разработчиков

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Как интегрировать TTS API

Возьмите ключ API

Сделай свой первый звонок

Выберите свою модель

Судно для производства

Примеры кода быстрого запуска

Что создатели строят с TTS.ai

AI Чатботы и помощники

Мобильные & голосовые приложения

Продукты Saas

Автоматизированные трубопроводы

Спецификации API

Часто задаваемые вопросы

Соответствует ли API формату OpenAI TTS?

Какова степень запоздалости при подаче заявок в режиме реального времени?

Как ценообразование работает для использования API?

Могу я использовать клонирование голоса через API?

Есть ли ограничения по ставкам?

Какие аудиоформаты возвращают API?

Могу я использовать API для создания голосового ассистента или болта?

Есть ли ВебСокет или трансляция API?

Как мне справляться с ошибками и ретриссами в производстве?

Могу я перечислить свободные голоса и модели программно?

Есть ли песчаная коробка или испытательная среда?

Могу ли я вести себя самостоятельно с моделями вместо использования API?

Готовы строить с помощью "Голосовой АИ"?