TTS в режиме реального времени
Построен для голосовых агентов и приложений в прямом эфире.
Как работает ТСТ
1. Отправить текст
Текст POST в /v1/tts/stream/ в качестве запроса на проведение мероприятий с использованием сервера.
2. Генераторы моделей
Kokoro отрезает текст и создает аудиовыборку по выборке на GPU.
3. Курсовые пробки
Бэйс-64, закодированные WAV куски приходят через SSE и начинают играть немедленно.
4. < < Слушать в прямом эфире > >
Пользователи слышат начало предложения за секунду, даже при длительном вводе.
Примеры использования
Где подсекундная латентность открывает новые опыты.
Голосовые агенты
Спорные боты, которые реагируют так быстро, как и люди.
Жизненно-поглощающее
Переворачивай и держи поток в режиме реального времени без паузы буфера.
Игры
Диалог NCC, который реагирует на выбор игрока мгновенно, нет предварительного VO.
Доступность
Скриншоты и ассистивные инструменты, которые начинают говорить с момента щелчка пользователя.
Планы TTS в режиме реального времени
Начать бесплатно, обновить, когда нужно больше
- Потоки " Кокоро " (свободная модель)
- 500 знаков в расчете на одно поколение
- 10 бесплатных потоков в день на анонимного пользователя
- Подвторая очередь на запоздание
- SSE транслируется через HTTPS
- 15 000 символов при регистрации
- 5 000 шаров на один поток
- API ключ к программному доступу
- История поколений
- Нет ежедневной крышки русла
- MOSS-TTS-RealTime (когда живёт)
- 100 000 шаров на один поток
- Приоритетная очередь GPU
- Голосовой агент + интеграция Твилио
- Более высокие предельные ставки
Часто задаваемые вопросы
Твоя обратная связь помогает нам решать проблемы.
Стремительная речь в реальном времени
Для первых десяти поколений в день подписывайтесь, чтобы открыть полное пособие на персонаж и доступ к API.