ТТС во реално време
Го пренесувам текстот во говор со подсекунда прва аудио латенција. Изградена за гласовни агенти и живи апликации.
Како функционира струјната ТТС
1. Испрати текст
Текстот на POST до / v1/ tts/ stream/ како барање за настани со серверот.
2. Моделот генерира
Кокоро го дели текстот и генерира аудио примерок по примерок на ГПУ.
3. Токови парчиња
Басе64 кодирани WAV парчиња пристигнуваат преку SSE и почнуваат да свират веднаш.
4. Слушај во живо
Корисникот го слуша почетокот на реченицата за помалку од секунда, дури и за долги влези.
Случаи за користење
Каде што подсекундата отклучува нови искуства.
Гласовни агенти
Разговорни робови кои реагираат толку брзо како човек.
Лив Дуббинг
Преведи и преведи поток во реално време без паузи за баферирање.
Игри
Дијалогот на NCC кој реагира на изборите на играчот веднаш, нема предаден ВО.
Пристапност
Читачите на екранот и асистентските алатки кои почнуваат да зборуваат во моментот кога корисникот кликнува.
Планови за TTS во реално време
Стартувај бесплатно, надоградете кога ќе ви треба повеќе
- Кокоро пренесува (слободен модел)
- 500 знаци во генерација
- 10 слободни потоци/ден за анонимен корисник
- Под-секунда прва-аудио латенција
- SSE пренесува преку HTTPS
- 15.000 знаци при пријавување
- 5.000 знакови по поток
- API- клуч за програмски пристап
- Историја на генерирањето
- Нема дневен капак на потокот
- MOSS- TTS- Реално време (кога е во живо)
- 100.000 знакови по поток
- Приоритетна GPU- редица
- Гласовен агент + Твилио интеграција
- Повисоки ограничувања на стапката
Често поставувани прашања
Твоите повратни информации ни помагаат да ги решиме проблемите.
Тековен говор во реално време
Бесплатно за првите 10 генерации на ден. Запишете се за да го отклучите целосниот додаток за карактер и пристапот на API.