ТТС в реално време
Ускоряване на текст-то-спеец с подсекунда първи-аудио латенция. Построен за гласови агенти и приложения на живо.
Как действа стрийминг ТТС
1. Изпращане на текст
Текстът на POST до /v1/tts/stream/ като запитване за сървър-Сент събития.
2. Модел генерира
Kokoro засича текста и генерира аудио проба по проба на GPU.
3. Поточни парчета
Басе64-кодирани WAV парчета пристигат над SSE и започват да играят незабавно.
4. Слушайте на живо
Потребителят чува началото на изречението в под секунда, дори и при дълги входове.
Случаи за използване
Където подсекунда латенция отключва нови преживявания.
Гласови агенти
Разговорни боти, които реагират толкова бързо, колкото човек би.
Живо дърпане
Превод и дуб поток в реално време без буферни паузи.
Игри
NCC диалог, който реагира на изборите на играча незабавно, без предварително предаден VO.
Достъпност
Читатели на екрана и асистентски инструменти, които започват да говорят в момента, в който потребителят кликне.
Планове за TTS в реално време
Стартиране безплатно, ъпгрейд, когато се нуждаете от повече
- Кокоро поток (безплатен модел)
- 500 символа на поколение
- 10 безплатни потоци/дневни за анонимен потребител
- Подвтора първа аудио латенция
- SSE преминаване през HTTPS
- 15 000 символа при регистрация
- 5000 символа на поток
- API ключ за програмен достъп
- История на генерирането
- Без дневна капачка на потока
- MOSS-TTS-Реално време (когато е живо)
- 100 000 символа на поток
- Приоритетна опашка на GPU
- Гласов агент + интеграция в Твилио
- Гранични стойности на по-високите ставки
Често задавани въпроси
Какво можем да подобрим? Твоята обратна връзка ни помага да решим проблемите.
Течеща реч в реално време
Безплатен за първите 10 поколения на ден. Регистрирайте се, за да отключите пълния характер надбавка и API достъп.