Тўлиқ вақтли TTS
Текстдан сўзга стрийминг, биринчи аудионинг кечикиши секунддан кичик. Товуш агентлари ва жонли дастурлар учун яратилган.
ТТС қандай ишлайди
1. Матнни жўнатиш
/v1/tts/stream/га POST матнини сервер-жўнатган ҳодиса талаби сифатида юбориш.
2. Модель яратилади
Kokoro матнни парчалаб, GPUда аудио намуна-намуна асосида яратади.
3. Стрим парчалари
Base64 кодланган WAV парчалари SSE орқали келиб, дарҳол тинглашга киришади.
4. Тезкор эшиттириш
Ҳаттоки узун киритмалар ҳам, фойдаланувчи бир сониядан камроқ вақт ичида жумланинг бошини эшитади.
Ишлатиш ҳолатлари
Бу ерда суб-секундлик кутиш янги тажрибани очади.
Товуш агентлари
Одамдек тез жавоб берадиган суҳбатлашиш ботлари.
Жиддий дубллаш
Буферлаштириш тўхтатишларсиз реал вақтда таржима ва дубл қилинг.
Ўйинлар
Ўйинчи танлаган ўйинга тезкор жавоб берадиган NPC диалоги, олдиндан кўрсатилган овоз йўқ.
Қўллатиш
Экран ўқитувчилари ва ёрдамчи асбоблар фойдаланувчи тугма босган заҳоти гапиришни бошлайди.
ТТС режалари
Бепул бошланг, яна кўпроқ керак бўлса янгиланг
- Kokoro стриминги (пулли модел)
- Ҳар бир авлод учун 500 ҳарф
- Ҳар бир номаълум фойдаланувчи учун кунига 10 та бепул узатма
- Биринчи аудионинг секунддан кичик кечикиши
- HTTPS орқали SSE узатиш
- 15000 аломат рўйхатдан ўтиш вақтида
- Ҳар бир оқим учун 5000 белги
- Программавий кириш учун API калити
- Юклаш тарихи
- Кунлик стрийм чеклови йўқ
- MOSS-TTS-Realtime (яқинда)
- Ҳар бир оқим учун 100,000 белги
- Авваллик GPU навбати
- Товуш агенти + Twilio интеграцияси
- Юқори тезлик чегаралари
Кўп бериладиган саволлар
Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.
Реал вақтда сўзлашувни узатиш
Кунига биринчи 10 авлод учун бепул. тўлиқ белгилар миқдорини ва APIга киришни қулфдан чиқариш учун рўйхатдан ўтинг.