实时 TTTS
为语音代理和实时应用而建造。
TTTS如何流动工作
1. 发送文本
POST 文本到 /v1/tts/ stream/ 作为服务器- Sent Endition 请求的 POST 文本 。
2. 模型生成
Kokororo在 GPU 上填充文本并生成音频样本。
3. 流流块
以64码为基准的WAV碎片 到达SSE上空 并立即开始玩耍
4. 监听实况
用户在一秒钟内听到句子的开头,即使是在长长的输入中。
使用案例
二分空档释放出新经验的地方。
语音代理器
与人类一样快速反应的对立生物体
Dubbing 活生生的生活
实时翻译和调试流流,不设缓冲暂停。
游戏
NPC 对话框, 即时对玩家选择的反应, 没有预发的 VO 。
无障碍
屏幕阅读器和辅助工具在用户点击时开始朗读。
常问问题
我们能改进什么?您的反馈帮助我们解决问题。