AI 语音代理 -- -- 建立相互交流的AI助理

与客户建立智能语音代理。 部署客户支持、 接待、 辅导等等 。

代理构建器

描述代理人的作用、个性、知识领域和谈话规则。

设置设置设置设置设置设置设置设置设置设置设置

语音代理人如何工作

1. 你说话

自然地和你的经纪人谈谈 你的演讲被捕获并实时流传

2. STT 链条

耳语将你的讲话转换成 准确的99种语言文本

3. LLM过程

特工的LLM脑部 使用个人和系统快速处理输入

4. TTS回应

使用您所选的声音和模式,将响应转换为自然语言。

为什么是语音代理?

以需要为规模的 AI- 动力语音代理器

24/7 24/7可用性

语音代理从不睡觉 24小时接听电话和谈话

多种语文

以30+种语言支持有自然声音的客户,不需要多语种工作人员。

自定义人士a

定义你的经纪人的个性,语气和专长 每个经纪人都觉得自己独一无二

低延迟度

由优化的STT、LLM和TTS管道在专用的GPU上提供动力的次二次响应时间。

常问问题

AI代言人是对话性的AI系统,将语音识别(STT)(语言模型(LLM))和文本到语音(TTS)相结合,进行自然语音对话。 他们可以自主地回答问题、遵循指令和完成任务 — — 比如虚拟接待员或辅助代理。

语音聊天是一般目的1:1与AI的谈话。 代理是专为特定任务而设的,他们有明确的个性、知识库和工作流程。 代理可能是客户服务机,可以跟随您的常见问题解答,而语音聊天是开放式的。

客户服务机、电话IVR系统、虚拟接待员、辅导助理、销售合格机、预约定时器、交互式讲故事者、治疗伙伴、语言实践伙伴等等。

对于低时长的谈话代理商来说,Kokoro是理想的,它能产生近100x比实时快的演讲。对于更自然的对话来说,Dia TTS支持多语种对话。对于语音克隆(匹配品牌声音 ), 使用Chatterbox 或 GPT- SoVITS 。

是的。 STT管道(速记)支持99种理解语言,TTS模型,如CosyVoice 2和GPT-SOVITS支持8+语言响应。您可以建立多语种代理器,检测和响应来电语言。

终端到终端的延绳( 发声时的语音) 通常为 1-3 秒, 使用 Kokoro 用于 TTS, 使用 快速耳语用于 STT 。 这包括 STT 转录( ~ 200 ms ) 、 LLM 响应( ~ 500 ms-1s ) 和 TTS 合成 (~ 200 ms ) 。

是的,每个代理商都有一个系统快速性,可以界定其个性、知识、基调和行为规则。你可以把它变成正式或随意的,设定主题界限,确定升级规则,控制如何处理未知问题。

是的,使用我们的STT API进行语音识别,使用任何LLM API用于情报,使用TTS API进行语音输出。我们的OpenAI兼容端点使整合直截了当。Pro和企业计划包括 API 访问。

是的,将我们的语音代理API与Twilio、Vonage或Plivo等电话平台连接,以建立基于电话的IVR系统、外传呼叫机器人和全天候处理电话的虚拟接待员。

代理成本取决于所使用的模型。 自由级模型( Kokoro, Piper) 成本为 TTS 0 个字符 。 STT 每分钟1,000 个字符 。 LLM 成本取决于您的提供商 。 启动计划( 9/ mo) 包含500,000 个字符, 足够数百个代理互动 。

是的。 使用我们的声音克隆功能从一个短音样样本中( 短至5秒) 创建自定义的声音。 像 Chatterbox 和 GPT- SoVITS 这样的模型可以克隆你的声音或任何品牌的声音, 以取得一致的代理经验 。

是的。 所有处理都发生在我们专用的 GPU 服务器上。 我们不会在处理后存储对话记录或音频。 没有与第三方共享数据或用于培训。 企业计划提供了额外的数据隔离选项 。
5.0/5 (1)

我们能改进什么?您的反馈帮助我们解决问题。

建立您的第一声音代理

在几分钟内创建智能语音代理。 免费注册并获得50个学分开始建设。