VoxCPM

Default Chinese

标准标准标准标准 中文 中文 中文 Neutral VoxCPM

Default Chinese is a neutral AI 声音由 VoxCPM 文本到语音模式驱动。 这个标准一级 声音会说{ 语言} 并提供{qual} 高质量的语音合成 。 使用 { 速度} 生成速度和 { riting} /5 / { name} 的质量评级, { name} 适合 { 最佳} 。 {模型}引擎由{开发者 under the Apache 2.0 license开发,使其安全用于商业用途。 关键能力包括:{功能}。 {模型}模式还支持语音克隆——上传一个简短的音频样本,以创建保留相同质量特点的自定义声音。

尚未评级

VoxCPM示范信息

型 型 VoxCPM
开发者 OpenBMB
质量质量
速度速度 快速快速
许可证许可证许可证许可证 Apache 2.0
克隆 支助支助
级别 标准(2个贷项/1K字符)
参数参数 500M
建筑结构结构 Continuous Space + Flow Matching
培训数据 1800000 小时
年份 年份 2025

最佳利用案例 Default Chinese

基于这一声音特点的推荐申请

音频书籍和叙述

使用 Default Chinese 来用自然的流体和表达式来描述长式内容 。

视频语音语音

在YouTube视频、广告和社交媒体内容中添加专业叙事。

Apps & Access 应用程序和无障碍

快速一代让这个声音成为实时应用程序、屏幕阅读器和无障碍工具的理想。

播客和广播

适合播客、电台和专业广播的演播室质量产出。

更多 VoxCPM 声音声音声音

来自同一种TTS模式的其他声音

Default

英文 英文 英文 英文 英语 Neutral

常问问题

OpenBMB的VoxCPM 1. 5是一种新型的无象征性TTS模型,在连续空间运行,而不是离散的象征物。它产生高美度44.1kHz音频,支持3-10秒零光声音克隆,并保持各段落的一致性。跨语言克隆可以让您在中文演讲中使用英语声音,反之亦然。

VoxCPM是由OpenBMB开发的,根据Apache 2.

VoxCPM支持两种语言:英语、中文。

VoxCPM 位于标准级, 每1000个字符有2个分数。您可以在生成完整音频前预览任何 VoxCPM 声音的免费版本 。

VoxCPM 的生成速度非常快。 它几乎实时运行, 适合流流和交互式应用程序 。

VoxCPM在TTS.ai音频质量方面被评为5/5,提供演播室级的、人性化的演讲。

是的, VoxCPM 支持零光语音克隆。 上传 5 - 30 秒的参考音频, 以创建自定义声音 。

是的,VoxCPM被特别推荐为高忠实音频、音频书籍、长式内容,并具有声频一致性,其44.1赫兹音频、无代谢器、跨语言的克隆能力使得它成为这一用途的绝佳选择。

是的,VoxCPM是根据Apache 2. 0(允许商业使用)获得许可的。 VoxCPM声音产生的音频可以用于视频、播客、应用程序、游戏和其他商业项目。

是的,TTS.ai上的所有声音都使用商业许可的开放源码模型(MIT, Apache 2. 0 ) 。 生成的音频可以用于视频、播客、应用程序、游戏和其他商业应用。

POST 请求发送到 / api/ v1/ tts / 带有型号名称和语音识别码 。 在 Python、 JavaScript、 Go 和 cURL 的代码示例中, 请参见我们的 API 文件页面 。

是的, 请单击此页面上的播放按钮以听到一个样本。 您也可以在文本到语音页面上输入自定义文本, 并用任何声音生成一个自由预览 。

尝试 Default Chinese 现在

键入任何文本并听到其发言 Default Chinese. 自由使用.