语音克隆
使用 AI 复制声音生成语音 。
参考音频
拖放您的文件到这里( D), 或者 浏览浏览
Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.file.mp3
0 MB克隆模型
最小音频长度 : 5s
要读读的文字
结果成果成果成果成果成果成果成果成果成果成果
上传引用声音, 输入文字, 并生成以听到克隆声音
克隆的声音 和产生演讲...
您所保存的声音
签名签名 保存已复制的声音,供日后使用。
语音克隆如何工作
1. 上传参考音频
从您想要克隆的声音中提供10-30秒清晰的语音。 音频越清楚, 结果越好 。
2. 选择模式
从 OpenVoice、Chatterbox、CosyVoice 2 或 GPT-SOVITS 等克隆模型中选择。 每种模型对不同的语言和风格都有独特的优势 。
3. 输入文本并生成
输入您想要在克隆声音中使用的文本, 并单击生成。 下载或保存该声音供未来使用 。
使用案例
供每种创造性和专业需要的语音克隆
内容创建
以您自己的声音创建一致的语音复音, 不重录 。 修正错误, 添加新区段, 或者在您的声音中生成内容, 而远离麦克风 。
多语言多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语
用您不会说的语言说话
游戏字符
为游戏、动画和交互式媒体创建独特的字符声音。 克隆引用声音并生成无限的对话框行 。
听音书
用你克隆的声音 高效制作音频书 无需几个小时的工作室录音
无障碍
使用先前记录的样本帮助失去声音的人重新说话。 保留声音身份供个人和医疗使用。
品牌声音
在所有音频内容中保持一致的品牌声音。 克隆你的品牌发言人并制作营销音频、 IVR提示和公告。
最佳成果提示
do do do Do
- 使用清晰、无噪音录音
- 瞄准10至30秒钟的演讲时间
- 使用单一发言者
- 记录在安静的环境中
- 使用自然言语速度
- 首选WAV或高位位位率 MP3
避免避免
- 背景噪音或音乐
- 多名发言者参引
- 短短剪辑(3秒以下)
- 重压缩音频
- 耳语或喊叫
- 记录中的回声或回动
样本长度如何影响质量
越长,越干净 你的参考音频越好 克隆越好
| 样本长度 | 克隆质量 | 最佳 | 获得机会 |
|---|---|---|---|
| 5–10s | 基本 基本 基本 基本 | 快速测试——能捕捉一般语气,但可能忽略细微差别 | 自由 |
| 30–60s | 好 | 用于多数使用案例的固体克隆—— 记录音、 音、 音、 音、 音、 口音 | 自由 |
| 2–5 min | 太好了 | 高不忠的克隆——自然反感、各产出的一贯质量 | 自由帐户 |
| 10+ min | 好极了 | 近乎完美的复制——视听书、播客、专业用途的理想 | 自由帐户 |
| 1–2+ hrs | 演播室级 | 在你的声音上微调一个自定义的模型 — — 与原创无法区分 | Pro P计划 |
为了取得最佳效果,使用单一发言者的清洁音频、没有背景音乐和自然演讲。 WAV 或 FLAC 格式保存最详细的内容。