语音克隆
使用 AI 复制声音生成语音 。
参考音频
拖放您的文件到这里( D), 或者 浏览浏览
Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.file.mp3
0 MB克隆模型
最小音频长度 : 5s
要读读的文字
结果成果成果成果成果成果成果成果成果成果成果
上传引用声音, 输入文字, 并生成以听到克隆声音
克隆的声音 和产生演讲...
您所保存的声音
签名签名 保存已复制的声音,供日后使用。
语音克隆如何工作
1. 上传参考音频
从您想要克隆的声音中提供10-30秒清晰的语音。 音频越清楚, 结果越好 。
2. 选择模式
从 OpenVoice、Chatterbox、CosyVoice 2 或 GPT-SOVITS 等克隆模型中选择。 每种模型对不同的语言和风格都有独特的优势 。
3. 输入文本并生成
Type the text you want spoken in the cloned voice and click generate. Download or save the voice for future use.
使用案例
供每种创造性和专业需要的语音克隆
内容创建
以您自己的声音创建一致的语音复音, 不重录 。 修正错误, 添加新区段, 或者在您的声音中生成内容, 而远离麦克风 。
多语言多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语多语
用您不会说的语言说话
游戏字符
为游戏、动画和交互式媒体创建独特的字符声音。 克隆引用声音并生成无限的对话框行 。
听音书
用你克隆的声音 高效制作音频书 无需几个小时的工作室录音
无障碍
Help people who have lost their voice to speak again using a previously recorded sample. Preserve vocal identity for personal and medical use.
品牌声音
在所有音频内容中保持一致的品牌声音。 克隆你的品牌发言人并制作营销音频、 IVR提示和公告。
最佳成果提示
do do do Do
- 使用清晰、无噪音录音
- 瞄准10至30秒钟的演讲时间
- 使用单一发言者
- 记录在安静的环境中
- 使用自然言语速度
- 首选WAV或高位位位率 MP3
Avoid
- 背景噪音或音乐
- 多名发言者参引
- 短短剪辑(3秒以下)
- 重压缩音频
- 耳语或喊叫
- 记录中的回声或回动
How Sample Length Affects Quality
The longer and cleaner your reference audio, the better the clone. Here's what to expect at each level:
| Sample Length | Clone Quality | Best For | Access |
|---|---|---|---|
| 5–10s | Basic | Quick test — captures general tone but may miss nuances | Free |
| 30–60s | Good | Solid clone for most use cases — captures tone, pace, and accent | Free |
| 2–5 min | Great | High-fidelity clone — natural inflections, consistent quality across outputs | Free Account |
| 10+ min | Excellent | Near-perfect reproduction — ideal for audiobooks, podcasts, professional use | Free Account |
| 1–2+ hrs | Studio Grade | Fine-tune a custom model on your voice — indistinguishable from original | Pro Plan |
For best results, use clean audio with a single speaker, no background music, and natural speech. WAV or FLAC format preserves the most detail.
Voice Cloning Plans
Start free, upgrade when you need more
- 5-60 second reference audio
- Basic clone quality
- Chatterbox model
- MP3 output
- 10-minute reference audio + 50 credits
- All cloning models
- HD quality mode
- Save cloned voices
- Cross-lingual cloning
- All output formats
- 2-hour+ reference audio
- Studio-grade clone quality
- Custom model fine-tuning
- Batch generation
- API access
- Priority processing