音声クローン
短いオーディオサンプルから任意の音声をクローンします。人工知能でクローンした音声で音声を生成します。
レファレンスオーディオ
ファイルをここにドラッグ&ドロップするか、 ブラウズ
Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.file.mp3
0 MBクローニングモデル
最小オーディオ長: 5s
テキストから音声を生成
結果
参照音声をアップロードし、テキストを入力してクローン音声を生成します
声をクローンし 音声を生成...
ユア・セーブド・ヴォイス
登録 クローンした声を後で使うために保存するのです
音声クローンの仕組み
1. レファレンスオーディオをアップロード
クローンしたい音声から 10-30 秒の明瞭な音声を提供してください。音声が明瞭になるほど結果は良くなります。
モデルを選択
OpenVoice, Chatterbox, CosyVoice 2, GPT-SoVITSなどのクローンモデルから選択できます。それぞれが異なる言語とスタイルに対して独自の強みを持っています。
3. テキストを入力して生成
Type the text you want spoken in the cloned voice and click generate. Download or save the voice for future use.
ユースケース
あらゆるクリエイティブかつプロフェッショナルなニーズに対応した音声クローン
コンテンツ作成
再録音なしに自分の声で一貫したボイスオーバーを作成します。ミスを修正し、新しいセグメントを追加し、またはマイクから離れた状態で自分の声でコンテンツを生成します。
多言語ダビング
あなたが知らない言葉で話して
ゲームとキャラクター
ゲーム、アニメーション、インタラクティブメディアのためのユニークなキャラクター声を作成します。参照声をクローンし、無制限の対話行を生成します。
オーディオブック
一貫した音声で本全体を語りましょう。クローン音声を使って効率的にオーディオブックを作成してください。何時間も録音する必要はありません。
アクセシビリティ
Help people who have lost their voice to speak again using a previously recorded sample. Preserve vocal identity for personal and medical use.
ブランド・ボイス
すべてのオーディオコンテンツにおいて一貫したブランドボイスを維持します。ブランドスポークスマンをクローンし、マーケティングオーディオ、IVRプロンプト、およびアナウンスを生成します。
最高の結果を得るためのヒント
ドゥ
- 明瞭でノイズのない録音を使う
- 10-30秒のスピーチを目指す
- 単一スピーカーを使う
- 静かな環境で録音
- 自然な発話ペースを使う
- WAV または高ビットレート MP3 が好ましい
Avoid
- 背景音や音楽
- 複数のスピーカーを参照
- 非常に短いクリップ (3 秒以下)
- 高圧縮オーディオ
- 囁き
- 録音時のエコーまたはリバーブ
How Sample Length Affects Quality
The longer and cleaner your reference audio, the better the clone. Here's what to expect at each level:
| Sample Length | Clone Quality | Best For | Access |
|---|---|---|---|
| 5–10s | Basic | Quick test — captures general tone but may miss nuances | Free |
| 30–60s | Good | Solid clone for most use cases — captures tone, pace, and accent | Free |
| 2–5 min | Great | High-fidelity clone — natural inflections, consistent quality across outputs | Free Account |
| 10+ min | Excellent | Near-perfect reproduction — ideal for audiobooks, podcasts, professional use | Free Account |
| 1–2+ hrs | Studio Grade | Fine-tune a custom model on your voice — indistinguishable from original | Pro Plan |
For best results, use clean audio with a single speaker, no background music, and natural speech. WAV or FLAC format preserves the most detail.
Voice Cloning Plans
Start free, upgrade when you need more
- 5-60 second reference audio
- Basic clone quality
- Chatterbox model
- MP3 output
- 10-minute reference audio + 50 credits
- All cloning models
- HD quality mode
- Save cloned voices
- Cross-lingual cloning
- All output formats
- 2-hour+ reference audio
- Studio-grade clone quality
- Custom model fine-tuning
- Batch generation
- API access
- Priority processing