ボイスクローン
短いオーディオサンプルからどんな声でもクローンします。AIでクローンした声で話し声を生成します。
レファレンスオーディオ
ファイルをここにドラッグ&ドロップするか、 ブラウズ
Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.file.mp3
0 MBクローニングモデル
最小オーディオ長: 5s
テキストから音声を生成
結果
参照音声をアップロードし、テキストを入力してクローン音声を生成します
声をクローンし、音声を生成...
ユア・セーブド・ヴォイス
登録 クローンした声を後で使うために保存するのです
音声クローンの仕組み
1. レファレンスオーディオをアップロード
クローンしたい音声から 10-30 秒の明瞭な音声を提供してください。音声が明瞭になるほど結果は良くなります。
モデルを選択
OpenVoice, Chatterbox, CosyVoice 2, GPT-SoVITSなどのクローンモデルから選択できます。それぞれが異なる言語とスタイルに対して独自の強みを持っています。
3. テキストを入力して生成
クローンした音声で話すテキストを入力し、生成をクリックします。将来の使用のために音声をダウンロードまたは保存します。
ユースケース
あらゆるクリエイティブかつプロフェッショナルなニーズに対応した音声クローン
コンテンツ作成
再録音なしに自分の声で一貫したボイスオーバーを作成します。マイクから離れたままに間違いを修正し、新しいセグメントを追加し、自分の声でコンテンツを生成します。
多言語ダビング
言葉を話せ
ゲームとキャラクター
ゲーム、アニメーション、対話型メディアのためのユニークなキャラクターの声を作成します。参照声をクローンし、無制限の対話行を生成します。
オーディオブック
一貫した音声で本全体を語りましょう。クローン音声を使って効率的にオーディオブックを作成してください。何時間も録音する必要はありません。
アクセシビリティ
声を失った人々が以前に録音したサンプルを使って再び話すのを助けます。個人的な用途や医療用途のために声のアイデンティティを保存します。
ブランド・ボイス
すべてのオーディオコンテンツにおいて一貫したブランドの声を維持します。ブランドのスポークスマンをクローンし、マーケティングオーディオ、IVRプロンプト、およびアナウンスを生成します。
最高の結果を得るためのヒント
どう
- 明瞭でノイズのない録音を使う
- 10-30秒のスピーチを目指す
- 単一スピーカーを使う
- 静かな環境で録音
- 自然な話し方を使う
- WAV または高ビットレート MP3 を選択
避ける
- 背景音や音楽
- 複数のスピーカーを参照
- 非常に短いクリップ (3 秒以下)
- 高圧縮オーディオ
- 囁き
- 録音時のエコーまたはリバーブ
サンプル長が品質に及ぼす影響
レファレンスオーディオが長く清潔であればあるほど、クローンは良いものになります。
| サンプル長 | クローン品質 | ベスト・フォー | アクセス |
|---|---|---|---|
| 5–10s | ベーシック | クイックテスト - 一般的な音色を捕捉しますが、ニュアンスは見逃すかもしれません | 自由 |
| 30–60s | 良い | ほとんどのユースケースに適したソリッドクローン — 音調、ペース、アクセントを捕捉 | 自由 |
| 2–5 min | 偉大な | ハイ・フィデリティ・クローン - 自然な屈折、出力間の一貫した品質 | 無料アカウント |
| 10+ min | 優秀 | ほぼ完璧な再生 — オーディオブック、ポッドキャスト、プロの使用に最適 | 無料アカウント |
| 1–2+ hrs | スタジオ・グレード | 自分の声のカスタムモデルを微調整します - オリジナルと区別できません | プロプラン |
最高の結果を得るには、背景音楽なしの単一スピーカーで、自然な音声を使用してください。WAV または FLAC フォーマットは最も詳細を保つものです。