音声翻訳

話者の声を保存しながら他の言語への音声翻訳。AIによるダビングとローカライゼーション。

ソース音声

ファイルをここにドラッグ&ドロップするか、 ブラウズ

Upload audio or video to translate. MP3, WAV, FLAC, MP4. Max 100MB.

file.mp3

0 MB
またはマイクから録音して
00:00

翻訳の設定

オリジナルのスピーカーを保持するために音声クローンを使用
3 文字 登録 利用を追跡するために

結果

オーディオをアップロードし、翻訳する言語を選択しますName

音声を翻訳中... 少し時間がかかるかもしれません

オリジナルテキスト

翻訳テキスト

翻訳オーディオ

音声翻訳の仕組み

音声をアップロード

サポートされている言語のオーディオまたはビデオファイルをアップロードします

翻訳

人工知能が話を書き起こし 目標言語に翻訳します

クローン・ボイス

翻訳音声において、オリジナルの話者の声を保持するオプション

ダウンロード

翻訳されたテキストと合成されたオーディオを目標言語に取得します

ユースケース

グローバルコミュニケーションとコンテンツのための音声翻訳

映像ダビング

オリジナルの話者の声を保持しながら、ビデオを複数の言語にダビングします。世界中の視聴者に届くYouTubeクリエイターにとって完璧です。

コンテンツのローカル化

国際市場向けのポッドキャスト、コース、プレゼンテーションを現地化します。オーディオコンテンツを簡単に翻訳して新しい聴衆に届けます。

国際会議

多国籍チームの会議録音を翻訳します。会議のメモやオーディオ要約を各チームメンバーの言語で共有します。

電子学習

教育コンテンツと講義を複数の言語に翻訳します。再録音なしに世界中の学生にコースをアクセスできるようにします。

メディア・ブロードキャスティング

ニュースセグメント、ドキュメンタリー、国際配信用の放送を自然な音声で翻訳します。

企業コミュニケーション

グローバルチームの企業発表、訓練資料、内部コミュニケーションを母国語に翻訳します。

音声翻訳プラン

無料で始め、必要に応じてアップグレード

最も人気のある
無料アカウント
  • 15,000文字無料
  • 5分音声ファイル
  • 30以上の言語ペア
  • 翻訳記録
  • SRT 字幕エクスポート
無料登録
プロ
  • 30分音声ファイル
  • オリジナルの声を保存
  • バッチ翻訳
  • APIアクセス
  • 優先処理
アップグレード

よくある質問

音声翻訳は,音声認識,テキスト翻訳,音声クローンを組み合わせ,原音声特性を保持しながら,一言語の音声を他言語の音声に変換する。

また,CosyVoice2を用いて8言語以上の音声保存を行う。

翻訳の正確さは言語ペアと音声の質に依存します。主な言語ペア (英語、スペイン語、フランス語、ドイツ語、中国語) の場合、正確さは専門的な翻訳サービスと同等です。少ない言語ペアの場合、正確さはわずかに低いかもしれません。

CosyVoice2とGPT‐SoVITSによる音声保存の品質は優れており,話者の独特な音調,ピッチ,話し方を言語間で保持している。出力は目標言語を自然に話す元の話者のように聞こえる。

はい、バッチ翻訳は API を通して利用できます。複数のオーディオファイルを送信してそれぞれの翻訳版を受け取ることができます。これはポッドキャストシリーズ全体、ビデオコース、または会議録音の翻訳に最適です。

翻訳されたオーディオはオリジナルのスピーチと同じタイミングを保ち、ビデオダビングに適しています。タイムスタンプ付きの転写を SRT フォーマットにエクスポートして、翻訳された言語の字幕を作成することもできます。

私たちのAPIは、オーディオをチャンクで処理することによって、近接リアルタイム翻訳をサポートします。インスタントではないが、パイプラインは数秒の遅延でライブシナリオを扱うことができる。多言語会議やライブプレゼンテーションに有用です。

音声保存された出力は,YouTubeのロカリゼーション,電子学習コース,企業のトレーニングビデオ,およびポストプロダクションの精密化を伴う映画のダビングに使用できる。

音声翻訳は STT、翻訳、および TTS クレジットを組み合わせています。典型的な 1 分のオーディオ翻訳は、選択したモデルによって約 5-10 クレジットを使用します。無料アカウントはサービスを試すために登録すると 50 クレジットを受け取ります。

50MBまでの MP3、WAV、OGG、FLAC、M4A、WEBM ファイルを受け付けます。最良の音声保存結果を得るには、明瞭な音声と最小限の背景雑音を持つ高品質のオーディオ (WAV または FLAC) をアップロードしてください。

音声認識モデルは,アメリカ英語,イギリス英語,オーストラリア英語,インド英語,ラテンアメリカ英語,ヨーロッパスペイン語,中国地方方言など,幅広いアクセントを扱う。

翻訳エンジンは医学、法律、技術、ビジネス用語を含む一般的なコンテンツとドメイン特有のコンテンツをよく扱います。高度に専門的なコンテンツの場合は、翻訳音声を生成する前に中間テキスト転写を見て編集することができます。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

人工知能による言語障壁の破壊

音声を30以上の言語に翻訳しながら、オリジナルの音声を保持します。無料で登録して始めてください。