音声翻訳

話者を保存しながら他の言語に音声を翻訳しますName

ソース音声

ファイルをここにドラッグ&ドロップするか、 ブラウズ

Upload audio or video to translate. MP3, WAV, FLAC, MP4. Max 100MB.

file.mp3

0 MB
マイクで録音してください
00:00

翻訳の設定

オリジナルのスピーカーを保持するために音声クローンを使用
3 credits Sign up to track usage

結果

オーディオをアップロードし、翻訳する言語を選択しますName

音声を翻訳中... 少し時間がかかります

オリジナルのテキスト

翻訳テキスト

翻訳オーディオ

0:00 0:00

音声翻訳の仕組み

オーディオをアップロード

サポートされている言語のオーディオまたはビデオファイルをアップロード

2. 転写と翻訳

人工知能が発話を記録し 目標言語に翻訳します

クローン・ボイス

オリジナルのスピーカーを選択的に保存

ダウンロード

翻訳されたテキストと合成されたオーディオをターゲット言語に取得します

ユースケース

グローバルコミュニケーションとコンテンツのための音声翻訳

ビデオダビング

オリジナルのスピーカーを保持しながらビデオを複数の言語にダビングします

コンテンツローカライゼーション

国際市場向けのポッドキャスト、コース、プレゼンテーションを現地化します。オーディオコンテンツを簡単に翻訳して新しい聴衆に届けます。

国際会議

多国籍チームの会議録音を翻訳します。各チームメンバーに会議ノートとオーディオ要約を共有します

電子学習

教育コンテンツと講義を複数の言語に翻訳します。再録音なしに世界中の学生にコースをアクセスできるようにします。

メディアと放送

ニュースセグメント、ドキュメンタリー、国際配信のための放送を自然に聞こえる声で翻訳します。

企業コミュニケーション

グローバルチームの企業発表、訓練資料、内部コミュニケーションを母国語に翻訳します。

Speech Translation Plans

Start free, upgrade when you need more

Most Popular
Free Account
  • 50 free credits on signup
  • 5-minute audio files
  • 30+ language pairs
  • Translated transcript
  • SRT subtitle export
Sign Up Free
Pro
  • 30-minute audio files
  • Preserve original voice
  • Batch translation
  • API access
  • Priority processing
Upgrade

よくある質問

Speech translation converts spoken audio in one language into spoken audio in another language, preserving the original speaker's voice characteristics. It combines speech recognition, text translation, and voice cloning.

We support translation between 50+ languages using our speech-to-text models, and voice preservation in 8+ languages using CosyVoice 2. The most popular pairs are English ↔ Spanish, English ↔ Chinese, and English ↔ French.

Translation accuracy depends on the language pair and audio quality. For major language pairs (English, Spanish, French, German, Chinese), accuracy is comparable to professional translation services. Less common language pairs may have slightly lower accuracy.

Voice preservation quality is excellent with CosyVoice 2 and GPT-SoVITS, maintaining the speaker's unique tone, pitch, and speaking style across languages. The output sounds like the original speaker naturally speaking the target language.

はい、バッチ翻訳は API を通して利用できます。複数のオーディオファイルを送信してそれぞれの翻訳版を受け取ることができます。これは、ポッドキャストシリーズ全体、ビデオコース、または会議録音を翻訳するのに理想的です。

The translated audio maintains similar timing to the original speech, making it suitable for video dubbing. You can also export timestamped transcripts in SRT format to create aligned subtitles in the translated language.

Our API supports near-real-time translation by processing audio in chunks. While not instant, the pipeline can handle live scenarios with a few seconds of delay — useful for multilingual meetings and live presentations.

Yes, our speech translation is suitable for professional dubbing workflows. The voice-preserved output can be used for YouTube localization, e-learning courses, corporate training videos, and film dubbing with further post-production refinement.

Speech translation combines STT, translation, and TTS credits. A typical 1-minute audio translation uses approximately 5-10 credits depending on the models selected. Free accounts receive 50 credits on signup to try the service.

50MBまでの MP3、WAV、OGG、FLAC、M4A、WEBM ファイルを受け付けます。最良の音声保存結果を得るには、明瞭な音声と最小限の背景雑音を持つ高品質のオーディオ (WAV または FLAC) をアップロードしてください。

Yes, our speech recognition models handle a wide range of accents including American, British, Australian, Indian English, Latin American and European Spanish, and regional Chinese dialects. The system adapts to the speaker's accent automatically.

The translation engine handles general and domain-specific content well, including medical, legal, technical, and business terminology. For highly specialized content, you can review and edit the intermediate text transcript before generating the translated audio.
5.0/5 (1)

人工知能による言語障壁の破壊

Translate speech into 30+ languages while preserving the original voice. Sign up free to start.