Report Bug / Feature Request

オーディオとビデオを転写

音声やビデオファイルをAIでテキストに変換します。MP3、MP4、WAV、MOV、またはどんなメディアファイルでもアップロードできます。99の言語、タイムスタンプ、および話者検出をサポートします。

音声またはビデオをアップロード

ファイルをここにドラッグ&ドロップするか、 ブラウズ

ファイル形式

file.mp3

0 MB
またはマイクから録音して
00:00

設定

1,000/min 文字 登録 利用を追跡するために

転写

音声またはビデオファイルをアップロードし、転写をクリックして開始します

転写中... 少し時間がかかるかもしれません

検出:

ホー・イット・ワーク

1. 音声またはビデオをアップロード

音声やビデオファイルをアップロードします。最大100MBまでの MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV フォーマットをサポートします。

人工知能翻訳

私たちのAIモデルは,あなたの音声を処理し,言語を検出し,話者を識別し,タイムスタンプを持つ正確なテキストを生成する。

ゲット・ユア・トランスクリプト

字幕をコピーしたり、TXT または SRT 字幕フォーマットでダウンロードしたりしてください。必要に応じて編集し、細かく調整してください。

ユースケース

あらゆる産業やワークフローに対応したオーディオ転写

会議

Zoom、Teams、Google Meet の録音を自動的に転写します。アクションアイテムを二度と見逃すことはありません。会議メモまたは字幕としてエクスポートします。

インタビューとジャーナリズム

記事、研究論文、ドキュメンタリーのためのインタビューの記録を作成します。スピーカーダイアリズムは誰が何を言ったかを特定し、簡単に属性を特定します。

ポッドキャストとメディア

ポッドキャストのエピソードの記録を作成し、ノートを表示します。オーディオコンテンツの検索可能なアーカイブを作成します。ビデオポッドキャストに字幕を追加します。

講演・教育

録音した講義を学習ノートに変換します。正確なキャプションで教育コンテンツをアクセス可能にします。聴覚障害のある学生をサポートします。

ソーシャルメディア

YouTube ビデオ、TikTok、ソーシャルメディアコンテンツのための字幕と閉じたキャプションを生成します。正確な転写でアクセシビリティとSEOを改善します。

法律・医療

証言、聴聞、相談、口頭弁論を記録します。参考に正確なタイムスタンプを付けます。文書化に適したフォーマットにエクスポートします。

サポートされているフォーマット

音声やビデオファイルを転写します - オーディオを自動的に抽出します

オーディオフォーマット

MP3 WAV FLAC OGG M4A AAC WMA OPUS

動画フォーマット

MP4 WebM AVI MOV MKV WMV FLV M4V

音声はビデオファイルから自動的に抽出され,転写される。

転写モデル

Whisper

OpenAIのロバスト音声認識モデルは99の言語をサポートしている。

  • 99の言語
  • 翻訳
  • タイムスタンプ
  • ノイズに強い
OpenAI

Faster Whisper

Whisperより4倍速く、CTranslate2最適化、同じ精度。

  • 4倍速く
  • 下記メモリ
  • 全てのモデルサイズ
  • バッチ処理
  • VADフィルタリング
SYSTRAN

SenseVoice

50以上の言語の感情検出を含む音声理解モデルを開発した。

  • 50以上の言語
  • 感情検出
  • オーディオイベント
  • 話者分析
  • リッチメタデータ
Alibaba (FunAudioLLM)

転写計画

無料で始め、必要に応じてアップグレード

自由
  • 1分間の音声制限
  • ファスター・ウィスペルモデル
  • 基本転写
  • 100以上の言語
最も人気のある
無料アカウント
  • 30分音声+15,000文字
  • STTの車種
  • ワードレベルタイムスタンプ
  • SRT と VTT 字幕エクスポート
  • 話者の透析
無料登録
プロ
  • 2時間の音声ファイル
  • バッチ転写
  • 優先処理
  • APIアクセス
  • カスタム語彙
アップグレード

よくある質問

音声やビデオファイル(MP3、WAV、M4A、OGG、FLAC、またはビデオフォーマット)をアップロードし、「転写」をクリックします。AIはオーディオを処理し、数秒で正確なテキストを返します。ソフトウェアのダウンロードは不要で、すべてブラウザで実行できます。

音声フォーマットは MP3、WAV、M4A、OGG、FLAC、WEBM などの一般的なオーディオフォーマットとほとんどのビデオフォーマット (MP4、AVI、MKV、MOV) をサポートします。最大ファイルサイズは 50MB です。このツールはビデオファイルから音声を自動的に抽出します。

私たちのAI転写は、明瞭な音声の95%以上の正確さを達成しています。最良の結果を得るために、Faster Whisper(オリジナルの Whisper より4倍速い)と SenseVoiceを使用しています。正確さは音声品質、背景雑音、言語に依存します。

はい、私たちの翻訳ツールは99の言語をサポートします。Faster Whisperは自動的に話されている言語を検出します。また、より正確に翻訳するために手動で指定することもできます。一般的な言語は英語、スペイン語、フランス語、ドイツ語、日本語、中国語、アラビア語です。

無料ユーザは5分までのオーディオを転写できます。有料プランは2時間までのファイルをサポートします。長い録音の場合は、バッチ処理を使ったAPIを使って、効率的に何時間ものオーディオを転写できます。

はい、すべての転写はデフォルトでセグメントレベルのタイムスタンプを含みます。単語レベルのタイムスタンプも利用可能で、単語ごとの正確な開始と終了時間を表示します。字幕やキャプションに最適です。

はい、転写出力にはタイムスタンプが含まれており、SRT、VTT、ASS 字幕ファイルとしてエクスポートできます。これは YouTube ビデオ、オンラインコース、ポッドキャスト、ソーシャルメディアコンテンツに字幕を追加するのに理想的です。

はい、我々の高度な転写モードは、音声中の異なる発話者を自動的に識別し、ラベル付けするスピーカーダイアリゼーションをサポートします。これは会議の転写、インタビュー、多人数の会話に役立ちます。

YouTube ビデオからオーディオをダウンロードし、転写のためにアップロードできます。このツールは標準のオーディオまたはビデオフォーマットを扱います。YouTubeの大量転写には、自動化されたワークフローのための API を使用してください。

アップロードされたオーディオは、セキュリティの高い GPU サーバで処理され、転写後に自動的に削除されます。 私たちは、あなたのオーディオを保存、共有、または訓練のために使用することはありません。すべての転送は HTTPS を介して暗号化されます。

ファスター・ウィスペルはオーディオを4倍のリアルタイム速度で処理します。10分の録音は約2.5分で転写されます。短いクリップ(1分未満)は通常数秒で完了します。

5分までのオーディオの転写は無料です。有料プランはオーディオの持続時間に基づいて文字を使用します。約1,000文字/分。文字パックは100,000文字あたり5ドルからです。プランの詳細は、プランページをご覧ください。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

AI でオーディオとビデオを転写します

99 言語で正確な転写を取得します。無料で登録し、15 クレジットを入手して始めてください。