バグ/機能要求を報告

オーディオとビデオを転写

音声やビデオファイルをAIでテキストに変換します。MP3、MP4、WAV、MOV、またはどんなメディアファイルでもアップロードできます。99の言語、タイムスタンプ、および話者検出をサポートします。

無料登録

音声またはビデオをアップロード

ファイルをここにドラッグ＆ドロップするか、ブラウズ

ファイル形式は MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV がサポートされています。フリー版は最大500MB、プロ版は最大2GBまで。

またはマイクから録音して

00:00

設定

モデル

言語

タイムスタンプを含める

話者の透析

1,000/min 文字 — 登録利用を追跡するために

転写

音声またはビデオファイルをアップロードし、転写をクリックして開始します

ホー・イット・ワーク

1. 音声またはビデオをアップロード

音声やビデオファイルをアップロードします。最大100MBまでの MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV フォーマットをサポートします。

人工知能翻訳

私たちのＡＩモデルは，あなたの音声を処理し，言語を検出し，話者を識別し，タイムスタンプを持つ正確なテキストを生成する。

ゲット・ユア・トランスクリプト

字幕をコピーしたり、TXT または SRT 字幕フォーマットでダウンロードしたりしてください。必要に応じて編集し、細かく調整してください。

ユースケース

あらゆる産業やワークフローに対応したオーディオ転写

会議

Zoom、Teams、Google Meet の録音を自動的に転写します。アクションアイテムを二度と見逃すことはありません。会議メモまたは字幕としてエクスポートします。

インタビューとジャーナリズム

記事、研究論文、ドキュメンタリーのためのインタビューの記録を作成します。スピーカーダイアリズムは誰が何を言ったかを特定し、簡単に属性を特定します。

ポッドキャストとメディア

ポッドキャストのエピソードの記録を作成し、ノートを表示します。オーディオコンテンツの検索可能なアーカイブを作成します。ビデオポッドキャストに字幕を追加します。

講演・教育

録音した講義を学習ノートに変換します。正確なキャプションで教育コンテンツをアクセス可能にします。聴覚障害のある学生をサポートします。

ソーシャルメディア

YouTube ビデオ、TikTok、ソーシャルメディアコンテンツのための字幕と閉じたキャプションを生成します。正確な転写でアクセシビリティとSEOを改善します。

法律・医療

証言、聴聞、相談、口頭弁論を記録します。参考に正確なタイムスタンプを付けます。文書化に適したフォーマットにエクスポートします。

サポートされているフォーマット

音声やビデオファイルを転写します - オーディオを自動的に抽出します

オーディオフォーマット

MP3 WAV FLAC OGG M4A AAC WMA OPUS

動画フォーマット

MP4 WebM AVI MOV MKV WMV FLV M4V

音声はビデオファイルから自動的に抽出され，転写される。

転写モデル

Whisper

ＯｐｅｎＡＩのロバスト音声認識モデルは９９の言語をサポートしている。

99の言語
翻訳
タイムスタンプ
ノイズに強い

OpenAI

Faster Whisper

Whisperより4倍速く、CTranslate2最適化、同じ精度。

4倍速く
下記メモリ
全てのモデルサイズ
バッチ処理
VADフィルタリング

SYSTRAN

SenseVoice

５０以上の言語の感情検出を含む音声理解モデルを開発した。

50以上の言語
感情検出
オーディオイベント
話者分析
リッチメタデータ

Alibaba (FunAudioLLM)

転写計画

無料で始め、必要に応じてアップグレード

自由

1分間の音声制限
ファスター・ウィスペルモデル
基本転写
100以上の言語

最も人気のある

無料アカウント

30分音声+15,000文字
STTの車種
ワードレベルタイムスタンプ
SRT と VTT 字幕エクスポート
話者の透析

無料登録

プロ

2時間の音声ファイル
バッチ転写
優先処理
APIアクセス
カスタム語彙

アップグレード

よくある質問

音声やビデオファイル（MP3、WAV、M4A、OGG、FLAC、またはビデオフォーマット）をアップロードし、「転写」をクリックします。AIはオーディオを処理し、数秒で正確なテキストを返します。ソフトウェアのダウンロードは不要で、すべてブラウザで実行できます。

音声フォーマットは MP3、WAV、M4A、OGG、FLAC、WEBM などの一般的なオーディオフォーマットとほとんどのビデオフォーマット (MP4、AVI、MKV、MOV) をサポートします。最大ファイルサイズは 50MB です。このツールはビデオファイルから音声を自動的に抽出します。

私たちのAI転写は、明瞭な音声の95%以上の正確さを達成しています。最良の結果を得るために、Faster Whisper（オリジナルの Whisper より4倍速い）と SenseVoiceを使用しています。正確さは音声品質、背景雑音、言語に依存します。

はい、私たちの翻訳ツールは99の言語をサポートします。Faster Whisperは自動的に話されている言語を検出します。また、より正確に翻訳するために手動で指定することもできます。一般的な言語は英語、スペイン語、フランス語、ドイツ語、日本語、中国語、アラビア語です。

無料ユーザは5分までのオーディオを転写できます。有料プランは2時間までのファイルをサポートします。長い録音の場合は、バッチ処理を使ったAPIを使って、効率的に何時間ものオーディオを転写できます。

はい、すべての転写はデフォルトでセグメントレベルのタイムスタンプを含みます。単語レベルのタイムスタンプも利用可能で、単語ごとの正確な開始と終了時間を表示します。字幕やキャプションに最適です。

はい、転写出力にはタイムスタンプが含まれており、SRT、VTT、ASS 字幕ファイルとしてエクスポートできます。これは YouTube ビデオ、オンラインコース、ポッドキャスト、ソーシャルメディアコンテンツに字幕を追加するのに理想的です。

はい、我々の高度な転写モードは、音声中の異なる発話者を自動的に識別し、ラベル付けするスピーカーダイアリゼーションをサポートします。これは会議の転写、インタビュー、多人数の会話に役立ちます。

YouTube ビデオからオーディオをダウンロードし、転写のためにアップロードできます。このツールは標準のオーディオまたはビデオフォーマットを扱います。YouTubeの大量転写には、自動化されたワークフローのための API を使用してください。

アップロードされたオーディオは、セキュリティの高い GPU サーバで処理され、転写後に自動的に削除されます。私たちは、あなたのオーディオを保存、共有、または訓練のために使用することはありません。すべての転送は HTTPS を介して暗号化されます。

ファスター・ウィスペルはオーディオを4倍のリアルタイム速度で処理します。10分の録音は約2.5分で転写されます。短いクリップ（1分未満）は通常数秒で完了します。

5分までのオーディオの転写は無料です。有料プランはオーディオの持続時間に基づいて文字を使用します。約1,000文字/分。文字パックは100,000文字あたり5ドルからです。プランの詳細は、プランページをご覧ください。

5.0/5 (1)

AI でオーディオとビデオを転写します

99 言語で正確な転写を取得します。無料で登録し、15 クレジットを入手して始めてください。

無料登録価格を表示

オーディオとビデオを転写

音声またはビデオをアップロード

設定

転写

ホー・イット・ワーク

1. 音声またはビデオをアップロード

人工知能翻訳

ゲット・ユア・トランスクリプト

ユースケース

会議

インタビューとジャーナリズム

ポッドキャストとメディア

講演・教育

ソーシャルメディア

法律・医療

サポートされているフォーマット

オーディオフォーマット

動画フォーマット

転写モデル

Whisper

Faster Whisper

SenseVoice

転写計画

よくある質問

どうやって音声をテキストに変換する？

どのようなオーディオフォーマットを転写できますか？

転写はどれくらい正確ですか。

音声を他の言語に転写できますか？

音声転写には時間制限がありますか。

成績表にタイムスタンプを付けられますか？

字幕としてエクスポートできますか？

話者識別をサポートしますか？

YouTubeの動画を転写できる？

私の音声データはプライベートですか？

転写速度は？

音声転写の費用はいくらですか。

AI でオーディオとビデオを転写します