オーディオからテキスト
音声ファイルをAIでテキストに変換します。MP3、WAV、M4A、FLAC、またはどんなオーディオファイルでもアップロードできます。99の言語、タイムスタンプ、およびスピーカー検出をサポートします。
ホー・イット・ワーク
音声をアップロード
音声ファイルをアップロードします。MP3、WAV、FLAC、OGG、M4A、その他のフォーマットを100MBまでサポートします。
2. 人工知能の変換
私たちのAIモデルは,あなたの音声を処理し,言語を検出し,話者を識別し,タイムスタンプを持つ正確なテキストを生成する。
ゲット・ユア・テキスト
テキストをコピーしたり、TXT または SRT 字幕フォーマットでダウンロードしたりしてください。必要に応じて編集し、細かく調整してください。
ユースケース
あらゆる産業やワークフローに対応したオーディオをテキストに変換します
ミーティングと通話
録音された会議、Zoom 通話、電話会話をテキストに変換します。アクションアイテムを見逃すことはありません。会議メモまたは検索可能な文書としてエクスポートします。
インタビュー&リサーチ
インタビュー録音を記事、研究論文、定性分析のためのテキストに変換します。話者検出は誰が何を言ったかを識別します。
ポッドキャストとオーディオコンテンツ
ポッドキャストエピソードをテキストに変換して、番組ノート、ブログポスト、SEOに使用できます。すべてのオーディオコンテンツの検索可能なアーカイブを作成します。
講演・教育
録音された講義やウェビナーをテキストに変換して、学習ノートやアクセシビリティを提供します。聴覚障害のある学生が教育コンテンツにアクセスできるようにします。
ボイスメモとメモName
電話からのボイスメモをテキストに変換します。iPhoneやAndroidのボイスレコーダーからのM4A録音を検索可能なテキスト文書に変換します。
法律・医療
証言、聴聞、相談、 diktation の録音をテキストに変換します。参考に正確なタイムスタンプを付けます。文書化可能なフォーマットにエクスポートします。
AIモデル
Whisper
OpenAIのロバスト音声認識モデルは99の言語をサポートしている。
- 99の言語
- 翻訳
- タイムスタンプ
- ノイズに強い
Faster Whisper
Whisperより4倍速く、CTranslate2最適化、同じ精度。
- 4倍速く
- 下記メモリ
- 全てのモデルサイズ
- バッチ処理
- VADフィルタリング
SenseVoice
50以上の言語の感情検出を含む音声理解モデルを開発した。
- 50以上の言語
- 感情検出
- オーディオイベント
- 話者分析
- リッチメタデータ
Audio to Text Plans
無料で始め、必要に応じてアップグレード
- 1-minute audio limit
- Faster Whisper model
- Basic transcription
- 100+ languages
- 30-minute audio + 15,000 characters
- All STT models
- Word-level timestamps
- SRT & VTT subtitle export
- Speaker diarization