Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

上传音频或视频

拖放您的文件到这里( D), 或者 浏览浏览

支持MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV的MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV。

文件. mp3

0 MB
- 或记录 从你的麦克风 -
00:00

设置设置设置设置设置设置设置设置设置设置设置

1,000/min 字符字符字符字符 签名签名 跟踪使用

脚本

上传一个音频或视频文件, 并单击 Transcrip 开始

剪辑 可能要花点时间

检测到:

如何运作

1. 上传音频或视频

上传您的音频或视频文件。 我们支持 MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV 和 MKV 格式, 最多可达 100MB 。

2. 大赦国际

我们的人工智能模型处理你的音频,探测语言,识别发言者,用时间戳生成准确的文字。

3. 获取你的脚本

复制您的笔录或以 TXT 或 SRT 字幕格式下载。 需要时编辑和精细 。

使用案例

每个行业和工作流程的音频转录

会议和会议

自动改写 Zom、 团队和 Google 的录音。 永远不要再错过一个动作项目。 以会议笔记或字幕导出 。

采访和新闻

将采访写成文章、研究论文和纪录片,

播客和媒体

为播客节目生成记录誊本和显示笔记。 创建您音频内容的可搜索档案。 在视频播客中添加字幕 。

讲座和教育

将已录制的讲座转换成学习笔记; 以准确的字幕提供教育内容无障碍; 支持有听力障碍的学生。

YouTube与社会媒体

制作YouTube视频、TikToks和社交媒体内容的字幕和封闭字幕。

法律和医疗

记录证词、听证、磋商和传说。准确的参考时间戳。出口适合文件的格式。

支持格式

记录任何音频或视频文件——我们自动提取音频

音频格式

MP3 WAV FLAC OGG M4A AAC WMA OPUS

视频格式

MP4 WebM AVI MOV MKV WMV FLV M4V

从视频文件中自动提取音频进行转录。

翻译模型

Whisper

OpenAI的强力语音识别模式支持99种语言。

  • 99种语言
  • 笔译 笔译
  • 时标
  • 强烈到噪音
OpenAI

Faster Whisper

4x比耳语速度快 具有C Translate2优化, 精确度相同。

  • 加速 4x 速度
  • 较低内存
  • 所有模型大小
  • 批次处理
  • VAD 过滤过滤
SYSTRAN

SenseVoice

语音理解模式,情感检测,50+语言。

  • 50岁以上语言
  • 情感检测
  • 音音音活动
  • 议长分析
  • 丰富元元元元数据
Alibaba (FunAudioLLM)

常问问题

直接上传您的 OGG 文件, 不需要转换。 我们的笔记本解码了 Vorbis (open-source patent-free) 流, 发送到 GPU 上的“ 更快耳语 ”, 并返回一个有时间戳的抄本, 以及可选的 SRT 和 VTT 字幕导出 。

OGG is Vorbis (open-source patent-free). It is most commonly produced by open-source applications, game engines, Wikipedia audio, and Linux-recorded files.

OGG是损失( Vorbis (open-source patent-free) ), 但损失发生在没有太多语音信息的音频带中。 更快的Wisper在96-256 kbps Vorbis时将OGG次录音记录在位于同一来源的WAV准确度的~1%之内。 真正的准确度底线是原始记录质量( 麦克、 房间、 扬声清晰度), 而不是OGG 代码。

OGG 文件一般为 1 MB/min at 128 kbps Vorbis, 所以大多数上传文件在我们的500 MB 上限下都非常有效 。 免费账户每上传最多可注册5 分钟。 支付计划最多为 2 小时 。 如果您在长文件上超过上限, 请查看处理多小时转录的音频簿/ 长式工具 。

是的 — 快速耳语支持 99 种语言, 并自动检测您OGG 文件中的口语。 如果自动检测错误语言( 口音误分类为听众母语或短片), 您也可以通过高级设置强制使用特定源语 。

是的——记录稿包括以SRT或VTT与纯文本版本一起出口的段段时间戳和字级时间戳,将原OGG(或已转换的MP4)的SRT与原OGG(或已转换的MP4)的SRT对齐,并准备出版一个字幕剪辑。

是的 。 启用高级设置中的扬声器diarization, 我们的管道运行 pyannoot. audio 在 Whisper 上方给每个扬声器贴标签。 为了在 OGG 上取得最佳效果, 请给我们至少30 秒的音频, 以使 diarizer 有足够的样本来组装语音指纹。 双声录音得到最准确的标签 。

No. Our transcriber handles OGG directly — converting to MP3 first would add a re-encoding step (potentially lossy) and waste your time. The one exception is if your OGG file uses an unusual codec our decoder does not recognize (rare); we will tell you that on upload and you can convert via our free Audio Converter.

是的, 这是 OGG 最常见的上传模式 。 更快的 Whiper 处理干净的录音、 吵闹的录音和口音- 您不需要先清理音频 。 如果准确性不是您所期望的, 请通过我们的音频增强器( 免费使用一个通道) 运行文件以去除背景噪音, 然后重试抄录入 。

5分钟以下的文件可免费发送。 付费计划每分钟使用OGG个音频,每分钟使用~1 000个字符。 60分钟的会议记录为60,000个字符; 3分钟的语音备忘录为免费。 88,000 个专用注释: 如果您的文件大部分是沉默( 如在会议录音中长时间暂停), 使语音活动探测能够跳过沉默, 只支付发言部分的费用 。

是的。 上传的 OGG 文件在我们的 GPU 服务器上处理, 并在两天内自动删除。 我们从不储存音频长期文件, 培训用户数据模型, 或与第三方共享文件。 抄本在您的账户中只要您想要, 都保留在您的账户中 。

是。 POST 您的 OGG 文件, 到 /api/ v1/ transcrip/ 作为多部分形式的数据, 与` file' 字段中的音频文件一起 。 回复包括抄录、 段时间戳、 可选单词级时间戳, 以及您可以为 SRT/ VTT 导出 URL 查看的工作 UUUID 。 可在所有付费计划中查阅 。
5.0/5 (1)

我们能改进什么?您的反馈帮助我们解决问题。

与 AI 连接音频和视频

获得99种语言的准确抄本。 免费签名, 并获得 15,000 个字符启动 。