报告错误/功能要求

Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

签署自由

上传音频或视频

拖放您的文件到这里( D), 或者浏览

支持MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV的MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV。

- 或记录从你的麦克风 -

00:00

设置

型

语言

包含时间戳

议长对角

1,000/min 字符 — 签名跟踪使用

脚本

上传一个音频或视频文件, 并单击 Transcrip 开始

如何运作

1. 上传音频或视频

上传您的音频或视频文件。我们支持 MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV 和 MKV 格式, 最多可达 100MB 。

2. 大赦国际

我们的人工智能模型处理你的音频,探测语言,识别发言者,用时间戳生成准确的文字。

3. 获取你的脚本

复制您的笔录或以 TXT 或 SRT 字幕格式下载。需要时编辑和精细。

使用案例

每个行业和工作流程的音频转录

会议和会议

自动改写 Zom、团队和 Google 的录音。永远不要再错过一个动作项目。以会议笔记或字幕导出。

采访和新闻

将采访写成文章、研究论文和纪录片,

播客和媒体

为播客节目生成记录誊本和显示笔记。创建您音频内容的可搜索档案。在视频播客中添加字幕。

讲座和教育

将已录制的讲座转换成学习笔记; 以准确的字幕提供教育内容无障碍; 支持有听力障碍的学生。

YouTube与社会媒体

制作YouTube视频、TikToks和社交媒体内容的字幕和封闭字幕。

法律和医疗

记录证词、听证、磋商和传说。准确的参考时间戳。出口适合文件的格式。

支持格式

记录任何音频或视频文件——我们自动提取音频

音频格式

MP3 WAV FLAC OGG M4A AAC WMA OPUS

视频格式

MP4 WebM AVI MOV MKV WMV FLV M4V

从视频文件中自动提取音频进行转录。

翻译模型

Whisper

OpenAI的强力语音识别模式支持99种语言。

99种语言
笔译
时标
强烈到噪音

OpenAI

Faster Whisper

4x比耳语速度快具有C Translate2优化, 精确度相同。

加速 4x 速度
较低内存
所有模型大小
批次处理
VAD 过滤

SYSTRAN

SenseVoice

语音理解模式,情感检测,50+语言。

50岁以上语言
情感检测
音音音活动
议长分析
丰富元数据

Alibaba (FunAudioLLM)

常问问题

直接上传您的 OGG 文件, 不需要转换。我们的笔记本解码了 Vorbis (open-source patent-free) 流, 发送到 GPU 上的“ 更快耳语 ”, 并返回一个有时间戳的抄本, 以及可选的 SRT 和 VTT 字幕导出。

OGG is Vorbis (open-source patent-free). It is most commonly produced by open-source applications, game engines, Wikipedia audio, and Linux-recorded files.

OGG是损失( Vorbis (open-source patent-free) ), 但损失发生在没有太多语音信息的音频带中。更快的Wisper在96-256 kbps Vorbis时将OGG次录音记录在位于同一来源的WAV准确度的~1%之内。真正的准确度底线是原始记录质量( 麦克、房间、扬声清晰度), 而不是OGG 代码。

OGG 文件一般为 1 MB/min at 128 kbps Vorbis, 所以大多数上传文件在我们的500 MB 上限下都非常有效。免费账户每上传最多可注册5 分钟。支付计划最多为 2 小时。如果您在长文件上超过上限, 请查看处理多小时转录的音频簿/ 长式工具。

是的 — 快速耳语支持 99 种语言, 并自动检测您OGG 文件中的口语。如果自动检测错误语言( 口音误分类为听众母语或短片), 您也可以通过高级设置强制使用特定源语。

是的——记录稿包括以SRT或VTT与纯文本版本一起出口的段段时间戳和字级时间戳,将原OGG(或已转换的MP4)的SRT与原OGG(或已转换的MP4)的SRT对齐,并准备出版一个字幕剪辑。

是的。启用高级设置中的扬声器diarization, 我们的管道运行 pyannoot. audio 在 Whisper 上方给每个扬声器贴标签。为了在 OGG 上取得最佳效果, 请给我们至少30 秒的音频, 以使 diarizer 有足够的样本来组装语音指纹。双声录音得到最准确的标签。

否。我们的传输器直接处理OGG个—— 转换为MP3, 将首先增加一个重编码步骤( 可能丢失), 浪费你的时间。唯一的例外是, 您的 OGG 文件使用异常代码, 我们的解码器不承认( rare) ; 我们将在上传时告诉你, 您可以通过免费的音频转换器转换。

是的, 这是 OGG 最常见的上传模式。更快的 Whiper 处理干净的录音、吵闹的录音和口音- 您不需要先清理音频。如果准确性不是您所期望的, 请通过我们的音频增强器( 免费使用一个通道) 运行文件以去除背景噪音, 然后重试抄录入。

5分钟以下的文件可免费发送。付费计划每分钟使用OGG个音频,每分钟使用~1 000个字符。 60分钟的会议记录为60,000个字符; 3分钟的语音备忘录为免费。 88,000 个专用注释: 如果您的文件大部分是沉默( 如在会议录音中长时间暂停), 使语音活动探测能够跳过沉默, 只支付发言部分的费用。

是的。上传的 OGG 文件在我们的 GPU 服务器上处理, 并在两天内自动删除。我们从不储存音频长期文件, 培训用户数据模型, 或与第三方共享文件。抄本在您的账户中只要您想要, 都保留在您的账户中。

是。 POST 您的 OGG 文件, 以 /api/ v1/ trancrip/ 作为多部分形式的数据, 与` file' 字段中的音频文件一起。回复包括抄录、段时间戳、可选单词级时间戳和您可以为 SRT/ VTT 导出 URL 所调查的工作 UUID。可在所有付费计划中查阅。

5.0/5 (1)

与 AI 连接音频和视频

获得99种语言的准确抄本。免费签名, 并获得 15,000 个字符启动。

签署自由视图定价

Convert OGG to Text

上传音频或视频

设置

脚本

如何运作

1. 上传音频或视频

2. 大赦国际

3. 获取你的脚本

使用案例

会议和会议

采访和新闻

播客和媒体

讲座和教育

YouTube与社会媒体

法律和医疗

支持格式

音频格式

视频格式

翻译模型

Whisper

Faster Whisper

SenseVoice

常问问题

我要如何将OGG文件抄写到文本上?

OGG文件是什么?

压缩OGG是否伤害了抄录准确性?

OGG 上传的文件大小限制是多少?

我可以改写不英语的OGG音频吗?

我可以把OGG个抄本作为字幕出口吗?

OGG个抄本能辨别不同的发言者吗?

我该把OGG改成MP3吗?

我有open-source applications, game engines, Wikipedia audio, and Linux-recorded files作为OGG——这行得通吗?

OGG个抄本多少钱?

我的OGG音频数据是私密的吗?

是否有OGG 抄录的API?

与 AI 连接音频和视频