报告错误/功能要求

Convert MP3 to Text

Convert MP3 files to text instantly with AI. Upload your MP3 audio and get accurate transcripts in 99 languages. Free online MP3 transcription tool.

签署自由

上传音频或视频

拖放您的文件到这里( D), 或者浏览

支持MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV的MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV。

- 或记录从你的麦克风 -

00:00

设置

型

语言

包含时间戳

议长对角

1,000/min 字符 — 签名跟踪使用

脚本

上传一个音频或视频文件, 并单击 Transcrip 开始

如何运作

1. 上传音频或视频

上传您的音频或视频文件。我们支持 MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV 和 MKV 格式, 最多可达 100MB 。

2. 大赦国际

我们的人工智能模型处理你的音频,探测语言,识别发言者,用时间戳生成准确的文字。

3. 获取你的脚本

复制您的笔录或以 TXT 或 SRT 字幕格式下载。需要时编辑和精细。

使用案例

每个行业和工作流程的音频转录

会议和会议

自动改写 Zom、团队和 Google 的录音。永远不要再错过一个动作项目。以会议笔记或字幕导出。

采访和新闻

将采访写成文章、研究论文和纪录片,

播客和媒体

为播客节目生成记录誊本和显示笔记。创建您音频内容的可搜索档案。在视频播客中添加字幕。

讲座和教育

将已录制的讲座转换成学习笔记; 以准确的字幕提供教育内容无障碍; 支持有听力障碍的学生。

YouTube与社会媒体

制作YouTube视频、TikToks和社交媒体内容的字幕和封闭字幕。

法律和医疗

记录证词、听证、磋商和传说。准确的参考时间戳。出口适合文件的格式。

支持格式

记录任何音频或视频文件——我们自动提取音频

音频格式

MP3 WAV FLAC OGG M4A AAC WMA OPUS

视频格式

MP4 WebM AVI MOV MKV WMV FLV M4V

从视频文件中自动提取音频进行转录。

翻译模型

Whisper

OpenAI的强力语音识别模式支持99种语言。

99种语言
笔译
时标
强烈到噪音

OpenAI

Faster Whisper

4x比耳语速度快具有C Translate2优化, 精确度相同。

加速 4x 速度
较低内存
所有模型大小
批次处理
VAD 过滤

SYSTRAN

SenseVoice

语音理解模式,情感检测,50+语言。

50岁以上语言
情感检测
音音音活动
议长分析
丰富元数据

Alibaba (FunAudioLLM)

常问问题

直接上传您的 MP3 文件, 不需要转换。我们的笔记本解码了 MPEG-1 Audio Layer 3 流, 发送到 GPU 上的“ 更快耳语 ”, 并返回一个有时间戳的抄本, 以及可选的 SRT 和 VTT 字幕导出。

MP3 is MPEG-1 Audio Layer 3. It is most commonly produced by podcasts, music libraries, voice memos, and downloaded audio.

MP3是损失( MPEG-1 Audio Layer 3 ), 但损失发生在没有太多语音信息的音频带中。更快的Wisper在128-320 kbps时将MP3次录音记录在位于同一来源的WAV准确度的~1%之内。真正的准确度底线是原始记录质量( 麦克、房间、扬声清晰度), 而不是MP3 代码。

MP3 文件一般为 1 MB/min at 128 kbps, 所以大多数上传文件在我们的500 MB 上限下都非常有效。免费账户每上传最多可注册5 分钟。支付计划最多为 2 小时。如果您在长文件上超过上限, 请查看处理多小时转录的音频簿/ 长式工具。

是的 — 快速耳语支持 99 种语言, 并自动检测您MP3 文件中的口语。如果自动检测错误语言( 口音误分类为听众母语或短片), 您也可以通过高级设置强制使用特定源语。

是的——记录稿包括以SRT或VTT与纯文本版本一起出口的段段时间戳和字级时间戳,将原MP3(或已转换的MP4)的SRT与原MP3(或已转换的MP4)的SRT对齐,并准备出版一个字幕剪辑。

是的。启用高级设置中的扬声器diarization, 我们的管道运行 pyannoot. audio 在 Whisper 上方给每个扬声器贴标签。为了在 MP3 上取得最佳效果, 请给我们至少30 秒的音频, 以使 diarizer 有足够的样本来组装语音指纹。双声录音得到最准确的标签。

否。我们的传输器直接处理MP3个—— 转换为WAV, 将首先增加一个重编码步骤( 可能丢失), 浪费你的时间。唯一的例外是, 您的 MP3 文件使用异常代码, 我们的解码器不承认( rare) ; 我们将在上传时告诉你, 您可以通过免费的音频转换器转换。

是的, 这是 MP3 最常见的上传模式。更快的 Whiper 处理干净的录音、吵闹的录音和口音- 您不需要先清理音频。如果准确性不是您所期望的, 请通过我们的音频增强器( 免费使用一个通道) 运行文件以去除背景噪音, 然后重试抄录入。

5分钟以下的文件可免费发送。付费计划每分钟使用MP3个音频,每分钟使用~1 000个字符。 60分钟的会议记录为60,000个字符; 3分钟的语音备忘录为免费。 88,000 个专用注释: 如果您的文件大部分是沉默( 如在会议录音中长时间暂停), 使语音活动探测能够跳过沉默, 只支付发言部分的费用。

是的。上传的 MP3 文件在我们的 GPU 服务器上处理, 并在两天内自动删除。我们从不储存音频长期文件, 培训用户数据模型, 或与第三方共享文件。抄本在您的账户中只要您想要, 都保留在您的账户中。

是。 POST 您的 MP3 文件, 以 /api/ v1/ trancrip/ 作为多部分形式的数据, 与` file' 字段中的音频文件一起。回复包括抄录、段时间戳、可选单词级时间戳和您可以为 SRT/ VTT 导出 URL 所调查的工作 UUID。可在所有付费计划中查阅。

5.0/5 (1)

与 AI 连接音频和视频

获得99种语言的准确抄本。免费签名, 并获得 15,000 个字符启动。

签署自由视图定价

Convert MP3 to Text

上传音频或视频

设置

脚本

如何运作

1. 上传音频或视频

2. 大赦国际

3. 获取你的脚本

使用案例

会议和会议

采访和新闻

播客和媒体

讲座和教育

YouTube与社会媒体

法律和医疗

支持格式

音频格式

视频格式

翻译模型

Whisper

Faster Whisper

SenseVoice

常问问题

我要如何将MP3文件抄写到文本上?

MP3文件是什么?

压缩MP3是否伤害了抄录准确性?

MP3 上传的文件大小限制是多少?

我可以改写不英语的MP3音频吗?

我可以把MP3个抄本作为字幕出口吗?

MP3个抄本能辨别不同的发言者吗?

我该把MP3改成WAV吗?

我有podcasts, music libraries, voice memos, and downloaded audio作为MP3——这行得通吗?

MP3个抄本多少钱?

我的MP3音频数据是私密的吗?

是否有MP3 抄录的API?

与 AI 连接音频和视频